赋权于民:大语言模型如何逆转技术扩散的范式 | karpathy

作者:karpathy | 日期:2025年4月8日

 

变革性的技术通常遵循一种自上而下的扩散路径:起源于政府或军事背景,流向大型企业,最终才触及普通个人——想想电力、密码学、计算机、飞行、互联网或 GPS。这种演进逻辑是符合直觉的:新技术在早期通常是稀缺的、资本密集型的,且其使用需要专业的工程技术。

因此,令我感到极其独特且非凡的是,大语言模型(LLM)展现出了这种模式的剧烈逆转——它们为普通人带来了不成比例的巨大收益,而在企业和政府中的影响却显得平淡且滞后。ChatGPT 是历史上增长最快的消费级应用,每周有 4 亿活跃用户将其用于写作、编程、翻译、辅导、总结、深度研究和头脑风暴等。这不仅仅是对现有工具的小修小补,它是对个人在广泛能力领域上的重大力量乘数

而且,其使用门槛低得令人难以置信——模型廉价(甚至是免费的)、快速,任何人只需通过一个网址(甚至在本地机器上)即可按需获取。它们能说任何人的母语,甚至理解语气、俚语和表情符号。这简直不可思议。据我所知,普通大众从未如此迅速地体验过如此剧烈的技术跨越。

为什么组织机构的受益相对较小?

为什么在企业和政府领域,这种收益反而显得平淡?

  1. 1. 能力分布的特性:LLM 提供的是一种非常特殊的能力画像——即准专家级的知识与表现,但同时跨越了极广的领域。换句话说,它们既全能又浅薄,且具有误导性。相比之下,组织的独特“超能力”是通过雇用工程师、研究员、分析师、律师和营销人员,将多元化的专业知识集中到一个实体中。虽然 LLM 确实能提高这些专家的个体效率(例如起草法律条款、生成样板代码),但对组织的提升仅仅是让它在原本就能做的事情上做得稍微好一点。
    相反,个人通常最多只在一个领域是专家。因此,LLM 提供的广泛准专业知识,从根本上允许他们去做以前做不到的事情。现在,人们可以靠 “氛围感编程”(vibe coding)开发应用,可以看懂法律文件,可以理解深奥的研究论文,可以进行数据分析,还可以生成多模态的品牌营销内容。他们可以在不求助额外专家的情况下,以足够的水平完成所有这些工作。
  2. 2. 复杂性与约束力:组织处理的问题具有更高的复杂性和协同需求,例如:各种系统集成、遗留系统、品牌规范、严格的安全协议、隐私考虑、国际化、合规性及法律风险。这里的变量更多、约束更强、容错率更低。你很难把这一切都塞进一个上下文窗口,你不能只靠“感觉”去写代码。一次灾难性的“幻觉”可能就会让你丢掉饭碗。
  3. 3. 组织的惯性:大型组织存在众所周知的惯性,包括文化、历史先例、在快速变革期激化的政治地盘争夺战、沟通成本、分布式员工的再培训挑战,以及老掉牙的官僚主义。当面对一个崭新的、“全能但浅薄且易出错”的工具时,这些都是巨大的阻力。

我并不想贬低 LLM 在企业或政府中的影响,但至少在目前及整个社会层面,它们对个人生活的改变远比对组织的改变深刻得多。玛丽、吉姆和乔们获得了大部分红利,而不是谷歌或美国政府。

展望未来:这种平衡会持续吗?

展望未来,LLM 的持续扩散当然取决于其性能的持续提升和能力画像。“收益分布”的走势非常值得关注,它很大程度上取决于性能随资本支出变化的动态范围

今天,最前沿的 LLM 性能是非常易得且廉价的。超过这个点,你无法通过多花一美元来获得更好的性能、可靠性或自主性。金钱买不到比 ChatGPT 更强的模型——比尔·盖茨用的 GPT-4o 和你用的一模一样。

但这种情况会持续吗?

  • • 拉大差距的力量:训练规模化(增加参数、数据)、推理时规模化(增加思考时间)和模型集成(增加计算量)都是在扩大动态范围的力量。
  • • 缩小差距的力量:模型蒸馏(通过模仿大模型来训练出极其强大的小模型)则是缩小差距的力量。

当然,一旦金钱能买到显著更强的“ChatGPT”,情况就会改变。大型组织将集中庞大的资源购买更多的智能。而在“个人”范畴内,精英阶层可能再次与社会其他阶层脱离:他们的孩子将由 GPT-8 Pro Max 高端版辅导,而你的孩子用的是 GPT-6 mini。

结论

但至少在此时此刻,我们发现自己正处于技术史上一个独特且前所未有的境遇中。如果你回看各种科幻作品,你会发现很少有人预料到人工智能革命会以这种路径演进。它本应是将军们掌握的顶级机密政府“超级大脑”项目,而不是几乎一夜之间免费出现在每个人口袋里的 ChatGPT。

还记得威廉·吉布森(William Gibson)那句名言吗?

“未来已来,只是分布不均。”

惊喜的是——未来确实已来,而且其分布之均匀令人震惊。赋权于民。就个人而言,我非常喜欢这种现状。

https://karpathy.bearblog.dev/power-to-the-people/

如果觉得内容不错,欢迎你点一下「在看」,或是将文章分享给其他有需要的人^^


相关好文推荐:

软件 2.0 | karpathy

心智的空间 | karpathy

“通用智能根本不存在”?Yann LeCun 与 Demis Hassabis 正面开撕

可验证性 | karpathy

动物 vs 幽灵 | karpathy

2025年 LLM 年度回顾 | karpathy

让 AI 真正拥有“长时记忆”的开端

一次关于未来智能的深度对话

假如科学被做成了自动售卖机

聊一聊OpenAI新发布的Apps SDK
苦涩的教训
特朗普签署AI行动计划,AI全球赛跑加速,中国准备好了吗?
Flux Context Dev:一句话玩转AI修图,免费开源神器!
马斯克Neuralink最新发布会!大脑直接操控电脑,人类正式迈入“意识互联”时代!

0条留言

留言