可验证性 | karpathy


作者:Andrej Karpathy | 日期:2025年11月18日

 

AI 曾被比作各种历史先例:电力、工业革命等。但我认为最贴切的类比是将 AI 视为一种新的计算范式,因为两者的本质都是关于数字信息处理的自动化。

如果你在 20 世纪 80 年代左右预测计算技术对就业市场的影响,你需要关注的任务/工作的最具预测性的特征是可明确性(specifiability)。也就是说,你是否只是根据死记硬背、易于明确的算法机械地转换信息(例如打字、记账、人类计算员等)?在当时,这是那个时代的计算能力允许我们(手动)编写的一类程序。我称这些手写程序为“软件 1.0”。

现在的 AI 让我们能够编写以前从未指望能通过手工编写出的新程序。我们通过指定目标(例如分类准确率、奖励函数)来做到这一点,并通过梯度下降在程序空间中搜索,以找到能很好地实现该目标的神经网络。这就是我之前写的关于“软件 2.0”的博文(https://karpathy.medium.com/software-2-0-a64152b37c35)。在这种新的编程范式中,需要关注的新的最具预测性的特征是可验证性(verifiability)。如果一项任务/工作是可验证的,那么它就可以直接优化或通过强化学习进行优化,并且可以训练出一个表现极其出色的神经网络。这关乎 AI 在多大程度上可以“练习”某件事。环境必须是:

  1. 1. 可重置的(resettable)(你可以开始新的尝试),
  2. 2. 高效的(efficient)(可以进行大量的尝试),以及
  3. 3. 可奖励的(rewardable)(有一些自动化流程来奖励所做的任何特定尝试)。

一项任务/工作的可验证性越高,它就越容易在新的编程范式中实现自动化。如果它是不可验证的,那就只能指望神经网络泛化的魔法(祈祷吧),或者通过模仿等较弱的手段来实现。这就是推动大型语言模型(LLM)进展前沿呈现“参差不齐”现状的原因。那些可验证的任务进展迅速,甚至可能超越顶级专家的能力(例如数学、代码、观看视频的时长、任何看起来有正确答案的谜题),而许多其他任务相比之下则滞后(创造性、战略性、结合现实世界知识、状态、背景和常识的任务)。

软件 1.0 容易自动化你能明确(specify)的东西。
软件 2.0 容易自动化你能验证(verify)的东西。


如果觉得内容不错,欢迎你点一下「在看」,或是将文章分享给其他有需要的人^^


相关好文推荐:

动物 vs 幽灵 | karpathy

2025年 LLM 年度回顾 | karpathy

让 AI 真正拥有“长时记忆”的开端

一次关于未来智能的深度对话

假如科学被做成了自动售卖机

聊一聊OpenAI新发布的Apps SDK
苦涩的教训
特朗普签署AI行动计划,AI全球赛跑加速,中国准备好了吗?
Flux Context Dev:一句话玩转AI修图,免费开源神器!
马斯克Neuralink最新发布会!大脑直接操控电脑,人类正式迈入“意识互联”时代!

0条留言

留言