欣朵的日志

可验证性 | karpathy

作者：Andrej Karpathy | 日期：2025年11月18日

AI 曾被比作各种历史先例：电力、工业革命等。但我认为最贴切的类比是将 AI 视为一种新的计算范式，因为两者的本质都是关于数字信息处理的自动化。

如果你在 20 世纪 80 年代左右预测计算技术对就业市场的影响，你需要关注的任务/工作的最具预测性的特征是可明确性（specifiability）。也就是说，你是否只是根据死记硬背、易于明确的算法机械地转换信息（例如打字、记账、人类计算员等）？在当时，这是那个时代的计算能力允许我们（手动）编写的一类程序。我称这些手写程序为“软件 1.0”。

现在的 AI 让我们能够编写以前从未指望能通过手工编写出的新程序。我们通过指定目标（例如分类准确率、奖励函数）来做到这一点，并通过梯度下降在程序空间中搜索，以找到能很好地实现该目标的神经网络。这就是我之前写的关于“软件 2.0”的博文（https://karpathy.medium.com/software-2-0-a64152b37c35）。在这种新的编程范式中，需要关注的新的最具预测性的特征是可验证性（verifiability）。如果一项任务/工作是可验证的，那么它就可以直接优化或通过强化学习进行优化，并且可以训练出一个表现极其出色的神经网络。这关乎 AI 在多大程度上可以“练习”某件事。环境必须是：

1. 可重置的（resettable）（你可以开始新的尝试），
2. 高效的（efficient）（可以进行大量的尝试），以及
3. 可奖励的（rewardable）（有一些自动化流程来奖励所做的任何特定尝试）。

一项任务/工作的可验证性越高，它就越容易在新的编程范式中实现自动化。如果它是不可验证的，那就只能指望神经网络泛化的魔法（祈祷吧），或者通过模仿等较弱的手段来实现。这就是推动大型语言模型（LLM）进展前沿呈现“参差不齐”现状的原因。那些可验证的任务进展迅速，甚至可能超越顶级专家的能力（例如数学、代码、观看视频的时长、任何看起来有正确答案的谜题），而许多其他任务相比之下则滞后（创造性、战略性、结合现实世界知识、状态、背景和常识的任务）。

软件 1.0 容易自动化你能明确（specify）的东西。
软件 2.0 容易自动化你能验证（verify）的东西。

如果觉得内容不错，欢迎你点一下「在看」，或是将文章分享给其他有需要的人^^

相关好文推荐：

动物 vs 幽灵 | karpathy

2025年 LLM 年度回顾 | karpathy

让 AI 真正拥有“长时记忆”的开端

一次关于未来智能的深度对话

假如科学被做成了自动售卖机

聊一聊OpenAI新发布的Apps SDK

苦涩的教训

特朗普签署AI行动计划，AI全球赛跑加速，中国准备好了吗？

Flux Context Dev：一句话玩转AI修图，免费开源神器！