← 返回

昨天,Andrej Karpathy 发了一条推文。

SomethingAI · 2026年05月20日

昨天,Andrej Karpathy 发了一条推文。

“Personal update: I’ve joined Anthropic.”

没有长文,没有视频,没有播客圆桌。12个词。一小时之内,将近300万次浏览。

评论区瞬间炸了。有人感慨 OpenAI 又失一将,有人分析 Anthropic 的估值又要涨,有人开始盘点 Karpathy 的履历——斯坦福博士、OpenAI 创始成员、Tesla AI 总监、再回 OpenAI、创办 Eureka Labs、现在加入 Anthropic。

但所有人都在聊”他去了哪”,几乎没人问一个更值得问的问题:

Anthropic 让他去做什么?

答案有点出人意料。他不是去当首席科学家,不是去带产品团队,不是去做 CTO。他回到了最底层——预训练。具体来说,他将创建一个新团队,用 Claude 来加速 Claude 自己的预训练。

而且,他不是向 Dario Amodei 汇报,甚至不是直接向管理层汇报。他向 Nicholas Joseph 汇报——Anthropic 的预训练负责人,一个在公众视野中几乎隐形的人。

一个全球最具影响力的 AI 布道师,回到了最枯燥、最底层、最不性感的环节,向一个大多数人没听过名字的人汇报。

这不是一个明星员工的跳槽故事。这是一场精心设计的赌注。


不是”回去”,是”往下扎”

先说 Karpathy 在 OpenAI 最后做的是什么。2023年他回归后,做的是 mid-training 和合成数据生成——模型的中间层,介于预训练和微调之间。

但 Anthropic 给他的不是中间层。是预训练。

如果你不太熟悉大模型训练的流程,简单说一下:预训练是把海量数据喂给模型,让它从零开始理解世界的过程。这是整个链条里最烧钱、最耗时、最工程化、也最不浪漫的环节。没有人因为预训练做得好而上热搜。

而且 Anthropic 的预训练团队已经有 40 多人,由 Nicholas Joseph 带队。Joseph 是 Anthropic 的联合创始人之一,2020年就跟 Dario Amodei 一起从 OpenAI 出来创立公司,从第一天起就负责预训练。这个人在 80,000 Hours 播客里讲训练工程的细节时,你能感受到他每一行代码都是亲手写过的。

Karpathy 加入这个团队,不是空降当领导,是创建一个子团队,聚焦一个具体方向。

所以真正的问题是:一个子团队的具体方向,值得 Anthropic 动用这样的人?

答案藏在 Karpathy 过去两年做的事情里。


一条被所有人忽略的暗线

Karpathy 这两年的公众形象,大概是这样的:

2025年2月,他发明了一个词——vibe coding。意思是”完全顺着感觉走,拥抱指数增长,忘了代码的存在”。他用 Claude 写代码,把过程录下来发到网上,引发了全球程序员的热烈讨论。这个词后来被 Collins 词典评为 2025 年度词汇。

2025年夏天,他创办了 Eureka Labs,一个”AI 原生教育平台”。第一个产品是 LLM101n——一门让 AI 像顶级导师一样教你的课程。

2026年3月,他开源了一个叫 autoresearch 的项目。这个东西的思路是:给 AI agent 一个小型 LLM 训练环境,让它自己跑实验、自己分析结果、自己提出优化方案。他在推文里说:”目标是设计你的 agent,让它在不需要你参与的情况下,以最快速度无限推进研究进程。”

多数人把这些看成三件不相干的事:一个概念、一个创业项目、一个开源实验。

但如果你把它们排成一条线——

vibe coding 的本质是什么?是人在描述意图,AI 来执行。人不再写代码,人变成了”需求方”,AI 变成了”执行方”。

Eureka Labs 的本质是什么?是设计最优的学习体验。AI 像私人导师一样,针对每个人的节奏和风格来教学。

autoresearch 的本质是什么?是让 AI 自己设计实验、自己跑、自己学、自己改进。人对过程的参与降到最低。

看到了吗?

他一直在研究同一件事:怎么让”学习”这件事更高效。 只是学生从人变成了 AI,再变成了 AI 自己。

而预训练——用海量数据教模型从零理解世界——恰好是”学习”这件事在最底层、最大规模、最工程化的形态。

他不是在”转行”。他是在沿着同一条线往下扎到了最深处。


Anthropic 赌的不是一个人,是一个方法论

如果你觉得”用 AI 加速 AI 预训练”听起来像科幻,那 autoresearch 的结果可能会让你重新评估。

Karpathy 自己跑的实验是这样的:给 agent 一个小型模型训练环境,让它自主实验。两天,无人干预。agent 跑了大约 700 次实验,发现了约 20 个优化点。把这些优化应用到更大模型上,训练时间缩短了 11%。

两天。没人盯着。11%。

在大模型训练的世界里,11% 意味着什么?英伟达最新一代芯片的效率提升大概也是这个量级。也就是说,AI 自己跑两天实验找到的优化,相当于换了一代硬件。

这还只是在小型模型上。如果把同样的思路应用到 Anthropic 的全规模预训练——Anthropic 刚刚从 SpaceX/xAI 手里拿到了 Colossus 1 数据中心的全部使用权,22 万张 GPU——每一轮训练节省 11%,省下来的不只是钱,是时间。

而在 AI 竞赛里,时间就是一切。

Anthropic 联合创始人 Jack Clark 今年 5 月初公开预测:到 2028 年底,AI 系统自主完成 AI 研发——包括设计并训练自己的下一代模型——的概率超过 60%。

60%。从最核心的联合创始人嘴里说出来的。

这不是一个预测。这是一个路线图。


人才虹吸:Anthropic 正在构建什么

Karpathy 不是唯一一个。甚至不是最极端的一个。

过去一年里,至少 6 个大公司 CTO 级别的人降级加入 Anthropic 做 IC(Individual Contributor,独立贡献者,不带团队):

Workday 的 CTO。You.com 的 CTO。Instagram 的 CTO。Box 的 CTO。Adept AI 的 CTO。还有更多的VP和资深研究员。

这些人自愿放弃领导职位,接受降薪降级,只为在一个实验室做研究。

在经济学里有个概念叫”显示性偏好”——别听人怎么说,看人怎么做。当一群年薪数百万美元的技术高管甘愿降级来写代码,他们的行动比任何新闻稿都有说服力。

与此同时,OpenAI 的 11 位联合创始人只剩 2 位还在。Meta 用高达 1 亿美元的签约奖金从 OpenAI 挖走了至少 7 名核心研究员。Google Brain 和 DeepMind 合并后的文化冲突导致 Transformer 论文的 8 位作者几乎全部离开。

整个行业的人才正在从一个现象:从”做产品”转向”做基础”

Karpathy 是这个趋势最显眼的符号,但他不是原因。原因是 Anthropic 已经清晰地向所有人展示了一条路线:

谁先用 AI 让 AI 变得更快地变强,谁就赢了。

不是谁的模型现在更强,不是谁的用户更多,不是谁的估值更高。是谁能最快地让”变得更强”这个过程的本身加速。这是一个复利问题,而复利最怕的是起步晚。

Anthropic 当前的 ARR(年化收入)从 15 个月前的 10 亿美元飙升到约 300 亿美元。正在进行的一轮融资估值 9000 亿美元,有望首次超过 OpenAI。这些数字不是因为他们卖得更多,是因为投资人看到了这条路线的可信度。


预训练的天花板,和一扇新门

但这条路并不确定。

整个行业面临一个根本性的问题:数据快用完了

公开互联网上高质量的文本数据已经接近枯竭。Ilya Sutskever——Karpathy 在 OpenAI 时的导师——去年说过一句话:”2010年代是规模化的时代,现在我们回到了惊奇与发现的时代。每个人都在寻找下一个东西。”

合成数据看起来是出路,但早期结果令人失望。OpenAI 的 Orion 模型大量使用合成数据训练,进步幅度相比 GPT-3 到 GPT-4 的跃升大幅缩小。模型变得更像旧模型,而不是突破到新领域。这被称为”模型塌缩”风险——AI 训练 AI 的输出作为输入,可能逐代退化。

这就是 Karpathy 要解决的问题。

不是简单地用 AI 生成数据来喂模型——那条路已经证明走不太通。而是用 AI 来优化训练过程本身:更好的数据配比、更高效的架构搜索、更快的实验迭代。

autoresearch 证明了在小型模型上这条路走得通。现在要把同样的思路放大到 Anthropic 的规模。

这是一个巨大的 if。如果走通了,预训练不再是一个纯工程问题,而是一个可以被 AI 自主优化的系统。AI 不再只是训练的”产物”,而是训练的”设计师”。

如果走不通——如果合成数据的局限在更大规模上依然存在——那 Karpathy 的这个子团队,可能只是 Anthropic 历史上的一个注脚。

但 Anthropic 显然认为值得赌。Karpathy 显然也认为值得赌。


教育和预训练是同一件事

Karpathy 在加入 Anthropic 的声明里有一句话容易被忽略:

“I remain deeply passionate about education and plan to resume my work on it in time.”

多数人把这读成”我以后还会回来做教育的”。但如果理解了他的整条线,这句话有另一层意思。

他提出了一个叫 Software 2.0 的概念:编程的范式从”写代码”转向”提供数据,让神经网络自己学”。在这个框架下,编程不再是告诉机器每一步怎么做,而是设计一个学习环境,让机器自己学会。

这不就是教育吗?

Eureka Labs 做”AI 原生教育”——用 AI 设计最优学习体验,让每个人都能获得顶级导师级别的个性化教学。

预训练做的是——用最优数据管道设计最优训练过程,让模型从零学会理解世界。

两者本质是同一件事:设计最优的”输入”,让”学习者”以最高效的方式习得能力。

只是学习者从人变成了模型,规模从一个教室变成了一个数据中心。

所以 Karpathy 没有放弃教育。他可能发现了:要真正弄懂”学习”这件事是怎么运作的,最好的实验对象不是人——人太慢了,反馈周期太长。而模型可以在两天内跑 700 次实验。

当他解决了”AI 怎么最高效地学习”这个问题,他其实也解决了”人怎么最高效地学习”的理论基础。

这不是转行。这是同一件事在不同尺度上的展开。


为什么是现在

Anthropic 和 Karpathy 的这次联手,时机值得注意。

5月6日,SpaceX/xAI 和 Anthropic 签署协议,Anthropic 获得 Colossus 1 数据中心的全部使用权——22万张 GPU,300兆瓦算力。

5月18日,Musk 起诉 Altman 的诉讼以 Altman 胜诉告终。

5月19日,Karpathy 宣布加入 Anthropic。

两周之内,算力 + 人才,Anthropic 最大的两个短板被同时补上。

而 Karpathy 在3月的时候还说过一句话:”I’m more aligned with humanity outside of a frontier lab”(我在前沿实验室之外更与人类利益一致)。又说 “You can’t be at the frontier if you don’t belong in a frontier lab”(但如果你不在前沿实验室里,你就不可能处于前沿)。

第一句话是理想,第二句话是现实。从3月到5月,他选了现实。

不是因为他背叛了理想。而是因为他想明白了一件事:要推动”学习”这件事的终极理解,你需要站在算力和数据的最前沿。Eureka Labs 很美好,但它没有 22 万张 GPU。

所以他把教育梦暂时收进了口袋,走进了数据中心。


最后一个问题

如果 Karpathy 成功了——如果用 Claude 加速 Claude 预训练这条路真的走通了——会发生什么?

Anthropic 联合创始人 Jack Clark 的预测是:2028年底前,AI 有超过 60% 的概率能自主完成 AI 研发。

如果这变成了现实,Karpathy 在 Anthropic 的工作就不是”让 Claude 变得更好用”。而是帮助开启一个 AI 自己设计 AI、自己训练 AI、自己改进自己的循环。

这个循环一旦启动,就不是线性的了。是复利的。每一轮改进都让下一轮更快。每一轮更快都让下一轮改进更大。

Karpathy 的 autoresearch 已经在小型模型上跑通了这个循环:700 次实验,11% 的提升,无人干预。

放大到 22 万张 GPU 的规模。放大到 Claude 级别的模型。放大到 Anthropic 的工程团队。

这就是为什么一个子团队的方向,值得 Anthropic 动用 Karpathy。

不是因为他有名。是因为他可能是这个世界上,最理解”怎么让一个智能体最高效地学习”的人。而现在他要教的那个智能体,是 Claude。

Karpathy 说”I plan to resume my work on education in time”。

也许,他现在做的一切,就是他一直在做的教育——只是教室从一个叫 Eureka Labs 的公司,变成了一个有 22 万张 GPU 的数据中心。

只是学生从人,变成了一个正在学着自己教自己的模型。

关注 SomethingAI 公众号

每日 AI 趋势日报,深度选题分析,独立开发思考

微信搜索「SomethingAI」关注