昨天，Andrej Karpathy 发了一条推文。

詹叔 · 2026年05月20日

“Personal update: I’ve joined Anthropic.”

没有长文，没有视频，没有播客圆桌。12个词。一小时之内，将近300万次浏览。

评论区瞬间炸了。有人感慨 OpenAI 又失一将，有人分析 Anthropic 的估值又要涨，有人开始盘点 Karpathy 的履历——斯坦福博士、OpenAI 创始成员、Tesla AI 总监、再回 OpenAI、创办 Eureka Labs、现在加入 Anthropic。

但所有人都在聊”他去了哪”，几乎没人问一个更值得问的问题：

Anthropic 让他去做什么？

答案有点出人意料。他不是去当首席科学家，不是去带产品团队，不是去做 CTO。他回到了最底层——预训练。具体来说，他将创建一个新团队，用 Claude 来加速 Claude 自己的预训练。

而且，他不是向 Dario Amodei 汇报，甚至不是直接向管理层汇报。他向 Nicholas Joseph 汇报——Anthropic 的预训练负责人，一个在公众视野中几乎隐形的人。

一个全球最具影响力的 AI 布道师，回到了最枯燥、最底层、最不性感的环节，向一个大多数人没听过名字的人汇报。

这不是一个明星员工的跳槽故事。这是一场精心设计的赌注。

不是”回去”，是”往下扎”

先说 Karpathy 在 OpenAI 最后做的是什么。2023年他回归后，做的是 mid-training 和合成数据生成——模型的中间层，介于预训练和微调之间。

但 Anthropic 给他的不是中间层。是预训练。

如果你不太熟悉大模型训练的流程，简单说一下：预训练是把海量数据喂给模型，让它从零开始理解世界的过程。这是整个链条里最烧钱、最耗时、最工程化、也最不浪漫的环节。没有人因为预训练做得好而上热搜。

而且 Anthropic 的预训练团队已经有 40 多人，由 Nicholas Joseph 带队。Joseph 是 Anthropic 的联合创始人之一，2020年就跟 Dario Amodei 一起从 OpenAI 出来创立公司，从第一天起就负责预训练。这个人在 80,000 Hours 播客里讲训练工程的细节时，你能感受到他每一行代码都是亲手写过的。

Karpathy 加入这个团队，不是空降当领导，是创建一个子团队，聚焦一个具体方向。

所以真正的问题是：一个子团队的具体方向，值得 Anthropic 动用这样的人？

答案藏在 Karpathy 过去两年做的事情里。

一条被所有人忽略的暗线

Karpathy 这两年的公众形象，大概是这样的：

2025年2月，他发明了一个词——vibe coding。意思是”完全顺着感觉走，拥抱指数增长，忘了代码的存在”。他用 Claude 写代码，把过程录下来发到网上，引发了全球程序员的热烈讨论。这个词后来被 Collins 词典评为 2025 年度词汇。

2025年夏天，他创办了 Eureka Labs，一个”AI 原生教育平台”。第一个产品是 LLM101n——一门让 AI 像顶级导师一样教你的课程。

2026年3月，他开源了一个叫 autoresearch 的项目。这个东西的思路是：给 AI agent 一个小型 LLM 训练环境，让它自己跑实验、自己分析结果、自己提出优化方案。他在推文里说：”目标是设计你的 agent，让它在不需要你参与的情况下，以最快速度无限推进研究进程。”

多数人把这些看成三件不相干的事：一个概念、一个创业项目、一个开源实验。

但如果你把它们排成一条线——

vibe coding 的本质是什么？是人在描述意图，AI 来执行。人不再写代码，人变成了”需求方”，AI 变成了”执行方”。

Eureka Labs 的本质是什么？是设计最优的学习体验。AI 像私人导师一样，针对每个人的节奏和风格来教学。

autoresearch 的本质是什么？是让 AI 自己设计实验、自己跑、自己学、自己改进。人对过程的参与降到最低。

看到了吗？

他一直在研究同一件事：怎么让”学习”这件事更高效。 只是学生从人变成了 AI，再变成了 AI 自己。

而预训练——用海量数据教模型从零理解世界——恰好是”学习”这件事在最底层、最大规模、最工程化的形态。

他不是在”转行”。他是在沿着同一条线往下扎到了最深处。

Anthropic 赌的不是一个人，是一个方法论

如果你觉得”用 AI 加速 AI 预训练”听起来像科幻，那 autoresearch 的结果可能会让你重新评估。

Karpathy 自己跑的实验是这样的：给 agent 一个小型模型训练环境，让它自主实验。两天，无人干预。agent 跑了大约 700 次实验，发现了约 20 个优化点。把这些优化应用到更大模型上，训练时间缩短了 11%。

两天。没人盯着。11%。

在大模型训练的世界里，11% 意味着什么？英伟达最新一代芯片的效率提升大概也是这个量级。也就是说，AI 自己跑两天实验找到的优化，相当于换了一代硬件。

这还只是在小型模型上。如果把同样的思路应用到 Anthropic 的全规模预训练——Anthropic 刚刚从 SpaceX/xAI 手里拿到了 Colossus 1 数据中心的全部使用权，22 万张 GPU——每一轮训练节省 11%，省下来的不只是钱，是时间。

而在 AI 竞赛里，时间就是一切。

Anthropic 联合创始人 Jack Clark 今年 5 月初公开预测：到 2028 年底，AI 系统自主完成 AI 研发——包括设计并训练自己的下一代模型——的概率超过 60%。

60%。从最核心的联合创始人嘴里说出来的。

这不是一个预测。这是一个路线图。

人才虹吸：Anthropic 正在构建什么

Karpathy 不是唯一一个。甚至不是最极端的一个。

过去一年里，至少 6 个大公司 CTO 级别的人降级加入 Anthropic 做 IC（Individual Contributor，独立贡献者，不带团队）：

Workday 的 CTO。You.com 的 CTO。Instagram 的 CTO。Box 的 CTO。Adept AI 的 CTO。还有更多的VP和资深研究员。

这些人自愿放弃领导职位，接受降薪降级，只为在一个实验室做研究。

在经济学里有个概念叫”显示性偏好”——别听人怎么说，看人怎么做。当一群年薪数百万美元的技术高管甘愿降级来写代码，他们的行动比任何新闻稿都有说服力。

与此同时，OpenAI 的 11 位联合创始人只剩 2 位还在。Meta 用高达 1 亿美元的签约奖金从 OpenAI 挖走了至少 7 名核心研究员。Google Brain 和 DeepMind 合并后的文化冲突导致 Transformer 论文的 8 位作者几乎全部离开。

整个行业的人才正在从一个现象：从”做产品”转向”做基础”。

Karpathy 是这个趋势最显眼的符号，但他不是原因。原因是 Anthropic 已经清晰地向所有人展示了一条路线：

谁先用 AI 让 AI 变得更快地变强，谁就赢了。

不是谁的模型现在更强，不是谁的用户更多，不是谁的估值更高。是谁能最快地让”变得更强”这个过程的本身加速。这是一个复利问题，而复利最怕的是起步晚。

Anthropic 当前的 ARR（年化收入）从 15 个月前的 10 亿美元飙升到约 300 亿美元。正在进行的一轮融资估值 9000 亿美元，有望首次超过 OpenAI。这些数字不是因为他们卖得更多，是因为投资人看到了这条路线的可信度。

预训练的天花板，和一扇新门

但这条路并不确定。

整个行业面临一个根本性的问题：数据快用完了。

公开互联网上高质量的文本数据已经接近枯竭。Ilya Sutskever——Karpathy 在 OpenAI 时的导师——去年说过一句话：”2010年代是规模化的时代，现在我们回到了惊奇与发现的时代。每个人都在寻找下一个东西。”

合成数据看起来是出路，但早期结果令人失望。OpenAI 的 Orion 模型大量使用合成数据训练，进步幅度相比 GPT-3 到 GPT-4 的跃升大幅缩小。模型变得更像旧模型，而不是突破到新领域。这被称为”模型塌缩”风险——AI 训练 AI 的输出作为输入，可能逐代退化。

这就是 Karpathy 要解决的问题。

不是简单地用 AI 生成数据来喂模型——那条路已经证明走不太通。而是用 AI 来优化训练过程本身：更好的数据配比、更高效的架构搜索、更快的实验迭代。

autoresearch 证明了在小型模型上这条路走得通。现在要把同样的思路放大到 Anthropic 的规模。

这是一个巨大的 if。如果走通了，预训练不再是一个纯工程问题，而是一个可以被 AI 自主优化的系统。AI 不再只是训练的”产物”，而是训练的”设计师”。

如果走不通——如果合成数据的局限在更大规模上依然存在——那 Karpathy 的这个子团队，可能只是 Anthropic 历史上的一个注脚。

但 Anthropic 显然认为值得赌。Karpathy 显然也认为值得赌。

教育和预训练是同一件事

Karpathy 在加入 Anthropic 的声明里有一句话容易被忽略：

“I remain deeply passionate about education and plan to resume my work on it in time.”

多数人把这读成”我以后还会回来做教育的”。但如果理解了他的整条线，这句话有另一层意思。

他提出了一个叫 Software 2.0 的概念：编程的范式从”写代码”转向”提供数据，让神经网络自己学”。在这个框架下，编程不再是告诉机器每一步怎么做，而是设计一个学习环境，让机器自己学会。

这不就是教育吗？

Eureka Labs 做”AI 原生教育”——用 AI 设计最优学习体验，让每个人都能获得顶级导师级别的个性化教学。

预训练做的是——用最优数据管道设计最优训练过程，让模型从零学会理解世界。

两者本质是同一件事：设计最优的”输入”，让”学习者”以最高效的方式习得能力。

只是学习者从人变成了模型，规模从一个教室变成了一个数据中心。

所以 Karpathy 没有放弃教育。他可能发现了：要真正弄懂”学习”这件事是怎么运作的，最好的实验对象不是人——人太慢了，反馈周期太长。而模型可以在两天内跑 700 次实验。

当他解决了”AI 怎么最高效地学习”这个问题，他其实也解决了”人怎么最高效地学习”的理论基础。

这不是转行。这是同一件事在不同尺度上的展开。

为什么是现在

Anthropic 和 Karpathy 的这次联手，时机值得注意。

5月6日，SpaceX/xAI 和 Anthropic 签署协议，Anthropic 获得 Colossus 1 数据中心的全部使用权——22万张 GPU，300兆瓦算力。

5月18日，Musk 起诉 Altman 的诉讼以 Altman 胜诉告终。

5月19日，Karpathy 宣布加入 Anthropic。

两周之内，算力 + 人才，Anthropic 最大的两个短板被同时补上。

而 Karpathy 在3月的时候还说过一句话：”I’m more aligned with humanity outside of a frontier lab”（我在前沿实验室之外更与人类利益一致）。又说 “You can’t be at the frontier if you don’t belong in a frontier lab”（但如果你不在前沿实验室里，你就不可能处于前沿）。

第一句话是理想，第二句话是现实。从3月到5月，他选了现实。

不是因为他背叛了理想。而是因为他想明白了一件事：要推动”学习”这件事的终极理解，你需要站在算力和数据的最前沿。Eureka Labs 很美好，但它没有 22 万张 GPU。

所以他把教育梦暂时收进了口袋，走进了数据中心。

最后一个问题

如果 Karpathy 成功了——如果用 Claude 加速 Claude 预训练这条路真的走通了——会发生什么？

Anthropic 联合创始人 Jack Clark 的预测是：2028年底前，AI 有超过 60% 的概率能自主完成 AI 研发。

如果这变成了现实，Karpathy 在 Anthropic 的工作就不是”让 Claude 变得更好用”。而是帮助开启一个 AI 自己设计 AI、自己训练 AI、自己改进自己的循环。

这个循环一旦启动，就不是线性的了。是复利的。每一轮改进都让下一轮更快。每一轮更快都让下一轮改进更大。

Karpathy 的 autoresearch 已经在小型模型上跑通了这个循环：700 次实验，11% 的提升，无人干预。

放大到 22 万张 GPU 的规模。放大到 Claude 级别的模型。放大到 Anthropic 的工程团队。

这就是为什么一个子团队的方向，值得 Anthropic 动用 Karpathy。

不是因为他有名。是因为他可能是这个世界上，最理解”怎么让一个智能体最高效地学习”的人。而现在他要教的那个智能体，是 Claude。

Karpathy 说”I plan to resume my work on education in time”。

也许，他现在做的一切，就是他一直在做的教育——只是教室从一个叫 Eureka Labs 的公司，变成了一个有 22 万张 GPU 的数据中心。

只是学生从人，变成了一个正在学着自己教自己的模型。

关注 SomethingAI 公众号

每日 AI 趋势日报，深度选题分析，独立开发思考

微信搜索「SomethingAI」关注