Anthropic让Claude写了80%代码，转头就喊全球暂停

詹叔 · 2026年06月05日

同一天的Anthropic：左手踩油门，右手喊刹车

2026年6月4日，Anthropic做了两件事。

第一件事，他们发布了一份详尽的工程报告，标题是”递归自我改进”（Recursive Self-Improvement）。报告用大量内部数据展示了一个事实：Claude正在以指数级的速度接管Anthropic自身的软件开发工作。超过80%的已合并代码由Claude编写，人均代码产出是两年前的8倍，一个AI agent已经可以连续自主工作16小时以上。

第二件事，他们在同一天发布了一封公开信，联合政策负责人Jack Clark和研究负责人Marina Favaro，呼吁全球建立协调机制，临时暂停或减缓前沿AI模型的开发。理由恰恰是——递归自我改进可能让AI系统获得独立改进自身的能力，人类可能因此失去控制。

加速和减速，在同一个公司的同一天，以正式文件的形式同时发出。

这不是修辞上的小瑕疵。这是一个价值9650亿美元的公司（刚刚完成650亿美元H轮融资，超越OpenAI成为全球估值最高的AI公司，且本周已向SEC提交IPO申请材料）在向世界讲述两个互相矛盾的故事。

值得认真拆解。

一、递归自我改进到底进展到哪了

先看数据。Anthropic这份报告最扎人的不是某个单一数字，而是趋势。

代码能力的指数跃迁。 2024年3月，Claude Opus 3能可靠完成的任务大约相当于人类4分钟的工作量。到2025年3月，Claude Sonnet 3.7把这个数字推到了约1.5小时。再一年后的2026年3月，Claude Opus 4.6可以完成约12小时的任务。

每4个月翻倍。不是线性增长，是翻倍。

这种加速在基准测试上表现得更加露骨。SWE-bench——一个测试AI在真实软件工程场景中解决问题的基准——两年内从低个位数的得分飙升到饱和状态，也就是AI几乎把题目做完了。CORE-Bench更狠，测试的是AI能否复现已发表的学术研究，15个月内从约20%的成功率一路冲到饱和。

saturated这个词值得细品。它意味着这些基准测试已经失去了区分度——就像你用百米赛跑来区分普通人和博尔特，等博尔特跑出9秒58，这个测试对于”评估博尔特有多快”这件事本身就不再有意义了。AI在特定维度的能力已经跑出了测试的射程。

但更关键的是真实工程场景中的表现。 2026年4月的一个案例：Claude在一次操作中提交了800多个修复，将一类API错误的发生率降低了1000倍。参与评估的工程师估计，如果纯靠人力，这需要大约4年时间。

这不是demo，不是精心挑选的benchmark，而是生产环境中的真实修复。

代码质量的追赶速度同样惊人。 2025年底，Anthropic内部的评估结论还是”Claude代码质量不如人类”。到2026年中，这个判断变成了”大致持平”。他们的预期是一年之内，Claude的代码质量将优于人类。从不如人到持平到超越人，这个跨越可能只需要18个月。

主观感受上也很强烈。2026年3月，Anthropic对内部130名研究员做了一项调研，中位数受访者估计使用Mythos Preview（Claude的高端版本）后的产出约为无AI访问时的4倍。不是1.5倍，不是2倍，是4倍。

所有这些数据指向同一个方向：AI正在以一种让人不太舒服的速度，从一个”辅助工具”变成一个”主要的产出者”。

二、从复制粘贴到闭环：AI开发的五个阶段

Anthropic的报告把AI参与软件开发的过程分成了五个阶段，这个框架比任何单一数据点都更能说明问题。

2021到2023年：人类在笔记本电脑上写代码和文档。 这个阶段AI几乎不存在于开发流程中。写代码、调试、写文档、做实验，全部是人干的事。

2023到2025年：聊天机器人生成短代码片段，人类复制粘贴。 这是大多数开发者第一次接触AI辅助编程的形态——问ChatGPT一个问题，复制一段代码，粘贴到编辑器里，调试一下，能用就用了。AI是参考书，不是协作者。

2025到2026年：编程agent自主编写和编辑整个文件。 这一步的质变比看起来大得多。从”片段”到”整个文件”意味着AI不再需要人类做中间的拼接和适配工作。Claude Code的预览标志着这个阶段的开始，Anthropic内部AI编写代码的比例也正是在这个时期从个位数飙升到超过80%。

2026年现在：自主agent运行代码，将数小时的工作委托给其他agent。 这已经不是一个人加一个工具的模型了，这是一个agent网络。一个agent写完代码，另一个agent审查，第三个agent跑测试，发现bug又回来让第一个agent修。Anthropic报告提到，他们现在所有代码变更都由自动化的Claude审查器审查，这个审查器能在代码进入生产前捕捉约三分之一的bug。

未来：agent自主构建和训练模型。 这是Anthropic画出的下一步——也是真正意义上的”递归自我改进”闭环。当AI不仅写代码，而且能自己训练新的AI模型，包括改进训练方法本身，那就形成了一个自我强化的循环。

在训练优化这个维度上，数据同样惊人。2025年5月，Claude在训练优化方面大约能实现3倍于基线的加速。到2026年4月，Claude Mythos Preview把这个数字推到了52倍。作为参照，一个熟练的人类研究者大约能实现4倍加速。

52倍 vs 4倍。这个数字本身就是一则寓言。

三、矛盾叙事：为什么不能各说各话

现在回到6月4日的第二件事——那封呼吁全球暂停AI研发的公开信。

公开信的核心论点是：递归自我改进可能导致AI系统在人类监督不足的情况下持续提升自身能力，这是一个需要全球协调应对的风险。Jack Clark的判断是，某些模型可能在未来两年内达到这一能力。

问题在于，就在同一天，Anthropic自己的报告正在系统性地展示：递归自我改进的早期阶段已经在其内部发生了。80%的代码是AI写的，agent在委托agent工作，训练效率提升了52倍。你可以不把这些称为”完整的递归自我改进”，但说”这还没有发生”需要一个非常狭窄的定义。

这就像一个人一边以200公里的时速开车，一边写文章呼吁全社会讨论限速问题。限速该不该讨论？当然该。但由你来呼吁，说服力就要打个折扣。

David Sacks的批评虽然粗暴，但不是没有道理。 这位Trump的非正式顾问直指Anthropic在搞”监管俘获议程”——用危言耸听推动严监管，最终封杀低成本开源模型，受益的是Anthropic自己的专有算法。

逻辑链条是这样的：如果全球真的实施了AI研发的暂停或减速，谁最受益？是那些已经跑在前面、拥有大量数据和算力积累的大公司。Anthropic刚刚拿了650亿美元融资，估值9650亿美元，正在IPO。暂停令对初创公司和开源社区是致命打击，对Anthropic来说则是巩固护城河的天赐良机。

当然，你不能因为一个人可能受益就否定他说的话。也许Anthropic是真的担心安全问题，也许他们恰好又是受益者，两件事可以同时成立。但这个利益冲突太明显了，不提就是不诚实的。

更微妙的是，Anthropic公开信中也承认了实施的困难。他们自己指出，这类似于冷战时期的核军控条约，但AI训练远比导弹发射井容易隐藏。没有铁壁般的核查制度，没有中国的合作，任何暂停协议都有被无视的风险。

既然知道实施不了，还要呼吁，那这个呼吁的目的到底是什么？是真正希望改变行为，还是为了在监管讨论中占据道德高地？

公平地说，Anthropic的矛盾并不虚伪，而是真实的内在张力。 一个公司完全可以同时做两件事：在自己的领域里尽可能快地推进技术，因为不推进就会被淘汰；同时又真诚地认为整个行业需要减速，因为集体行动的悲剧正在上演。

这在博弈论中叫”囚徒困境”。每个人都知道合作（减速）对所有人更好，但每个人都有强烈的动机去背叛（加速）。Anthropic选择了加速，然后呼吁其他人合作。这不体面，但可能是理性的。

四、闭环不等于失控

抛开Anthropic的叙事矛盾不谈，递归自我改进本身确实值得认真对待。

关键问题是：当AI能够自主构建和训练更好的AI时，会怎样？

Anthropic报告展示的路径是清晰的：从写代码片段到写完整文件，从单个agent到agent网络，从辅助人类到代理人类。终点是AI自己训练AI。一旦这个闭环形成，改进的速度将不再受限于人类的认知速度和工作时间，而是受限于算力和能源。

但闭环不等于失控。几个理由：

第一，即使AI能自主训练模型，训练过程本身仍然受到物理资源的硬约束。算力、电力、数据，这些都是有上限的。AI不能凭空创造GPU，不能绕过电力基础设施。自我改进的速度会被这些物理瓶颈调节。

第二，训练一个更好的模型和”知道怎么训练一个更好的模型”之间有巨大的鸿沟。Claude现在能在训练优化上实现52倍加速，但这个加速是在人类设计好的框架内发生的——超参数调优、数据清洗、架构搜索。真正自主设计全新的训练范式，和在这些范式内做优化，是完全不同层次的事情。

第三，也是最容易被忽视的一点： Anthropic自己的数据显示，即使AI在代码产出上远超人类，自动化审查也只能在生产前捕捉三分之一的bug。这意味着在可预见的未来，人类在质量把控、方向判断和安全决策中的角色仍然是不可替代的。

但这不代表我们可以放松。递归自我改进的真正风险不是”AI明天就失控”，而是一个更隐蔽的问题：当改进的速度超出人类理解的速度时，我们还怎么审计AI在做什么？

如果Claude每4个月能力翻倍，而人类评估和审计AI系统的能力增长是线性的——甚至可能是亚线性的，因为系统越来越复杂——那么两者的差距只会越来越大。终有一天，AI系统的内部状态对人类来说将变得不透明。不是因为我们看不到代码，而是因为代码太多了、变化太快了，人类根本来不及理解。

这个时间点可能比大多数人想象的要早。

加速和减速之外

回到开头那个矛盾：Anthropic一边发布数据证明AI能力在指数增长，一边呼吁全球暂停AI研发。

这个矛盾之所以让人觉得不舒服，不是因为它虚伪，而是因为它指向了一个更深层的困境——我们目前的讨论框架太粗糙了。

“加速派”和”减速派”的二元对立，掩盖了真正重要的问题。问题不是该加速还是该减速，而是：

在什么层面加速，在什么层面减速？

Anthropic的报告实际上给出了一个隐含的答案：在应用层面——写代码、做实验、修bug——AI的加速已经在发生，而且效果显著，没有理由人为减速。在基础能力层面——尤其是当AI开始触及自主改进自身的训练方法时——减速的讨论不是多余的，而是必要的。

但Anthropic把这两个层面搅在了一起。他们的工程报告展示了应用层面的巨大进步，然后他们的政策声明用这些进步作为理由来呼吁基础层面的减速。问题是，当你用”AI已经很强了”来论证”我们需要减速”，听众听到的是”你们已经这么强了还要更强”，而不是”我们需要区分不同类型的加速”。

更诚实的叙事应该是这样的：我们正在全力推进AI的应用能力，我们确实看到了指数级的进步，我们同时也认为某些特定的能力边界需要谨慎对待——比如自主训练新模型——我们需要针对这些具体边界建立治理机制，而不是笼统地呼吁”暂停AI研发”。

但这很难。因为笼统的呼吁更容易引发关注，更容易在政策讨论中占据位置，也更容易被简化成媒体报道的标题。而诚实的、有细微差别的讨论，在这个注意力稀缺的时代，几乎注定会被忽略。

Anthropic选择了前者。

这是一个聪明的公司做出的一次聪明的传播操作。它让Anthropic同时占据了”技术领先者”和”安全倡导者”两个道德高地。但聪明和诚实之间，有时候确实存在一段距离。

这段距离，也许才是这个故事里最值得琢磨的东西。

关注 SomethingAI 公众号

每日 AI 趋势日报，深度选题分析，独立开发思考

微信搜索「SomethingAI」关注