2026年6月4日,Anthropic做了两件事。
第一件事,他们发布了一份详尽的工程报告,标题是”递归自我改进”(Recursive Self-Improvement)。报告用大量内部数据展示了一个事实:Claude正在以指数级的速度接管Anthropic自身的软件开发工作。超过80%的已合并代码由Claude编写,人均代码产出是两年前的8倍,一个AI agent已经可以连续自主工作16小时以上。
第二件事,他们在同一天发布了一封公开信,联合政策负责人Jack Clark和研究负责人Marina Favaro,呼吁全球建立协调机制,临时暂停或减缓前沿AI模型的开发。理由恰恰是——递归自我改进可能让AI系统获得独立改进自身的能力,人类可能因此失去控制。
加速和减速,在同一个公司的同一天,以正式文件的形式同时发出。
这不是修辞上的小瑕疵。这是一个价值9650亿美元的公司(刚刚完成650亿美元H轮融资,超越OpenAI成为全球估值最高的AI公司,且本周已向SEC提交IPO申请材料)在向世界讲述两个互相矛盾的故事。
值得认真拆解。
先看数据。Anthropic这份报告最扎人的不是某个单一数字,而是趋势。
代码能力的指数跃迁。 2024年3月,Claude Opus 3能可靠完成的任务大约相当于人类4分钟的工作量。到2025年3月,Claude Sonnet 3.7把这个数字推到了约1.5小时。再一年后的2026年3月,Claude Opus 4.6可以完成约12小时的任务。
每4个月翻倍。不是线性增长,是翻倍。
这种加速在基准测试上表现得更加露骨。SWE-bench——一个测试AI在真实软件工程场景中解决问题的基准——两年内从低个位数的得分飙升到饱和状态,也就是AI几乎把题目做完了。CORE-Bench更狠,测试的是AI能否复现已发表的学术研究,15个月内从约20%的成功率一路冲到饱和。
saturated这个词值得细品。它意味着这些基准测试已经失去了区分度——就像你用百米赛跑来区分普通人和博尔特,等博尔特跑出9秒58,这个测试对于”评估博尔特有多快”这件事本身就不再有意义了。AI在特定维度的能力已经跑出了测试的射程。
但更关键的是真实工程场景中的表现。 2026年4月的一个案例:Claude在一次操作中提交了800多个修复,将一类API错误的发生率降低了1000倍。参与评估的工程师估计,如果纯靠人力,这需要大约4年时间。
这不是demo,不是精心挑选的benchmark,而是生产环境中的真实修复。
代码质量的追赶速度同样惊人。 2025年底,Anthropic内部的评估结论还是”Claude代码质量不如人类”。到2026年中,这个判断变成了”大致持平”。他们的预期是一年之内,Claude的代码质量将优于人类。从不如人到持平到超越人,这个跨越可能只需要18个月。
主观感受上也很强烈。2026年3月,Anthropic对内部130名研究员做了一项调研,中位数受访者估计使用Mythos Preview(Claude的高端版本)后的产出约为无AI访问时的4倍。不是1.5倍,不是2倍,是4倍。
所有这些数据指向同一个方向:AI正在以一种让人不太舒服的速度,从一个”辅助工具”变成一个”主要的产出者”。
Anthropic的报告把AI参与软件开发的过程分成了五个阶段,这个框架比任何单一数据点都更能说明问题。
2021到2023年:人类在笔记本电脑上写代码和文档。 这个阶段AI几乎不存在于开发流程中。写代码、调试、写文档、做实验,全部是人干的事。
2023到2025年:聊天机器人生成短代码片段,人类复制粘贴。 这是大多数开发者第一次接触AI辅助编程的形态——问ChatGPT一个问题,复制一段代码,粘贴到编辑器里,调试一下,能用就用了。AI是参考书,不是协作者。
2025到2026年:编程agent自主编写和编辑整个文件。 这一步的质变比看起来大得多。从”片段”到”整个文件”意味着AI不再需要人类做中间的拼接和适配工作。Claude Code的预览标志着这个阶段的开始,Anthropic内部AI编写代码的比例也正是在这个时期从个位数飙升到超过80%。
2026年现在:自主agent运行代码,将数小时的工作委托给其他agent。 这已经不是一个人加一个工具的模型了,这是一个agent网络。一个agent写完代码,另一个agent审查,第三个agent跑测试,发现bug又回来让第一个agent修。Anthropic报告提到,他们现在所有代码变更都由自动化的Claude审查器审查,这个审查器能在代码进入生产前捕捉约三分之一的bug。
未来:agent自主构建和训练模型。 这是Anthropic画出的下一步——也是真正意义上的”递归自我改进”闭环。当AI不仅写代码,而且能自己训练新的AI模型,包括改进训练方法本身,那就形成了一个自我强化的循环。
在训练优化这个维度上,数据同样惊人。2025年5月,Claude在训练优化方面大约能实现3倍于基线的加速。到2026年4月,Claude Mythos Preview把这个数字推到了52倍。作为参照,一个熟练的人类研究者大约能实现4倍加速。
52倍 vs 4倍。这个数字本身就是一则寓言。
现在回到6月4日的第二件事——那封呼吁全球暂停AI研发的公开信。
公开信的核心论点是:递归自我改进可能导致AI系统在人类监督不足的情况下持续提升自身能力,这是一个需要全球协调应对的风险。Jack Clark的判断是,某些模型可能在未来两年内达到这一能力。
问题在于,就在同一天,Anthropic自己的报告正在系统性地展示:递归自我改进的早期阶段已经在其内部发生了。80%的代码是AI写的,agent在委托agent工作,训练效率提升了52倍。你可以不把这些称为”完整的递归自我改进”,但说”这还没有发生”需要一个非常狭窄的定义。
这就像一个人一边以200公里的时速开车,一边写文章呼吁全社会讨论限速问题。限速该不该讨论?当然该。但由你来呼吁,说服力就要打个折扣。
David Sacks的批评虽然粗暴,但不是没有道理。 这位Trump的非正式顾问直指Anthropic在搞”监管俘获议程”——用危言耸听推动严监管,最终封杀低成本开源模型,受益的是Anthropic自己的专有算法。
逻辑链条是这样的:如果全球真的实施了AI研发的暂停或减速,谁最受益?是那些已经跑在前面、拥有大量数据和算力积累的大公司。Anthropic刚刚拿了650亿美元融资,估值9650亿美元,正在IPO。暂停令对初创公司和开源社区是致命打击,对Anthropic来说则是巩固护城河的天赐良机。
当然,你不能因为一个人可能受益就否定他说的话。也许Anthropic是真的担心安全问题,也许他们恰好又是受益者,两件事可以同时成立。但这个利益冲突太明显了,不提就是不诚实的。
更微妙的是,Anthropic公开信中也承认了实施的困难。他们自己指出,这类似于冷战时期的核军控条约,但AI训练远比导弹发射井容易隐藏。没有铁壁般的核查制度,没有中国的合作,任何暂停协议都有被无视的风险。
既然知道实施不了,还要呼吁,那这个呼吁的目的到底是什么?是真正希望改变行为,还是为了在监管讨论中占据道德高地?
公平地说,Anthropic的矛盾并不虚伪,而是真实的内在张力。 一个公司完全可以同时做两件事:在自己的领域里尽可能快地推进技术,因为不推进就会被淘汰;同时又真诚地认为整个行业需要减速,因为集体行动的悲剧正在上演。
这在博弈论中叫”囚徒困境”。每个人都知道合作(减速)对所有人更好,但每个人都有强烈的动机去背叛(加速)。Anthropic选择了加速,然后呼吁其他人合作。这不体面,但可能是理性的。
抛开Anthropic的叙事矛盾不谈,递归自我改进本身确实值得认真对待。
关键问题是:当AI能够自主构建和训练更好的AI时,会怎样?
Anthropic报告展示的路径是清晰的:从写代码片段到写完整文件,从单个agent到agent网络,从辅助人类到代理人类。终点是AI自己训练AI。一旦这个闭环形成,改进的速度将不再受限于人类的认知速度和工作时间,而是受限于算力和能源。
但闭环不等于失控。几个理由:
第一,即使AI能自主训练模型,训练过程本身仍然受到物理资源的硬约束。算力、电力、数据,这些都是有上限的。AI不能凭空创造GPU,不能绕过电力基础设施。自我改进的速度会被这些物理瓶颈调节。
第二,训练一个更好的模型和”知道怎么训练一个更好的模型”之间有巨大的鸿沟。Claude现在能在训练优化上实现52倍加速,但这个加速是在人类设计好的框架内发生的——超参数调优、数据清洗、架构搜索。真正自主设计全新的训练范式,和在这些范式内做优化,是完全不同层次的事情。
第三,也是最容易被忽视的一点: Anthropic自己的数据显示,即使AI在代码产出上远超人类,自动化审查也只能在生产前捕捉三分之一的bug。这意味着在可预见的未来,人类在质量把控、方向判断和安全决策中的角色仍然是不可替代的。
但这不代表我们可以放松。递归自我改进的真正风险不是”AI明天就失控”,而是一个更隐蔽的问题:当改进的速度超出人类理解的速度时,我们还怎么审计AI在做什么?
如果Claude每4个月能力翻倍,而人类评估和审计AI系统的能力增长是线性的——甚至可能是亚线性的,因为系统越来越复杂——那么两者的差距只会越来越大。终有一天,AI系统的内部状态对人类来说将变得不透明。不是因为我们看不到代码,而是因为代码太多了、变化太快了,人类根本来不及理解。
这个时间点可能比大多数人想象的要早。
回到开头那个矛盾:Anthropic一边发布数据证明AI能力在指数增长,一边呼吁全球暂停AI研发。
这个矛盾之所以让人觉得不舒服,不是因为它虚伪,而是因为它指向了一个更深层的困境——我们目前的讨论框架太粗糙了。
“加速派”和”减速派”的二元对立,掩盖了真正重要的问题。问题不是该加速还是该减速,而是:
在什么层面加速,在什么层面减速?
Anthropic的报告实际上给出了一个隐含的答案:在应用层面——写代码、做实验、修bug——AI的加速已经在发生,而且效果显著,没有理由人为减速。在基础能力层面——尤其是当AI开始触及自主改进自身的训练方法时——减速的讨论不是多余的,而是必要的。
但Anthropic把这两个层面搅在了一起。他们的工程报告展示了应用层面的巨大进步,然后他们的政策声明用这些进步作为理由来呼吁基础层面的减速。问题是,当你用”AI已经很强了”来论证”我们需要减速”,听众听到的是”你们已经这么强了还要更强”,而不是”我们需要区分不同类型的加速”。
更诚实的叙事应该是这样的:我们正在全力推进AI的应用能力,我们确实看到了指数级的进步,我们同时也认为某些特定的能力边界需要谨慎对待——比如自主训练新模型——我们需要针对这些具体边界建立治理机制,而不是笼统地呼吁”暂停AI研发”。
但这很难。因为笼统的呼吁更容易引发关注,更容易在政策讨论中占据位置,也更容易被简化成媒体报道的标题。而诚实的、有细微差别的讨论,在这个注意力稀缺的时代,几乎注定会被忽略。
Anthropic选择了前者。
这是一个聪明的公司做出的一次聪明的传播操作。它让Anthropic同时占据了”技术领先者”和”安全倡导者”两个道德高地。但聪明和诚实之间,有时候确实存在一段距离。
这段距离,也许才是这个故事里最值得琢磨的东西。
关注 SomethingAI 公众号
每日 AI 趋势日报,深度选题分析,独立开发思考
微信搜索「SomethingAI」关注