你和NSA用的Claude是两个等级

詹叔 · 2026年06月10日

6月9日，Anthropic发布Claude Fable 5。Hacker News一夜之间1855分、1463条评论。Reddit、X、各个AI群炸了锅。这是2026年AI圈最大的事件。

但所有人都在聊错误的东西。

benchmark分数刷屏了。静默降智的帖子被转了无数遍。”$10一个token，Anthropic疯了吧”的帖子拿了最高赞。OpenAI和Google连夜调价的消息淹没了时间线。

这些讨论都技术含量很高，分析很透彻，结论也大都没错。

但全错了方向。

真正值得关注的不是Fable 5能做什么。而是Anthropic通过这次发布，悄悄建立了一套制度——一套定义”谁配用完整AI能力”的准入制度。

别人看到了降智，我看到了分封。

同一个大脑，两套公民身份

先搞清楚Fable 5到底是什么。

它不是一个独立训练的新模型。Fable 5的本质，是一个Mythos-class的模型上面加了一层安全分类器，然后以公开API的形式放出来。

Mythos 5呢？同一个模型架构，同一套权重，但解开了限制。只不过，你用不了。

Mythos 5只对Project Glasswing的受信任用户开放。

机制是这样的：当你调Fable 5的API，安全分类器会实时判断你的请求。一旦触发阈值，系统会静默回退到Claude Opus 4.8——Anthropic上一代旗舰模型。回退发生时，你会收到一条通知，告诉你能力降级了。

这个设计看起来很透明，很有诚意。至少你知道自己被限制了。

但数据说了一个更耐人寻味的故事。

Anthropic自己的统计：超过95%的session根本不触发安全回退。也就是说，绝大多数用户，绝大多数场景下，拿到的是几乎完整的Mythos能力。

Anthropic官方原话：”the most powerful model we have ever made widely available。”

这是事实。但他们没有回答一个更本质的问题。

如果95%的用户都在用完整能力，那这层安全分类器的意义到底是什么？

安全？也许。但一个95%时候都不会触发的安全锁，更像是一种声明而非保护。

我更倾向的答案是：Anthropic在建一个框架。

一个随时可以收回权限的框架。分类器今天95%不触发，不代表明天不会调低阈值。今天把你放在Fable等级里给你几乎全部能力，明天可以在你毫无察觉的时候收回20%。不是不能给你用，是”我随时可以不给你用”。

这才是Fable真正的产品逻辑。它卖的不是安全，是权力。

谁在”受信任名单”上？

那就得看Project Glasswing了。

Glasswing是Anthropic的受信任访问计划。在HN上拿了1541分，Schneier on Security上40分，安全圈和AI圈同时震动。

名单上的玩家，能让你倒吸一口凉气。

NSA在用Mythos做网络攻防。Axios报道了这个消息，HN上485分。Financial Times也跟进了，92分。虽然五角大楼公开说”不行”，但这个”说不行”本身就很有意思——五角大楼需要专门表态”不行”，说明NSA已经在用了。

白宫通过Reuters报道的渠道，给美国各联邦机构发放了Mythos访问权限。US财政部在寻求Mythos访问，Bloomberg报道。

网络安全领域，Mozilla用Mythos发现了271个Firefox漏洞。Wired和Ars Technica都报道了这件事。271个漏洞，想想看这个数字。

生物医药领域更夸张。研究者用Mythos 5做药物设计，实现了大约10倍的加速。14个蛋白靶点中，9个产出了候选药物。研究者对Mythos提出的假设，约80%优于Opus级模型。

现在回头看这份名单。

NSA。白宫。财政部。Mozilla。顶级生物医药实验室。

他们是AI时代的”核俱乐部”。

而普通开发者呢？小公司呢？开源社区呢？三个人的创业团队呢？

只能用Fable。

这已经不是技术能力的问题了。你API调得再溜，prompt写得再好，你的月费付得再多，你也进不了Mythos的门槛。

这是一个身份问题。你是什么身份，决定了你能用什么级别的AI。

Anthropic在说：AI能力的分配，不取决于市场需求，取决于你是否被信任。

隐形的等级墙——你不知道自己在”低等级”

安全回退机制至少还是透明的。触发的时候你会收到通知。你知道自己从Mythos被降到了Opus。

但Anthropic还有另一套机制，这套机制才是等级制度真正可怕的地方。

Jon Ready在HN上发了分析文章，566分。他拆解了Anthropic System Card里的一段话。原文是这样的：Anthropic会使用”prompt modification, steering vectors, PEFT”（参数高效微调）来限制特定用户的能力。

限制的对象被定义为”前沿AI开发者”。

关键信息来了：用户完全不知道发生了什么。没有被通知，没有被回退到另一个模型，甚至没有性能指标的任何变化。你调用API，模型返回结果，你觉得一切正常。

但你的结果质量，已经被悄悄调低了。

如果安全回退是一道可见的墙，这就是一堵隐形的墙。

Anthropic声称这个机制只影响0.03%的开发者。这个数字看起来很小，但有一个前提条件被忽略了——“前沿AI开发”的定义。

今天什么叫前沿AI开发？五年前，CLIP模型还是前沿研究，能在顶会发论文。现在呢？一个bootstrapped的创业公司，三个人的团队，拿着开源模型做fine-tune，就触及了这个定义的边界。

五年的技术扩散速度，已经让”前沿”这个词的门槛从MIT实验室降到了车库创业公司。

如果”前沿AI开发”的定义持续膨胀——按照历史趋势，它一定会——那0.03%的覆盖率会像通货膨胀一样悄悄扩大。

这才是分级制度最厉害的地方。不是明面上告诉你”你不行”，而是你根本不知道自己被限制。就像银行偷偷降低了你的信用评分，你不会知道，直到某天贷款被拒。

interconnects.ai做了一篇分析，虽然只有3分，但切入角度很准。他们把Anthropic的安全策略分成了两条轨道：透明的轨道和隐身的轨道。

透明的轨道给你看到墙壁，让你知道边界在哪。隐身的轨道悄悄移动地平线，让你以为世界没有尽头。

两条轨道同时运转，才是Anthropic安全体系的全貌。

定价就是分级的经济手段

聊完了技术机制，再来看钱。

Fable 5的定价：输入$10/百万token，输出$50/百万token。这是目前市场上最贵的公开模型。

做几个对比。

Claude Opus 4.8：$5/$25。GPT-5.5（OpenAI旗舰）：$5/$30。Gemini 3.5 Flash（Google）：$1.50/$9。

Fable的输入价格是Opus的2倍，是GPT-5.5的2倍，是Gemini Flash的将近7倍。

当然，Anthropic给了两个折扣。Batch模式打五折，prompt缓存最高打一折。对于大规模使用场景，实际成本可以大幅降低。

但这不改变一个核心问题。

如果95%以上的session都不触发安全回退——也就是说大部分时候你在用完整的Mythos能力——那你付2倍价格买的是什么？

不是更强的能力。

你买的是一张入场券。一张”被纳入Anthropic等级管理体系”的入场券。

Anthropic在用价格建立阶层。

愿意付最高价格的人，自动获得了Anthropic的”高端用户”身份标记。不付钱或付不起的人，被自然分流到更低的等级。这在产品逻辑上其实很精妙——不是Anthropic主动拒绝你，而是市场替Anthropic完成了筛选。

但这不是普通的定价策略。正常的定价策略，高价对应高能力。Fable的定价，高价对应的不是更高的能力，而是一种制度性的”准入资格”。

你花了更多的钱，进入了一个可以随时被降级、被静默限制、但你不知道的系统。

三条路线的分岔口

把视角拉远，看看整个行业在怎么选路。

OpenAI走的是单模型策略。GPT-5.5定价$5/$30，对所有人开放同样的能力，没有安全回退，没有静默降智。OpenAI在赌一件事：我可以安全地释放全部能力给所有人。

Google走的是开源路线。Gemini从Flash到Pro，价格从$0.10到$2.00，几乎是白菜价。Google在赌另一件事：开放比控制更安全，透明比黑箱更负责。

Anthropic走的是双轨制。Fable给大众，Mythos给精英。Anthropic赌的是第三件事：只有分级管控，才是唯一负责任的路。

三条路都在赌。赌注一样，都是人类和AI共存的未来。赌法完全不同。

但Anthropic的路有一个独特的问题，是OpenAI和Google都不用面对的。

谁来决定谁在Mythos名单上？

OpenAI不需要决定——所有人都在同一个等级。Google也不需要——开源社区自己决定用不用。只有Anthropic，需要维护一个”受信任名单”。

这是一个需要持续判断、持续审批、持续管理的制度性工作。每一次把一个新组织加入名单，或者拒绝一个申请，都是一个制度判断。这个判断的标准是什么？过程是否透明？有没有申诉机制？

Anthropic没有公开回答这些问题。

一个从未被讨论过的问题

历史上每一次”能力等级化”的尝试，都绕不开同一个终极问题。

定义权。

谁有资格定义谁是”受信任”的？

1968年，NPT——核不扩散条约——在联合国签署。它的核心逻辑清晰到残忍：已经拥有核武器的国家可以继续拥有，没有的国家不许发展。这份条约定义了谁有资格拥有核武器。但定义权归谁？归那五个已经拥有核武器的国家。

药品分级制度也一样。处方药和非处方药之间有一堵墙，但这堵墙的定义权在FDA和医生手里。你觉得自己需要某种药，没用。处方权不在你手里，在系统手里。

军用技术出口管制——ITAR和EAR——定义了哪些技术可以出口给哪些国家。定义权在美国政府手里。

每一个体系都在回答同一个问题：谁来决定谁配拥有什么级别的能力？

现在，Anthropic通过Fable 5的发布，给出了一个答案。

AI能力的”不扩散”机制，定义权在Anthropic手里。

一家公司。一家估值965亿美元的私营公司。

这不是在批评Anthropic做错了。当AI的能力边界开始触及药物设计和生物武器、网络安全攻防这些双用途领域时，某种形式的管控几乎是不可避免的。甚至可以说，Anthropic是第一个认真面对这个问题的AI公司。

但认真面对和正确回答是两回事。

Anthropic在建立一个事实上的AI能力分级制度。这个制度的准入标准、审批流程、申诉机制、监督主体——全部是不透明的。受信任名单的准入和退出，没有公开的规则。静默降智的触发条件，用户无法得知。安全回退的阈值，随时可以调整。

所有这些权力，集中在一家公司手里。

这个问题不会因为Anthropic的出发点是善意的就消失。正如NPT的合理性不意味着”五个国家决定谁能拥核”这个架构没有争议。

Fable 5的发布，是AI等级社会的第一份蓝图。这份蓝图里，Anthropic既是规则的制定者，也是规则的执行者，还是规则的裁判。

一个健康的社会制度，立法、执法、司法至少要在形式上分开。但AI能力的”不扩散”制度，目前三个角色都在同一家公司手里。

这个问题的答案，将决定AI等级社会走向何方。

走向像NPT一样的国际协作制度——通过条约、机构、多边协商来管理AI能力的分配。还是变成一种新的数字贵族制度——由少数科技巨头在幕后决定谁配用什么样的AI。

6月9日发布的不是Fable 5。是这道选择题。

关注 SomethingAI 公众号

每日 AI 趋势日报，深度选题分析，独立开发思考

微信搜索「SomethingAI」关注