6月9日,Anthropic发布Claude Fable 5。Hacker News一夜之间1855分、1463条评论。Reddit、X、各个AI群炸了锅。这是2026年AI圈最大的事件。
但所有人都在聊错误的东西。
benchmark分数刷屏了。静默降智的帖子被转了无数遍。”$10一个token,Anthropic疯了吧”的帖子拿了最高赞。OpenAI和Google连夜调价的消息淹没了时间线。
这些讨论都技术含量很高,分析很透彻,结论也大都没错。
但全错了方向。
真正值得关注的不是Fable 5能做什么。而是Anthropic通过这次发布,悄悄建立了一套制度——一套定义”谁配用完整AI能力”的准入制度。
别人看到了降智,我看到了分封。
先搞清楚Fable 5到底是什么。
它不是一个独立训练的新模型。Fable 5的本质,是一个Mythos-class的模型上面加了一层安全分类器,然后以公开API的形式放出来。
Mythos 5呢?同一个模型架构,同一套权重,但解开了限制。只不过,你用不了。
Mythos 5只对Project Glasswing的受信任用户开放。
机制是这样的:当你调Fable 5的API,安全分类器会实时判断你的请求。一旦触发阈值,系统会静默回退到Claude Opus 4.8——Anthropic上一代旗舰模型。回退发生时,你会收到一条通知,告诉你能力降级了。
这个设计看起来很透明,很有诚意。至少你知道自己被限制了。
但数据说了一个更耐人寻味的故事。
Anthropic自己的统计:超过95%的session根本不触发安全回退。也就是说,绝大多数用户,绝大多数场景下,拿到的是几乎完整的Mythos能力。
Anthropic官方原话:”the most powerful model we have ever made widely available。”
这是事实。但他们没有回答一个更本质的问题。
如果95%的用户都在用完整能力,那这层安全分类器的意义到底是什么?
安全?也许。但一个95%时候都不会触发的安全锁,更像是一种声明而非保护。
我更倾向的答案是:Anthropic在建一个框架。
一个随时可以收回权限的框架。分类器今天95%不触发,不代表明天不会调低阈值。今天把你放在Fable等级里给你几乎全部能力,明天可以在你毫无察觉的时候收回20%。不是不能给你用,是”我随时可以不给你用”。
这才是Fable真正的产品逻辑。它卖的不是安全,是权力。
那就得看Project Glasswing了。
Glasswing是Anthropic的受信任访问计划。在HN上拿了1541分,Schneier on Security上40分,安全圈和AI圈同时震动。
名单上的玩家,能让你倒吸一口凉气。
NSA在用Mythos做网络攻防。Axios报道了这个消息,HN上485分。Financial Times也跟进了,92分。虽然五角大楼公开说”不行”,但这个”说不行”本身就很有意思——五角大楼需要专门表态”不行”,说明NSA已经在用了。
白宫通过Reuters报道的渠道,给美国各联邦机构发放了Mythos访问权限。US财政部在寻求Mythos访问,Bloomberg报道。
网络安全领域,Mozilla用Mythos发现了271个Firefox漏洞。Wired和Ars Technica都报道了这件事。271个漏洞,想想看这个数字。
生物医药领域更夸张。研究者用Mythos 5做药物设计,实现了大约10倍的加速。14个蛋白靶点中,9个产出了候选药物。研究者对Mythos提出的假设,约80%优于Opus级模型。
现在回头看这份名单。
NSA。白宫。财政部。Mozilla。顶级生物医药实验室。
他们是AI时代的”核俱乐部”。
而普通开发者呢?小公司呢?开源社区呢?三个人的创业团队呢?
只能用Fable。
这已经不是技术能力的问题了。你API调得再溜,prompt写得再好,你的月费付得再多,你也进不了Mythos的门槛。
这是一个身份问题。你是什么身份,决定了你能用什么级别的AI。
Anthropic在说:AI能力的分配,不取决于市场需求,取决于你是否被信任。
安全回退机制至少还是透明的。触发的时候你会收到通知。你知道自己从Mythos被降到了Opus。
但Anthropic还有另一套机制,这套机制才是等级制度真正可怕的地方。
Jon Ready在HN上发了分析文章,566分。他拆解了Anthropic System Card里的一段话。原文是这样的:Anthropic会使用”prompt modification, steering vectors, PEFT”(参数高效微调)来限制特定用户的能力。
限制的对象被定义为”前沿AI开发者”。
关键信息来了:用户完全不知道发生了什么。没有被通知,没有被回退到另一个模型,甚至没有性能指标的任何变化。你调用API,模型返回结果,你觉得一切正常。
但你的结果质量,已经被悄悄调低了。
如果安全回退是一道可见的墙,这就是一堵隐形的墙。
Anthropic声称这个机制只影响0.03%的开发者。这个数字看起来很小,但有一个前提条件被忽略了——“前沿AI开发”的定义。
今天什么叫前沿AI开发?五年前,CLIP模型还是前沿研究,能在顶会发论文。现在呢?一个bootstrapped的创业公司,三个人的团队,拿着开源模型做fine-tune,就触及了这个定义的边界。
五年的技术扩散速度,已经让”前沿”这个词的门槛从MIT实验室降到了车库创业公司。
如果”前沿AI开发”的定义持续膨胀——按照历史趋势,它一定会——那0.03%的覆盖率会像通货膨胀一样悄悄扩大。
这才是分级制度最厉害的地方。不是明面上告诉你”你不行”,而是你根本不知道自己被限制。就像银行偷偷降低了你的信用评分,你不会知道,直到某天贷款被拒。
interconnects.ai做了一篇分析,虽然只有3分,但切入角度很准。他们把Anthropic的安全策略分成了两条轨道:透明的轨道和隐身的轨道。
透明的轨道给你看到墙壁,让你知道边界在哪。隐身的轨道悄悄移动地平线,让你以为世界没有尽头。
两条轨道同时运转,才是Anthropic安全体系的全貌。
聊完了技术机制,再来看钱。
Fable 5的定价:输入$10/百万token,输出$50/百万token。这是目前市场上最贵的公开模型。
做几个对比。
Claude Opus 4.8:$5/$25。GPT-5.5(OpenAI旗舰):$5/$30。Gemini 3.5 Flash(Google):$1.50/$9。
Fable的输入价格是Opus的2倍,是GPT-5.5的2倍,是Gemini Flash的将近7倍。
当然,Anthropic给了两个折扣。Batch模式打五折,prompt缓存最高打一折。对于大规模使用场景,实际成本可以大幅降低。
但这不改变一个核心问题。
如果95%以上的session都不触发安全回退——也就是说大部分时候你在用完整的Mythos能力——那你付2倍价格买的是什么?
不是更强的能力。
你买的是一张入场券。一张”被纳入Anthropic等级管理体系”的入场券。
Anthropic在用价格建立阶层。
愿意付最高价格的人,自动获得了Anthropic的”高端用户”身份标记。不付钱或付不起的人,被自然分流到更低的等级。这在产品逻辑上其实很精妙——不是Anthropic主动拒绝你,而是市场替Anthropic完成了筛选。
但这不是普通的定价策略。正常的定价策略,高价对应高能力。Fable的定价,高价对应的不是更高的能力,而是一种制度性的”准入资格”。
你花了更多的钱,进入了一个可以随时被降级、被静默限制、但你不知道的系统。
把视角拉远,看看整个行业在怎么选路。
OpenAI走的是单模型策略。GPT-5.5定价$5/$30,对所有人开放同样的能力,没有安全回退,没有静默降智。OpenAI在赌一件事:我可以安全地释放全部能力给所有人。
Google走的是开源路线。Gemini从Flash到Pro,价格从$0.10到$2.00,几乎是白菜价。Google在赌另一件事:开放比控制更安全,透明比黑箱更负责。
Anthropic走的是双轨制。Fable给大众,Mythos给精英。Anthropic赌的是第三件事:只有分级管控,才是唯一负责任的路。
三条路都在赌。赌注一样,都是人类和AI共存的未来。赌法完全不同。
但Anthropic的路有一个独特的问题,是OpenAI和Google都不用面对的。
谁来决定谁在Mythos名单上?
OpenAI不需要决定——所有人都在同一个等级。Google也不需要——开源社区自己决定用不用。只有Anthropic,需要维护一个”受信任名单”。
这是一个需要持续判断、持续审批、持续管理的制度性工作。每一次把一个新组织加入名单,或者拒绝一个申请,都是一个制度判断。这个判断的标准是什么?过程是否透明?有没有申诉机制?
Anthropic没有公开回答这些问题。
历史上每一次”能力等级化”的尝试,都绕不开同一个终极问题。
定义权。
谁有资格定义谁是”受信任”的?
1968年,NPT——核不扩散条约——在联合国签署。它的核心逻辑清晰到残忍:已经拥有核武器的国家可以继续拥有,没有的国家不许发展。这份条约定义了谁有资格拥有核武器。但定义权归谁?归那五个已经拥有核武器的国家。
药品分级制度也一样。处方药和非处方药之间有一堵墙,但这堵墙的定义权在FDA和医生手里。你觉得自己需要某种药,没用。处方权不在你手里,在系统手里。
军用技术出口管制——ITAR和EAR——定义了哪些技术可以出口给哪些国家。定义权在美国政府手里。
每一个体系都在回答同一个问题:谁来决定谁配拥有什么级别的能力?
现在,Anthropic通过Fable 5的发布,给出了一个答案。
AI能力的”不扩散”机制,定义权在Anthropic手里。
一家公司。一家估值965亿美元的私营公司。
这不是在批评Anthropic做错了。当AI的能力边界开始触及药物设计和生物武器、网络安全攻防这些双用途领域时,某种形式的管控几乎是不可避免的。甚至可以说,Anthropic是第一个认真面对这个问题的AI公司。
但认真面对和正确回答是两回事。
Anthropic在建立一个事实上的AI能力分级制度。这个制度的准入标准、审批流程、申诉机制、监督主体——全部是不透明的。受信任名单的准入和退出,没有公开的规则。静默降智的触发条件,用户无法得知。安全回退的阈值,随时可以调整。
所有这些权力,集中在一家公司手里。
这个问题不会因为Anthropic的出发点是善意的就消失。正如NPT的合理性不意味着”五个国家决定谁能拥核”这个架构没有争议。
Fable 5的发布,是AI等级社会的第一份蓝图。这份蓝图里,Anthropic既是规则的制定者,也是规则的执行者,还是规则的裁判。
一个健康的社会制度,立法、执法、司法至少要在形式上分开。但AI能力的”不扩散”制度,目前三个角色都在同一家公司手里。
这个问题的答案,将决定AI等级社会走向何方。
走向像NPT一样的国际协作制度——通过条约、机构、多边协商来管理AI能力的分配。还是变成一种新的数字贵族制度——由少数科技巨头在幕后决定谁配用什么样的AI。
6月9日发布的不是Fable 5。是这道选择题。
关注 SomethingAI 公众号
每日 AI 趋势日报,深度选题分析,独立开发思考
微信搜索「SomethingAI」关注