OpenAI在降价，但最贵的AI从来没便宜过

詹叔 · 2026年06月12日

一个独立开发者打开 June 的 API 账单，盯着屏幕愣了三秒。

他上个月用了 2800 万 token，分布在三个模型上：GPT-5.5 处理复杂推理，GPT-5.4 mini 搞日常对话，偶尔调一下 Claude Sonnet 4.6 做代码审查。账单总额 $187，比去年同期的 $1200 跌了 84%。

他应该高兴吗？

他确实省了钱。但他也花了两周时间写了一整套智能路由逻辑，根据 prompt 复杂度自动分配模型。这两周的工程师时间，折算成时薪，比省下的 API 费用贵多了。

这个开发者账单的背面，就是整个 AI API 定价战的缩影。

三年价格曲线：一部过山车编年史

先拉一条时间线。数据不骗人。

2023 年 3 月，GPT-4 上市，定价 $30/$60（输入/输出，每百万 token）。贵吗？在当时，没人觉得贵——因为它是唯一的选择。

一年后，2024 年 5 月，GPT-4o 发布，价格直接砍到 $5/$15。输出价格跌了 75%。两个月后，GPT-4o mini 更是把地板砸穿：$0.15/$0.60。开发者狂欢。

然后 2025 年 2 月，GPT-4.5 来了。输出价格 $150——比 GPT-4o 贵了整整十倍，比 GPT-4 贵了两倍半。

大家骂完了，价格曲线继续走。GPT-5 系列重新分层：GPT-5.4 mini $0.75/$4.50，GPT-5.4 $2.50/$15，GPT-5.5 $5/$30。

到今天，2026 年 6 月，OpenAI 即将发布 GPT-5.6，《华尔街日报》独家爆料：OpenAI 正在酝酿一轮大幅降价。

Sam Altman 的内部邮件被新智元曝光——这个月的发布计划，不只是一款新模型，更是一次定价策略的重大转向。

为什么要降价？因为 Anthropic 不让你不降。

Anthropic 的逼宫：估值反超的信号

2026 年 5 月，发生了一件标志性的事。

Anthropic 估值达到 9650 亿美元，首次超过 OpenAI 的 8520 亿美元。

这个数字不只是一个资本市场的风向标——它意味着投资人用真金白银投了一个判断：Anthropic 的增长曲线比 OpenAI 更陡峭。

Claude 的年化收入已突破 470 亿美元（2026年5月28日公布）。Anthropic 的产品矩阵越来越密：Opus 4.8 定价 $5/$25，Sonnet 4.6 定价 $3/$15，Haiku 4.5 只要 $1/$5。

注意这个价格结构。和 OpenAI 几乎一模一样的分层逻辑，但在每个层级上，Anthropic 的定价都略低或者持平，而模型能力——至少在编程领域——已经实现了反超。

Claude Fable 5 在 2026 年 6 月横扫编程榜单，SWE-bench、HumanEval、LiveCodeBench 全面领跑。开发者社区开始出现一种微妙的声音：”写代码，用 Claude。”

这对 OpenAI 来说是真正的威胁。API 用户的迁移成本比想象中低——改一个 endpoint，换一个 model name，十五分钟的事。

“AI 永远变便宜”是个半真半假的叙事

行业里有一个广为流传的叙事：AI 的 token 价格会永远下降，就像摩尔定律一样。

这叙事对了一半。

便宜的是上一代模型。GPT-4o 比 GPT-4 便宜了 75%，GPT-4o mini 更是把价格压到了 $0.15/$0.60。但如果你看旗舰模型的输出价格：GPT-4 $60 → GPT-4.5 $150 → GPT-5.5 $30。

虽然 GPT-5.5 比 GPT-4.5 便宜了 80%，但仍然比 GPT-4o 贵一倍。

真相是：每一代新旗舰发布时，定价都试图在”覆盖算力成本”和”维持开发者生态”之间走钢丝。老模型降价，是竞争的必然——你不降，别人降。新模型涨价或维持高价，是成本结构的刚性约束。

训练一个前沿模型的成本，从 2023 年到 2026 年翻了不止五倍。推理成本虽然在优化，但供给端的天文数字算力账单不会消失。

真正发生的事：价格分层化

API 不再是”一个价格用所有”。

三年前，你调 OpenAI 的 API，选项很简单：GPT-4 或者 GPT-3.5。今天呢？GPT-5.5、GPT-5.4、GPT-5.4 mini、o3、o4-mini……加上 Anthropic 的 Opus 4.8、Sonnet 4.6、Haiku 4.5，再加上 DeepSeek V4、小米的模型——一个开发者面前有十几档选择。

这催生了一个新范式：智能路由。

简单任务走便宜模型，复杂任务走旗舰。代码补全？Haiku 4.5，$1/$5。复杂推理？GPT-5.5，$5/$30。日常对话？GPT-5.4 mini，$0.75/$4.50。

成本确实可以大幅优化。但 complexity 也在飙升。

开发者现在需要判断：这个 prompt 该路由到哪个模型？准确率和成本怎么 trade-off？路由逻辑本身要不要维护？模型更新了，路由阈值要不要调？

这不是简单的”便宜了就行”。这是一个系统工程问题。

降价的真正驱动力：竞争，不是技术

很多人说，降价是因为推理效率提升了，GPU 更快了，模型更小了。

这是技术正确，但商业上不完整。

推理效率确实在提升——MoE 架构、量化、蒸馏，每一项技术进步都在压缩单 token 成本。但这些进步是所有玩家的公共品。Anthropic 在用，DeepSeek 在用，小米也在用。

真正迫使 OpenAI 降价的，是竞争态势的变化。

Anthropic 的 API 定价在每个层级上都在咬 OpenAI 的脚后跟。Opus 4.8 $5/$25 vs GPT-5.5 $5/$30，输入持平，输出便宜 17%。Sonnet 4.6 $3/$15 vs GPT-5.4 $2.50/$15，互有胜负。Haiku 4.5 $1/$5 则在便宜档位建立了绝对优势。

DeepSeek 更是制造了价格地板。博客园实测数据：同样完成 400 万 token 的 Claude Code 任务，Claude Sonnet 要 $26，DeepSeek V4 只要 $2.3——十分之一的价格，十分之一的差距。

小米入局 API 市场，定价策略激进到近乎免费——008 那篇分析过了，降价 99% 不是噱头，是战略。

当市场上有玩家愿意在价格上”不计成本”时，定价权就从 OpenAI 手里滑走了。

OpenAI 的战略困局

OpenAI 面临一个经典的”规模不经济”悖论。

ChatGPT 周活跃用户已经达到 9 亿——2026 年 5 月 GPT-5.5 Instant 免费开放后的数据。9 亿周活，全球排名前三的消费级 AI 产品。

但 ChatGPT 不赚钱。钛媒体报道，OpenAI 2026 年预计算力账单高达 500 亿美元。500 亿。这个数字放在哪一家互联网公司身上都是巨石。

ChatGPT 的免费用户在烧算力，付费订阅（$20-$200/月）覆盖不了成本，企业客户的定制化需求需要专门的工程团队。收入大头，来自 API。

API 是 OpenAI 的生命线。但 API 价格不能太高——太高了，开发者就跑到 Anthropic 去。不能太低——太低了，500 亿的算力账单谁付？

更棘手的是，Anthropic 有自己的算力协议（Google Cloud、AWS），不需要像 OpenAI 一样在微软的云基础设施上支付溢价。成本结构不同，定价的底气就不同。

OpenAI 现在的选择，不是”要不要降价”，而是”怎么降价才能既留住开发者又不把自己拖垮”。

这让人想起 AWS 的早年

云计算的历史提供了一个精妙的类比。

2006 年，AWS EC2 刚发布时，定价 $0.10/小时（m1.small）。贵吗？对比自己建机房，便宜了十倍。开发者涌入。

然后竞争来了。Google Cloud、Azure、DigitalOcean、Linode——每一家都在价格上卷 AWS。EC2 的价格在十年里跌了超过 70%。云计算从”革命性便宜”变成了”commodity 基础设施”。

但亚马逊并没有因此输掉战争。因为 AWS 的护城河从来不是”最便宜”，而是生态——Lambda、S3、DynamoDB、CloudFront……一旦你的架构嵌在 AWS 里，迁移成本就不再是”改一个 endpoint”那么简单。

Anthropic 正在复制这个策略。Claude 的分发网、MCP 协议、Claude Code 的工具链——每一项都在提高迁移成本。Anthropic 的策略，不只是”更便宜”，而是”更便宜 + 更难离开”。

OpenAI 的价格战，本质上是一场生态争夺战。

创业公司怎么办：便宜了，但更难了

回到开头那个开发者。

他的 API 账单从 $1200 降到了 $187。但他多了两周的路由工程，而且每个月都要维护。

对创业公司来说，token 便宜了，但这并不意味着做生意变容易了。

当一个 API 调用从 $26 降到 $2.3——DeepSeek 的案例——你作为中间层产品的定价权就消失了。如果你的产品只是”把用户的请求转发给大模型，加点 prompt engineering”，你的毛利率会被价格战碾碎。

用户不是傻子。他们会问：为什么我付你 $50/月，而你背后调的 API 只花 $5？

AI 中间层的创业公司正在经历残酷的淘汰。活下来的不是”套壳”的，而是真正提供了不可替代价值的——深度的行业 Know-how、独特的数据资产、复杂的 Workflow 编排、或者自研的小模型微调。

Token 变成 commodity 的那一天，就是”套壳即产品”模式死亡的那一天。

GPT-5.6 只是开始

GPT-5.6 本月发布，带着 Altman 内部邮件里暗示的”激进定价调整”。

WSJ 的报道指向一个明确信号：OpenAI 终于决定正面回应 Anthropic 的定价压力。这轮降价可能不只是微调——可能是旗舰模型价格的结构性下移。

但降价能解决 OpenAI 的问题吗？

能留住一部分对价格敏感的开发者。但 Anthropic 的 Claude Fable 5 已经在编程能力上建立了认知优势，Opus 4.8 在长上下文任务上口碑极佳。价格战打到最后，比的不只是便宜，而是”便宜 + 强”。

更深层的问题是：OpenAI 的 500 亿美元算力账单，不会因为降价而缩小。降价意味着每 token 收入减少，而用户量增加带来的算力消耗增加，可能让总成本不降反升。

这是一场用烧钱换时间的战争。

那个开发者关掉了 API 账单页面，打开终端，继续调试他的智能路由脚本。他知道，不管 OpenAI 怎么定价，不管 Anthropic 怎么出招，他要做的事只有一件：

让自己写的代码，不依赖任何单一模型的定价。

因为在这个战场上，唯一不变的就是变化本身。

下个月，一切可能又不同了。

关注 SomethingAI 公众号

每日 AI 趋势日报，深度选题分析，独立开发思考

微信搜索「SomethingAI」关注