一个独立开发者打开 June 的 API 账单,盯着屏幕愣了三秒。
他上个月用了 2800 万 token,分布在三个模型上:GPT-5.5 处理复杂推理,GPT-5.4 mini 搞日常对话,偶尔调一下 Claude Sonnet 4.6 做代码审查。账单总额 $187,比去年同期的 $1200 跌了 84%。
他应该高兴吗?
他确实省了钱。但他也花了两周时间写了一整套智能路由逻辑,根据 prompt 复杂度自动分配模型。这两周的工程师时间,折算成时薪,比省下的 API 费用贵多了。
这个开发者账单的背面,就是整个 AI API 定价战的缩影。
先拉一条时间线。数据不骗人。
2023 年 3 月,GPT-4 上市,定价 $30/$60(输入/输出,每百万 token)。贵吗?在当时,没人觉得贵——因为它是唯一的选择。
一年后,2024 年 5 月,GPT-4o 发布,价格直接砍到 $5/$15。输出价格跌了 75%。两个月后,GPT-4o mini 更是把地板砸穿:$0.15/$0.60。开发者狂欢。
然后 2025 年 2 月,GPT-4.5 来了。输出价格 $150——比 GPT-4o 贵了整整十倍,比 GPT-4 贵了两倍半。
大家骂完了,价格曲线继续走。GPT-5 系列重新分层:GPT-5.4 mini $0.75/$4.50,GPT-5.4 $2.50/$15,GPT-5.5 $5/$30。
到今天,2026 年 6 月,OpenAI 即将发布 GPT-5.6,《华尔街日报》独家爆料:OpenAI 正在酝酿一轮大幅降价。
Sam Altman 的内部邮件被新智元曝光——这个月的发布计划,不只是一款新模型,更是一次定价策略的重大转向。
为什么要降价?因为 Anthropic 不让你不降。
2026 年 5 月,发生了一件标志性的事。
Anthropic 估值达到 9650 亿美元,首次超过 OpenAI 的 8520 亿美元。
这个数字不只是一个资本市场的风向标——它意味着投资人用真金白银投了一个判断:Anthropic 的增长曲线比 OpenAI 更陡峭。
Claude 的年化收入已突破 470 亿美元(2026年5月28日公布)。Anthropic 的产品矩阵越来越密:Opus 4.8 定价 $5/$25,Sonnet 4.6 定价 $3/$15,Haiku 4.5 只要 $1/$5。
注意这个价格结构。和 OpenAI 几乎一模一样的分层逻辑,但在每个层级上,Anthropic 的定价都略低或者持平,而模型能力——至少在编程领域——已经实现了反超。
Claude Fable 5 在 2026 年 6 月横扫编程榜单,SWE-bench、HumanEval、LiveCodeBench 全面领跑。开发者社区开始出现一种微妙的声音:”写代码,用 Claude。”
这对 OpenAI 来说是真正的威胁。API 用户的迁移成本比想象中低——改一个 endpoint,换一个 model name,十五分钟的事。
行业里有一个广为流传的叙事:AI 的 token 价格会永远下降,就像摩尔定律一样。
这叙事对了一半。
便宜的是上一代模型。GPT-4o 比 GPT-4 便宜了 75%,GPT-4o mini 更是把价格压到了 $0.15/$0.60。但如果你看旗舰模型的输出价格:GPT-4 $60 → GPT-4.5 $150 → GPT-5.5 $30。
虽然 GPT-5.5 比 GPT-4.5 便宜了 80%,但仍然比 GPT-4o 贵一倍。
真相是:每一代新旗舰发布时,定价都试图在”覆盖算力成本”和”维持开发者生态”之间走钢丝。老模型降价,是竞争的必然——你不降,别人降。新模型涨价或维持高价,是成本结构的刚性约束。
训练一个前沿模型的成本,从 2023 年到 2026 年翻了不止五倍。推理成本虽然在优化,但供给端的天文数字算力账单不会消失。
API 不再是”一个价格用所有”。
三年前,你调 OpenAI 的 API,选项很简单:GPT-4 或者 GPT-3.5。今天呢?GPT-5.5、GPT-5.4、GPT-5.4 mini、o3、o4-mini……加上 Anthropic 的 Opus 4.8、Sonnet 4.6、Haiku 4.5,再加上 DeepSeek V4、小米的模型——一个开发者面前有十几档选择。
这催生了一个新范式:智能路由。
简单任务走便宜模型,复杂任务走旗舰。代码补全?Haiku 4.5,$1/$5。复杂推理?GPT-5.5,$5/$30。日常对话?GPT-5.4 mini,$0.75/$4.50。
成本确实可以大幅优化。但 complexity 也在飙升。
开发者现在需要判断:这个 prompt 该路由到哪个模型?准确率和成本怎么 trade-off?路由逻辑本身要不要维护?模型更新了,路由阈值要不要调?
这不是简单的”便宜了就行”。这是一个系统工程问题。
很多人说,降价是因为推理效率提升了,GPU 更快了,模型更小了。
这是技术正确,但商业上不完整。
推理效率确实在提升——MoE 架构、量化、蒸馏,每一项技术进步都在压缩单 token 成本。但这些进步是所有玩家的公共品。Anthropic 在用,DeepSeek 在用,小米也在用。
真正迫使 OpenAI 降价的,是竞争态势的变化。
Anthropic 的 API 定价在每个层级上都在咬 OpenAI 的脚后跟。Opus 4.8 $5/$25 vs GPT-5.5 $5/$30,输入持平,输出便宜 17%。Sonnet 4.6 $3/$15 vs GPT-5.4 $2.50/$15,互有胜负。Haiku 4.5 $1/$5 则在便宜档位建立了绝对优势。
DeepSeek 更是制造了价格地板。博客园实测数据:同样完成 400 万 token 的 Claude Code 任务,Claude Sonnet 要 $26,DeepSeek V4 只要 $2.3——十分之一的价格,十分之一的差距。
小米入局 API 市场,定价策略激进到近乎免费——008 那篇分析过了,降价 99% 不是噱头,是战略。
当市场上有玩家愿意在价格上”不计成本”时,定价权就从 OpenAI 手里滑走了。
OpenAI 面临一个经典的”规模不经济”悖论。
ChatGPT 周活跃用户已经达到 9 亿——2026 年 5 月 GPT-5.5 Instant 免费开放后的数据。9 亿周活,全球排名前三的消费级 AI 产品。
但 ChatGPT 不赚钱。钛媒体报道,OpenAI 2026 年预计算力账单高达 500 亿美元。500 亿。这个数字放在哪一家互联网公司身上都是巨石。
ChatGPT 的免费用户在烧算力,付费订阅($20-$200/月)覆盖不了成本,企业客户的定制化需求需要专门的工程团队。收入大头,来自 API。
API 是 OpenAI 的生命线。但 API 价格不能太高——太高了,开发者就跑到 Anthropic 去。不能太低——太低了,500 亿的算力账单谁付?
更棘手的是,Anthropic 有自己的算力协议(Google Cloud、AWS),不需要像 OpenAI 一样在微软的云基础设施上支付溢价。成本结构不同,定价的底气就不同。
OpenAI 现在的选择,不是”要不要降价”,而是”怎么降价才能既留住开发者又不把自己拖垮”。
云计算的历史提供了一个精妙的类比。
2006 年,AWS EC2 刚发布时,定价 $0.10/小时(m1.small)。贵吗?对比自己建机房,便宜了十倍。开发者涌入。
然后竞争来了。Google Cloud、Azure、DigitalOcean、Linode——每一家都在价格上卷 AWS。EC2 的价格在十年里跌了超过 70%。云计算从”革命性便宜”变成了”commodity 基础设施”。
但亚马逊并没有因此输掉战争。因为 AWS 的护城河从来不是”最便宜”,而是生态——Lambda、S3、DynamoDB、CloudFront……一旦你的架构嵌在 AWS 里,迁移成本就不再是”改一个 endpoint”那么简单。
Anthropic 正在复制这个策略。Claude 的分发网、MCP 协议、Claude Code 的工具链——每一项都在提高迁移成本。Anthropic 的策略,不只是”更便宜”,而是”更便宜 + 更难离开”。
OpenAI 的价格战,本质上是一场生态争夺战。
回到开头那个开发者。
他的 API 账单从 $1200 降到了 $187。但他多了两周的路由工程,而且每个月都要维护。
对创业公司来说,token 便宜了,但这并不意味着做生意变容易了。
当一个 API 调用从 $26 降到 $2.3——DeepSeek 的案例——你作为中间层产品的定价权就消失了。如果你的产品只是”把用户的请求转发给大模型,加点 prompt engineering”,你的毛利率会被价格战碾碎。
用户不是傻子。他们会问:为什么我付你 $50/月,而你背后调的 API 只花 $5?
AI 中间层的创业公司正在经历残酷的淘汰。活下来的不是”套壳”的,而是真正提供了不可替代价值的——深度的行业 Know-how、独特的数据资产、复杂的 Workflow 编排、或者自研的小模型微调。
Token 变成 commodity 的那一天,就是”套壳即产品”模式死亡的那一天。
GPT-5.6 本月发布,带着 Altman 内部邮件里暗示的”激进定价调整”。
WSJ 的报道指向一个明确信号:OpenAI 终于决定正面回应 Anthropic 的定价压力。这轮降价可能不只是微调——可能是旗舰模型价格的结构性下移。
但降价能解决 OpenAI 的问题吗?
能留住一部分对价格敏感的开发者。但 Anthropic 的 Claude Fable 5 已经在编程能力上建立了认知优势,Opus 4.8 在长上下文任务上口碑极佳。价格战打到最后,比的不只是便宜,而是”便宜 + 强”。
更深层的问题是:OpenAI 的 500 亿美元算力账单,不会因为降价而缩小。降价意味着每 token 收入减少,而用户量增加带来的算力消耗增加,可能让总成本不降反升。
这是一场用烧钱换时间的战争。
那个开发者关掉了 API 账单页面,打开终端,继续调试他的智能路由脚本。他知道,不管 OpenAI 怎么定价,不管 Anthropic 怎么出招,他要做的事只有一件:
让自己写的代码,不依赖任何单一模型的定价。
因为在这个战场上,唯一不变的就是变化本身。
下个月,一切可能又不同了。
关注 SomethingAI 公众号
每日 AI 趋势日报,深度选题分析,独立开发思考
微信搜索「SomethingAI」关注