← 返回

小米让AI API降价99%的真正理由,和AI本身无关

詹叔 · 2026年05月27日

2026年5月27日零点,小米开发者平台挂出一条公告:MiMo-V2.5 系列API永久降价,幅度最高达99%。Token订阅计划的额度同步提升5到8倍,已消耗的额度在有效期内全额重置。

不是促销,不是限时活动,是永久调价。

同一天,小米上线了 MiMo-V2.5 的完整版本——310亿参数的 Sparse MoE 架构(15B 激活参数),48T 训练数据,原生支持图像、音频和视频理解,上下文窗口拉到100万 token。模型权重在 HuggingFace 上开源,API 平台同时兼容 OpenAI 和 Anthropic 的接口格式。

一个模型能力进入第一梯队、API 价格直接砍到地板的玩家入场了。

一条加速陡峭的下行曲线

先看数字。

2023年初,GPT-4 发布时的定价是每百万 token 输入 $30、输出 $60。那时候的共识是:大模型的推理成本居高不下,API 不可能便宜。

然后 DeepSeek 出现了。

2024年底,DeepSeek-V3 以远低于同行的价格杀入市场。到2026年5月,DeepSeek-V4-Flash 的价格已经降到每百万 token 输入 $0.14、输出 $0.28——不到 GPT-4 发布价的百分之一。缓存命中的输入更是只要 $0.0028。

现在小米把这条曲线的斜率再次拉陡。99% 的降幅意味着,如果原来调用100万 token 需要10块钱,现在只要1毛。对于在模型 API 上月花费数千元的小团队来说,这笔支出突然变得可以忽略不计。

三年的时间,大模型 API 价格下降了两到三个数量级。

这不是线性下降,是指数坍塌。

一场不对称的战争

但真正有意思的不是价格本身,而是降价的主体。

仔细看这场价格战里三个玩家的商业模式:

OpenAI:API 调用是核心收入来源之一。模型能力就是它的产品,API 定价直接关系到营收。它降价的空间受制于成本和利润率的平衡。

DeepSeek:背后是量化巨头幻方。模型能力的商业变现路径不止 API——量化投资本身就是 AI 的超级应用场景。API 收入是锦上添花,不是命脉。

小米:卖手机、卖 IoT 设备、卖汽车。AI 模型对小米来说是成本中心,不是利润中心。MiMo 存在的意义不是靠 API 赚钱,而是让小米的整个硬件生态更聪明、更有竞争力。

三个玩家对 API 收入的依赖程度完全不同。一个全靠 API 吃饭,一个可有可无,一个根本不在乎。

这就是为什么这场价格战从一开始就不公平。

小米可以把 API 价格打到零而不伤筋动骨——它的钱在别的地方赚。OpenAI 做不到。当你的竞争对手不在乎你所在意的那个指标(利润率),你就已经输了。

用成本中心的定价打利润中心的市场,这不是价格战,是降维打击。

历史的回响

这个剧本不新鲜。

1990年代,浏览器大战。网景 Navigator 卖 $49,微软把 Internet Explorer 捆绑进 Windows 免费提供。网景的商业模式是”卖浏览器”,微软的商业模式是”卖操作系统”。浏览器免费对微软来说毫无损失,对网景来说却是致命打击。结果是网景消失,IE 一统天下。

2000年代,移动操作系统大战。诺基亚的 Symbian 和微软的 Windows Phone 都要收授权费。Google 把 Android 免费开源。结果就不用说了。

2010年代,云计算。亚马逊 AWS 持续降价,一年降好几次。不是因为慈悲,而是因为亚马逊的电商业务提供了充沛的现金流,它有本钱用低价碾压对手,逼迫整个行业的利润率下降到只有规模最大、效率最高的玩家才能存活。

每一次基础设施商品化的故事都遵循同一个模式:一个在互补业务上有利润的玩家,把基础设施的价格压到趋近于零,迫使纯靠基础设施赚钱的对手要么转型、要么出局。

AI 模型正在重演这个故事。

当模型变成水电

价格下降到一定程度后,会发生一件微妙的事:买家不再关心价格,开始关心别的东西。

当模型 API 的成本在你的总支出中从 30% 降到 3%,你选择模型的标准就从”谁最便宜”变成了”谁最好用”。你关心的是:文档清不清晰、SDK 好不好接入、出了问题能不能快速找到人、生态工具链完不完善。

这不就是云计算走过的路吗?

今天几乎没有人因为”阿里云比腾讯云便宜5%”就选择阿里云。大家选择云服务商的标准是:数据库方案成熟度、容器生态、运维工具、企业支持、合规认证。价格在决策中的权重已经被压到很低。

模型 API 正在走到同一个岔路口。

当每个模型的能力都够用、价格都可以忽略不计的时候,”用谁的模型”这个问题的重要性会急剧下降。取而代之的问题是:你能不能在不修改代码的情况下切换模型?你的数据格式是否被某个平台锁定?你的开发者工具链是否深度耦合了某个厂商的 API?

这才是价格战终局里真正值得担心的事。

终局:战场上移

回到标题的问题:AI 模型 API 价格战的终局是什么?

终局不是某个玩家赢,而是战争本身变得没有意义。

价格战的前提是”价格是竞争的关键维度”。当价格已经被压到接近零,这个前提就不成立了。竞争会自然上移到更高的层次:

生态层——谁的平台上开发者最多、工具链最丰富、社区最活跃,谁就是默认选择。就像今天选 Linux 发行版,多数人选 Ubuntu 不是因为它技术最好,而是因为它的生态最完善、遇到问题 StackOverflow 上都有答案。

数据层——谁拥有最多的用户使用数据、最丰富的 fine-tune 场景、最深厚的行业 know-how 沉淀,谁的模型在具体场景上的表现就越好。数据飞轮一旦转起来,后发者很难追赶。

应用层——当模型能力变成基础设施,真正的差异化竞争发生在应用层。谁能用通用模型构建出最贴合用户需求的垂直产品,谁就攫取了价值链上最大的利润。

小米的算盘

理解了这个逻辑,再看小米的 99% 降价就不意外了。

小米不在乎 API 能不能赚钱。小米在乎的是:当 MiMo 的 API 足够便宜、足够好用、接口格式跟 OpenAI 和 Anthropic 完全兼容,开发者会不会自然而然地用起来?

当 MiMo 在开发者群体中的渗透率足够高,一个更深层的事情就会发生:手机端、IoT 端、汽车端的 AI 应用,底层会自然地跑在 MiMo 上。因为开发者已经在云端用 MiMo 构建了整套工具链和数据处理流程,把这些能力迁移到小米的设备端是最顺理成章的选择。

价格战只是手段。生态锁定才是目的。

这跟当年 Google 免费 Android 的逻辑一模一样——Android 本身不赚钱,但每一个 Android 设备都把用户更深地锚定在 Google 的搜索、地图、应用商店生态里。模型 API 免费化,锚定的是开发者的工作流和数据流。

还有一件事

在这场轰轰烈烈的价格战里,有一个群体的处境很少有人讨论:靠 API 定价维生的大模型创业公司。

如果你是一家 2024 年成立的 AI 基础模型公司,你的融资故事是”我们训练出了性能接近 GPT-4 的模型,通过 API 调用收费实现商业闭环”。到 2026 年,这个故事变得越来越难讲了。不是因为你的模型不够好,而是因为小米和 DeepSeek 告诉市场:这个能力不值钱。

对这些公司来说,价格战的终局不是理论推演,而是生死存亡。

要么快速转型——从”卖模型能力”转向”卖行业解决方案”或”卖开发者工具”,在价值链上向上攀爬。要么接受现实——承认模型层已经没有超额利润,把规模做到极致靠效率活下来。

无论哪条路,都不会轻松。


模型 API 价格战还会继续打下去。小米不会是最后一个大幅降价的玩家,DeepSeek 和其他后来者也会继续挤压价格空间。

但如果你是一个开发者或创业者,我的建议是:别把太多精力放在”选哪个模型最划算”上。

因为很快,这就不是一个问题了。

真正值得思考的是:当模型能力变成像带宽和存储一样的基础设施——免费、无处不在、没人关心是谁提供的——你的竞争壁垒在哪里?

这个问题,比任何价格对比表都值得花时间想清楚。

关注 SomethingAI 公众号

每日 AI 趋势日报,深度选题分析,独立开发思考

微信搜索「SomethingAI」关注