小米让AI API降价99%的真正理由，和AI本身无关

詹叔 · 2026年05月27日

2026年5月27日零点，小米开发者平台挂出一条公告：MiMo-V2.5 系列API永久降价，幅度最高达99%。Token订阅计划的额度同步提升5到8倍，已消耗的额度在有效期内全额重置。

不是促销，不是限时活动，是永久调价。

同一天，小米上线了 MiMo-V2.5 的完整版本——310亿参数的 Sparse MoE 架构（15B 激活参数），48T 训练数据，原生支持图像、音频和视频理解，上下文窗口拉到100万 token。模型权重在 HuggingFace 上开源，API 平台同时兼容 OpenAI 和 Anthropic 的接口格式。

一个模型能力进入第一梯队、API 价格直接砍到地板的玩家入场了。

一条加速陡峭的下行曲线

先看数字。

2023年初，GPT-4 发布时的定价是每百万 token 输入 $30、输出 $60。那时候的共识是：大模型的推理成本居高不下，API 不可能便宜。

然后 DeepSeek 出现了。

2024年底，DeepSeek-V3 以远低于同行的价格杀入市场。到2026年5月，DeepSeek-V4-Flash 的价格已经降到每百万 token 输入 $0.14、输出 $0.28——不到 GPT-4 发布价的百分之一。缓存命中的输入更是只要 $0.0028。

现在小米把这条曲线的斜率再次拉陡。99% 的降幅意味着，如果原来调用100万 token 需要10块钱，现在只要1毛。对于在模型 API 上月花费数千元的小团队来说，这笔支出突然变得可以忽略不计。

三年的时间，大模型 API 价格下降了两到三个数量级。

这不是线性下降，是指数坍塌。

一场不对称的战争

但真正有意思的不是价格本身，而是降价的主体。

仔细看这场价格战里三个玩家的商业模式：

OpenAI：API 调用是核心收入来源之一。模型能力就是它的产品，API 定价直接关系到营收。它降价的空间受制于成本和利润率的平衡。

DeepSeek：背后是量化巨头幻方。模型能力的商业变现路径不止 API——量化投资本身就是 AI 的超级应用场景。API 收入是锦上添花，不是命脉。

小米：卖手机、卖 IoT 设备、卖汽车。AI 模型对小米来说是成本中心，不是利润中心。MiMo 存在的意义不是靠 API 赚钱，而是让小米的整个硬件生态更聪明、更有竞争力。

三个玩家对 API 收入的依赖程度完全不同。一个全靠 API 吃饭，一个可有可无，一个根本不在乎。

这就是为什么这场价格战从一开始就不公平。

小米可以把 API 价格打到零而不伤筋动骨——它的钱在别的地方赚。OpenAI 做不到。当你的竞争对手不在乎你所在意的那个指标（利润率），你就已经输了。

用成本中心的定价打利润中心的市场，这不是价格战，是降维打击。

历史的回响

这个剧本不新鲜。

1990年代，浏览器大战。网景 Navigator 卖 $49，微软把 Internet Explorer 捆绑进 Windows 免费提供。网景的商业模式是”卖浏览器”，微软的商业模式是”卖操作系统”。浏览器免费对微软来说毫无损失，对网景来说却是致命打击。结果是网景消失，IE 一统天下。

2000年代，移动操作系统大战。诺基亚的 Symbian 和微软的 Windows Phone 都要收授权费。Google 把 Android 免费开源。结果就不用说了。

2010年代，云计算。亚马逊 AWS 持续降价，一年降好几次。不是因为慈悲，而是因为亚马逊的电商业务提供了充沛的现金流，它有本钱用低价碾压对手，逼迫整个行业的利润率下降到只有规模最大、效率最高的玩家才能存活。

每一次基础设施商品化的故事都遵循同一个模式：一个在互补业务上有利润的玩家，把基础设施的价格压到趋近于零，迫使纯靠基础设施赚钱的对手要么转型、要么出局。

AI 模型正在重演这个故事。

当模型变成水电

价格下降到一定程度后，会发生一件微妙的事：买家不再关心价格，开始关心别的东西。

当模型 API 的成本在你的总支出中从 30% 降到 3%，你选择模型的标准就从”谁最便宜”变成了”谁最好用”。你关心的是：文档清不清晰、SDK 好不好接入、出了问题能不能快速找到人、生态工具链完不完善。

这不就是云计算走过的路吗？

今天几乎没有人因为”阿里云比腾讯云便宜5%”就选择阿里云。大家选择云服务商的标准是：数据库方案成熟度、容器生态、运维工具、企业支持、合规认证。价格在决策中的权重已经被压到很低。

模型 API 正在走到同一个岔路口。

当每个模型的能力都够用、价格都可以忽略不计的时候，”用谁的模型”这个问题的重要性会急剧下降。取而代之的问题是：你能不能在不修改代码的情况下切换模型？你的数据格式是否被某个平台锁定？你的开发者工具链是否深度耦合了某个厂商的 API？

这才是价格战终局里真正值得担心的事。

终局：战场上移

回到标题的问题：AI 模型 API 价格战的终局是什么？

终局不是某个玩家赢，而是战争本身变得没有意义。

价格战的前提是”价格是竞争的关键维度”。当价格已经被压到接近零，这个前提就不成立了。竞争会自然上移到更高的层次：

生态层——谁的平台上开发者最多、工具链最丰富、社区最活跃，谁就是默认选择。就像今天选 Linux 发行版，多数人选 Ubuntu 不是因为它技术最好，而是因为它的生态最完善、遇到问题 StackOverflow 上都有答案。

数据层——谁拥有最多的用户使用数据、最丰富的 fine-tune 场景、最深厚的行业 know-how 沉淀，谁的模型在具体场景上的表现就越好。数据飞轮一旦转起来，后发者很难追赶。

应用层——当模型能力变成基础设施，真正的差异化竞争发生在应用层。谁能用通用模型构建出最贴合用户需求的垂直产品，谁就攫取了价值链上最大的利润。

小米的算盘

理解了这个逻辑，再看小米的 99% 降价就不意外了。

小米不在乎 API 能不能赚钱。小米在乎的是：当 MiMo 的 API 足够便宜、足够好用、接口格式跟 OpenAI 和 Anthropic 完全兼容，开发者会不会自然而然地用起来？

当 MiMo 在开发者群体中的渗透率足够高，一个更深层的事情就会发生：手机端、IoT 端、汽车端的 AI 应用，底层会自然地跑在 MiMo 上。因为开发者已经在云端用 MiMo 构建了整套工具链和数据处理流程，把这些能力迁移到小米的设备端是最顺理成章的选择。

价格战只是手段。生态锁定才是目的。

这跟当年 Google 免费 Android 的逻辑一模一样——Android 本身不赚钱，但每一个 Android 设备都把用户更深地锚定在 Google 的搜索、地图、应用商店生态里。模型 API 免费化，锚定的是开发者的工作流和数据流。

还有一件事

在这场轰轰烈烈的价格战里，有一个群体的处境很少有人讨论：靠 API 定价维生的大模型创业公司。

如果你是一家 2024 年成立的 AI 基础模型公司，你的融资故事是”我们训练出了性能接近 GPT-4 的模型，通过 API 调用收费实现商业闭环”。到 2026 年，这个故事变得越来越难讲了。不是因为你的模型不够好，而是因为小米和 DeepSeek 告诉市场：这个能力不值钱。

对这些公司来说，价格战的终局不是理论推演，而是生死存亡。

要么快速转型——从”卖模型能力”转向”卖行业解决方案”或”卖开发者工具”，在价值链上向上攀爬。要么接受现实——承认模型层已经没有超额利润，把规模做到极致靠效率活下来。

无论哪条路，都不会轻松。

模型 API 价格战还会继续打下去。小米不会是最后一个大幅降价的玩家，DeepSeek 和其他后来者也会继续挤压价格空间。

但如果你是一个开发者或创业者，我的建议是：别把太多精力放在”选哪个模型最划算”上。

因为很快，这就不是一个问题了。

真正值得思考的是：当模型能力变成像带宽和存储一样的基础设施——免费、无处不在、没人关心是谁提供的——你的竞争壁垒在哪里？

这个问题，比任何价格对比表都值得花时间想清楚。

关注 SomethingAI 公众号

每日 AI 趋势日报，深度选题分析，独立开发思考

微信搜索「SomethingAI」关注