智谱市值万亿，不是因为追上Claude

詹叔 · 2026年06月24日

Hacker News 上有个帖子，标题是五个字：”GLM 5.2 vs. Opus”。

510 个点赞，332 条评论。帖子的内容不复杂：作者让 GLM-5.2 和 Claude Opus 4.8 各做一个任务——从零开始用 WebGL 写一个 3D 平台跳跃游戏。Opus 半小时做完，画面干净流畅。GLM-5.2 花了一小时，成品粗糙一些，但功能完整。费用上，GLM-5.2 消耗约 5.4 美元，Opus 的同等估算约 22 美元。

帖子下面最高赞的评论不是”中国 AI 牛”，也不是”还差得远”。有人说：

“GLM 5.2 是我试过的所有非 GPT/Claude/Gemini 模型里最大的飞跃。不如最新的 Opus，但已经非常接近了。”

还有一句话被反复引用：”你实际上是在用 Haiku 的价格，拿到接近 Opus 的能力。”

这个帖子的存在本身就是信号。一个中国公司的模型，在 Hacker News 上被直接拿来和 Anthropic 的旗舰做一对一对比，332 条评论里几乎没有人觉得这件事需要额外解释。

半年前，这种对比不会发生。

半年二十倍

2026 年 1 月 8 日，智谱在港交所挂牌，发行价 116.2 港元，IPO 市值约 528 亿港元，募资约 43 亿。”全球大模型第一股”的标签下，基石投资者有 11 家机构，认购了近七成股份——其中包括 JSC International Investment Fund、JinYi Capital 等国际长线基金，以及北京金融控股集团、泰康人寿、广发基金。

五个月零十四天后。6 月 22 日，智谱盘中涨超 40%，总市值首次突破 1 万亿港元——1.07 万亿。

从 528 亿到 1.07 万亿，上市半年，20 倍。年内涨幅超过 1900%。

华尔街见闻给这件事起了一个标题：《DeepSeek 2.0 时刻？智谱市值突破万亿港元，GLM-5.2 刷屏华尔街》。

“DeepSeek 2.0 时刻”这个标签值得拆开看。1 月份 DeepSeek 的爆火是一次”震惊”——一家中国公司做出了超出外界预期的东西，世界被吓了一跳。那次的叙事框架是”出乎意料”。”2.0 时刻”的含义不同：它暗示这次不再意外，而是趋势的确认。

万亿港元不是终点，是信号。市场不是在炒”中国 AI 概念”，是在用真金白银给一类资产重新定价——开源、低价、有独立技术栈的 AI 模型。

“Opus 的小弟弟”

Artificial Analysis 是全球最受信任的 AI 模型评测平台之一。在它的 Coding Index 上，GLM-5.2 得分 50.7。

排行榜长这样：

Claude Fable 5，62.0 分。GPT-5.5，59.1 分。Claude Opus 4.8，56.7 分。Gemini 3.1 Pro，55.5 分。GPT-5.3 Codex，53.1 分。

然后是 GLM-5.2，50.7 分，第六。

前五个全是闭源旗舰。GLM-5.2 是第六名，也是开源模型里的第一名。身后的开源选手——Qwen 3.7 Max 50.1 分、DeepSeek V4 Pro 47.5 分、Kimi K2.6 47.1 分、MiniMax-M3 43.4 分——没有一个能追上它。

HN 上有一个评论精准地概括了这种定位：”GLM 5.2 is Opus 4.8’s little brother, at a way, way cheaper price.”——Opus 的小弟弟，价格便宜得多。

“小弟弟”这个比喻包含了两个判断。第一，承认差距——GLM-5.2 还不是 Opus 的同级对手。第二，承认亲缘关系——它们在同一张桌子上吃饭，用的是同一把尺子。

Artificial Analysis 自己的结论更直白：”GLM-5.2 是我们测试过的第一个，在能力上明确达到或超过 Opus 4.6 的模型。”

Opus 4.6。不是 4.8，是 4.6。差了两个版本号。但放在半年前，这个比较本身就不存在。

参照系的位移

这是整件事里最容易被忽略、但最重要的变化。

回到 DeepSeek 1 月爆火时的媒体标题。关键词是什么？”震惊”“颠覆”“中国版”“追上了”。叙事框架清晰：西方有一个标杆（OpenAI / Anthropic），中国公司正在追赶。每一次进步都被装进”追赶”的语境里——离 GPT 还有多远，离 Claude 还有多远。

GLM-5.2 的叙事框架变了。

Hacker News 上的帖子标题不是”中国 AI 模型接近 GPT 水平”，是”GLM 5.2 vs. Opus”。Reddit 的 r/ClaudeAI——Anthropic 产品的粉丝社区——有人发帖：”GLM 5.2 via Claude Code 是第一个让我感觉不一样的非 Claude 模型。”

甚至批评者也使用同一套参照系。有人发帖说：”如果 K2 或 GLM 5.2 真能赶上 Opus 4.8，我把帽子吃了。”在质疑。但质疑的前提是：把 GLM-5.2 和 Opus 4.8 放在一起对比，是一件合理的事。

六个月前不合理。

参照系变了，角色就变了。

“追赶者”叙事和”被对比对象”叙事之间的鸿沟，不在于能力差距缩小了多少——50.7 到 56.7 的差距仍然实实在在。区别在于谁在定义评价标准。追赶者永远在别人的坐标系里被衡量，别人画好赛道你来跑。而被对比对象意味着你已经成为了坐标系的一部分——讨论”最好”的时候，必须把你放进参考集。

这种角色转换在产业史上有先例。1970 年代日本汽车进入美国市场时，底特律的判断是”便宜货”。然后消费报告开始拿丰田和通用做质量对比。再然后，”Toyota vs. Chevy”成了一个不需要解释的短语。再后来，雷克萨斯成了 J.D. Power 质量排行的常客。从”便宜货”到”被对标对象”到”质量标杆”，日本汽车花了二十年。

中国 AI 模型走完前两步，花了一年半。

不只是便宜

GLM-5.2 的 API 定价是每百万 token 输入 $1.40、输出 $4.40。Opus 4.8 是 $5 / $25。便宜大约 3.6 倍。

价格差本身已经足够刺激，但真正改变游戏规则的不是价格，是可插拔性。

有人在 HN 上分享了一个发现：通过修改几个环境变量，可以把 Claude Code——Anthropic 的旗舰 AI 编程工具——的后端模型直接切换成 GLM-5.2。一段 alias 命令，把 API 端点从 Anthropic 指向 Z.ai，Claude Code 就变成了 GLM Code。界面不变，快捷键不变，工作流不变，模型换了。

这个发现的意义远超”省钱”。它暴露了一件事：AI 编程工具的核心价值正在从模型层迁移到工作流层。当模型变得可插拔，用户第一次能清晰地看到：Claude Code 这套工具体验值多少钱，Claude 这个模型又值多少钱。

Z.ai 的 Coding Plan 约 $16/月。Claude Pro $20/月。Claude Max $100/月。当 $16 的模型能跑在为 $100 模型设计的工作流里，中间的价差就需要一个解释。

HN 上有人说了一句大实话：”用了这些开源模型，你才意识到 Anthropic 和 OpenAI 的订阅计划补贴了多少。”

与此同时，Unsloth——最流行的开源模型本地运行框架——发布了 GLM-5.2 的 GGUF 量化版本。r/unsloth 上的帖子说：”2-bit 量化版本仍然保留了质量。”GLM-5.2 是一个 700B/40B 的 MoE 架构——总参数 7000 亿，但每次推理只激活 400 亿。这意味着量化后的实际计算量，和跑一个 40B 稠密模型差不多。

还有一个容易被忽视但分量极重的细节：GLM-5.2 在发布当天就适配了国产算力——华为昇腾、平头哥、摩尔线程、寒武纪、昆仑芯、沐曦、海光、壁仞。MIT 协议开源，任何人免费商用。一个不依赖 NVIDIA、不依赖西方云服务、可以在国产芯片上运行的 Opus 4.6 级别模型。

这个组合的战略含义远超技术指标。

第二极

把视角拉远。

2026 年上半年，中国开源大模型经历的不是某一个明星产品的单点爆发，而是一条连续梯度的集体跃升。

DeepSeek V4 Pro，47.5 分。Kimi K2.7 Code，45.6 分。Qwen 3.7 Max，50.1 分。GLM-5.2，50.7 分。这些名字排在一起，形成的是一条有纵深、有梯度的竞争带——不是靠一匹独狼撑场面，是系统性的竞争力。

Artificial Analysis 的判断：”开源模型大约落后闭源前沿 4-7 个月。”

4-7 个月。一年前这个差距是 12-18 个月。再往前推，是”不在同一张表上”。

差距在缩小，但还没消失。50.7 对 62.0，GLM-5.2 离 Claude Fable 5 还有 11 分多。在 HN 的讨论里，有人说得清醒：”K2 或 GLM 5.2 要是能赶上 Opus 4.8，我把帽子吃了。它们很好，但还没那么好。”

“小弟弟”仍然是弟弟。但弟弟已经坐在同一张桌子上，而且带了八个朋友。

回到开头那个 HN 帖子。

332 条评论里，最值得注意的不是任何一个高赞观点，而是一个容易被滑过的细节：有人在认真争论 GLM-5.2 到底相当于 Opus 4.6 还是 4.7。

六个月前，这个争论不会发生。因为没有人觉得有必要拿一个中国模型去对标 Anthropic 的具体版本号。那时候的评价框架是”中国 AI 追上 GPT 了吗”——一个笼统的、居高临下的是非题。

现在它变成了一道选择题：4.6 还是 4.7？

这才是万亿时刻的真正含义。不是市值过万亿——市值是结果。真正变的是认知坐标系。当全球开发者社区开始用你的产品名和行业第一名的产品名做直接对比时，你已经从”追赶者”变成了评价标准的一部分。

智谱值不值一万亿港元，每个人有自己的答案。但有一件事已经确定：从今天起，讨论”全球最好的 AI 模型”时，那个名单上不能再默认只有美国公司。

关注 SomethingAI 公众号

每日 AI 趋势日报，深度选题分析，独立开发思考

微信搜索「SomethingAI」关注