宝马斯帕坦堡工厂里,一台Figure 02人形机器人正在做一件极其枯燥的事:从货架上取下钣金零件,放到焊接夹具上。5毫米精度,2秒内完成。
这件事它连续做了11个月。6台Figure 02参与了3万辆BMW X3的生产,搬运了9万个钣金零件,走了120万步,累计行走320公里。每班次准确率超过99%。
这不是YouTube上的demo视频。这是真正的汽车产线。
更关键的是宝马随后公布的数字:按当前价格,这群机器人的投资回报周期是18到24个月。
如果你对人形机器人的认知还停留在波士顿动力后空翻视频的阶段,”投资回报周期”这个词可能让你愣一下。人形机器人什么时候开始算ROI了?
答案是2026年。
2018年10月,协作机器人先驱Rethink Robotics宣布倒闭。这家公司有两款明星产品——Baxter和Sawyer,累计融资1.5亿美元,贝佐斯从A轮到E轮投了8次。
它死得很安静。死因不是技术不行,而是两个问题同时卡死了它:第一,机器人没有自适应能力,只能执行预编程任务,换一条产线就要重新部署,部署成本比省下的人工还贵。第二,供应链撑不起成本下探——当时的精密减速器、力矩传感器、伺服电机全部依赖进口,单价居高不下,整机成本没法压到让客户算得过账的程度。
Rethink的故事是那一轮机器人泡沫的缩影。热潮从2012年开始,到2018年资本收紧时集体退潮。Anki倒闭,Jibo倒闭,Mayfield Robotics的Kuri被砍。2018年全球人形机器人融资7亿美元,然后资本掉头就跑。
所以当2026年上半年,具身智能赛道在六个月内吸走460亿人民币——288轮融资,226家公司——你第一个问题应该是:这次有什么不一样?
所有人都在聊AI大脑——VLA模型、世界模型、端到端学习。这些确实重要。但如果你想知道这次为什么不是泡沫,最诚实的答案藏在一个极不性感的地方:行星滚柱丝杠。
丝杠是把旋转运动变成直线运动的精密推杆,装在机器人关节里。2024年,一根丝杠的采购价是5000到10000元。2026年,降到了1000到2000元。
降幅80%。
这不是某一项零件的偶然突破。整个硬件供应链都在经历同步的成本坍塌:谐波减速器的国产化率从几乎为零升到40%,外资品牌的价格是内资的三倍,替代空间正在快速兑现。六维力矩传感器——相当于机器人的触觉——国产化率快速攀升。Figure 03的指尖已经能感知3克的力。
把这些数字叠在一起,整机成本的运动轨迹是这样的:2024年150万人民币一台,2026年20到40万,行业预测2028年降到10到25万。
三年降83%。这不是”未来可能降价”的预测,是已经发生的供应链重构。
为什么是中国企业在主导这件事?2025年全球人形机器人出货量前六名全部是中国公司,合计占比超过74%。宇树科技出货5500台排第一,智元机器人5100台排第二。2026年3月,智元第一万台远征A3下线,成为全球首家累计出货破万的人形机器人公司。
原因不复杂:全球只有中国拥有足够深的精密制造产业链来做这件事。丝杠、减速器、电机、结构件——每一个环节都需要规模化制造能力来压成本。这不是AI算法的竞争,是制造业基本盘的竞争。
所以一个有些反直觉的事实是:这轮具身智能爆发,真正的幕后推手不是OpenAI,不是特斯拉,而是中国长三角和珠三角那些做精密加工的工厂。
具身智能的需求结构是一个金字塔,从上到下确定性递减。
第一层:工业制造——确定性最高,ROI已经跑通。
宝马和Figure AI的合作提供了第一份工厂验证数据。6台机器人,11个月,3万辆车,9万个零件,99%的准确率,18到24个月回本。这是一份可以直接拿去给CFO看的投资分析报告,不是愿景PPT。
特斯拉更激进。2026年4月,弗里蒙特工厂停产Model S/X,把产线腾出来给Optimus。5月,Optimus Gen-3正式量产。上海超级工厂已经部署了约50台Optimus在总装线上作业。马斯克的目标是年产能100万台——当然,马斯克的时间表向来需要打折听。
行业测算显示,一台工业人形机器人可以替代3.5到4名多班次工人,投资回收期已经缩短到2年以内。面对年均8-12%的人力成本增长,这个账车企算得过来。
第二层:仓储物流——正在验证。
Agility Robotics的Digit机器人在GXO物流仓库已经运行了18个月,任务成功率98%。2024年6月,GXO签下了业界首份人形机器人多年RaaS(机器人即服务)租赁协议——按月付费,不用一次性买断。亚马逊自研机器人也在履约中心大规模部署,虽然不是人形,但验证了仓储场景的需求刚性。
第三层:家庭消费——还很远。
优必选2026年6月推出消费级人形机器人U1,主打情感陪伴,10天预售近4000台。看起来不错?但U1系列均价76万元一台。宇树G1起售价不到10万,但能力边界也相应缩小。
行业共识是家庭场景要到2030年之后才有实质性渗透。原因很简单:工业场景对机器人的容错率更高——坏了停线,损失可控;家庭场景对安全性和泛化能力的要求高出一个数量级,而当前的VLA模型在非结构化环境中的自主决策能力仍然不足。
优必选自己的数据也说明了这个距离:他们的工业人形机器人,2025年初的工作效率相当于一个工人的30%,年底提升到45%,2026年的目标是突破60%——也就是一台机器人干12小时约等于一个工人干8小时。
离”替代人类”还很远。但”辅助人类”已经开始算得过账。
2026年上半年,460亿的资金涌入具身智能赛道。但钱的流向极度集中。
头部公司千寻智能,4个月完成3轮融资,累计45亿。一家公司半年的融资额,等于赛道尾部200家公司总和的三分之一。Top 20公司拿走了全部资金的七成。
更重要的变化是出资人结构。决定资金流向的不再只是红杉高瓴这些传统财务VC,而是三类新玩家:
互联网巨头——百度投了智平方和北京人形机器人创新中心,美团和滴滴连续跟投地瓜机器人。逻辑很直白:大模型公司需要物理世界的落地场景,本地生活巨头需要无人配送的运力网络。
制造龙头——上汽集团半年内至少投了4家机器人公司,汇川技术密集布局执行器赛道。他们在给供应链”买保险”,确保自己不会在具身智能时代被绕过。
地方国资——数亿元以上的交易中,国资背景机构参与率达42%。北京亦庄、苏州元禾、成都天投,用资本换研发主体落地和税收返投。
一位VC合伙人说了一句话,值得原文引用:「这不是技术迭代的速度,是资本壁垒的构筑速度。头部机构在用金钱买断时间,阻断腰部企业在技术空窗期内追赶的可能性。」
判断一个行业是否真的进入爆发期,不只看顺境时的数据,更看哪些环节可能卡住。
量产良率。丝杠的国产良率目前约60%,目标是85%以上。谐波减速器的寿命与海外巨头仍有差距,预计2027-2028年才能突破。良率上不去,降本就是空中楼阁。
AI泛化能力。VLA模型在工厂这种结构化环境里表现很好——99%的准确率是在重复执行同一类任务时测出来的。但在非结构化环境中(仓库里遇到散落的货物、家庭里遇到跑来跑去的小孩),泛化能力仍然是未解之题。Figure AI创始人Brett Adcock自己都说过,他不会让机器人独自在孩子身边运行。
财务现实。优必选2025年营收20亿,净亏损7亿。应收账款13亿,40%以上账龄超一年——因为大量订单来自政府部门,回款极慢。在建工程17亿,其中约12亿的办公大楼全年新增投入不足6000万,且当年零转固。这是全栈路线的代价:研发费用5亿,烧钱速度快于造血速度。
经济性门槛。行业测算,要替代年薪8到10万的工人,整机采购成本需要控制在15万以内,加上维保、停机、零件更换等隐性成本,真正的经济性门槛可能更高。目前宇树16.7万的单价已经接近这条线,但其他厂商还有距离。
2018年,全球人形机器人融资7亿美元。2025年,43亿美元。翻了6倍。
但更说明问题的数字是出货量:2026年全球预计出货9万台,美国银行预测2030年达到120万台,年复合增长率86%——比早期电动车市场的增速还猛。
这让人想起电动车行业的发展轨迹。2008年,Tesla Roadster售价约10.9万美元,续航约390公里,四年总产量约2500台。到2024年,全球电动车年销量超过1700万台。中间发生了什么?不是电池技术的革命性突破——锂电池的能量密度每年只提升5-8%。真正的驱动力是规模化制造带来的成本坍塌:电池组价格从2010年的超过1100美元/度电降到2023年的139美元。降幅接近90%。
具身智能正在经历同样的曲线。AI大脑解决了”能不能干”的问题,供应链降本解决了”贵不贵”的问题,BMW和特斯拉的工厂数据解决了”有没有人买单”的问题。三个环节第一次同时闭合。
当然,闭合不等于完美。VLA模型需要更强的泛化能力,供应链良率需要提升,整机成本还需要继续下探。但方向已经明确:从实验室到产线的鸿沟,第一次被真实的订单数据和ROI表格填平了。
2018年,Rethink Robotics倒闭时,行业说的是”机器人泡沫破了”。
2026年,宝马工厂里那台重复搬运钣金零件的机器人不会在乎你怎么定义它。它只是在算一笔很简单的账:18个月回本,然后每年净赚9万美元。
资本闻着这个味道来的。
关注 SomethingAI 公众号
每日 AI 趋势日报,深度选题分析,独立开发思考
微信搜索「SomethingAI」关注