具身智能融资转向“机器人大脑”:VLA、世界模型与融合路线谁将胜出?
2026/07/02 20:43阅读量 3
2026年上半年,具身智能行业融资重心从“造机器人本体”转向“机器人大脑”。VLA(视觉-语言-动作)模型、世界模型及其融合路线成为焦点,多家公司如自变量机器人(估值超200亿元)、智平方(估值超200亿元)、极佳视界(3个月累计约35亿元)等获得巨额融资。资本正在押注能够实现可泛化、可学习、可持续进化的具身基座模型。
2025年后,具身智能一度被认为热度已过,但2026年上半年关键词变为“机器人大脑”。VLA、世界模型、具身基座模型、数据闭环频繁出现在融资和路演中。资本不再只奖励“造出一台机器人”,而是追问谁能将机器人变成可泛化、可学习、可持续进化的智能体。
融资动态概览
- 自变量机器人:6月底披露两个月内连续完成B轮至C轮四轮融资并全部交割,投后估值超200亿元。4月发布基于“世界统一模型”架构的WALL-B,6月发布以事件中心为特征的WALL-WM。
- 智平方:2月完成超10亿元B轮融资,6月29日完成近50亿元系列融资,估值超200亿元。代表产品为GOVLA全域VLA大模型和AlphaBot系列机器人。
- 极佳视界:3个月内连续完成Pre-B轮(近10亿元)、B1轮(15亿元)、B2轮(10亿元),合计约35亿元。核心为世界模型平台GigaWorld、通用具身大脑GigaBrain。
- 千寻智能:6月宣布完成15亿元A+轮融资,3个月内累计超45亿元。自研具身基座模型Spirit v1.6在RoboArena基准测试中登顶。
- 银河通用:3月完成25亿元新一轮融资,此前2025年末完成超3亿美元融资。推出GraspVLA、GroceryVLA等模型,布局零售、工业、仓储物流、医疗康养场景。
- 灵初智能:3月披露完成天使轮和Pre-A轮合计20亿元融资,以端到端VLA模型为核心,推进物流场景应用。
- 星源智:由北京智源人工智能研究院孵化,定位具身大脑和世界模型,不直接做本体。6月披露完成新一轮融资,成立10个月累计融资10亿元。
- 苏度科技:4月发布Sudo R1,强调3D世界模型与强化学习一体化,通过仿真训练实现zero-shot操作,估值突破20亿美元。
- 星海图:2月完成近10亿元B轮,4月完成近20亿元B+轮,估值超200亿元。推出G0 Plus通用具身智能基础模型及R1/R1 Pro机器人。
- 至简动力:由自动驾驶团队转向具身智能,3月首次官宣融资:成立半年不到完成5轮,累计20亿元。提出LaST0基座模型,融合世界模型物理预测能力和VLA快慢思维。
- 它石智航:4月完成4.55亿美元Pre-A轮融资,刷新国内具身智能单轮融资纪录。围绕通用具身大模型AWE 3.0、真实世界多模态数据集展开。
- 无界动力:6月26日宣布完成超2亿美元天使轮融资,Pre-A轮近2亿美元接近完成,资金用于具身通用大脑研发。
- 智元机器人:4月发布Genie Operator-2,围绕AGIBOT WORLD 2026数据集、Genie Sim 3.0仿真平台、世界模拟器构建开放生态。
三条主要技术路线
- VLA(视觉-语言-动作)模型:让机器人看到环境、理解指令并输出动作。离产品化最近,容易落地物流、制造、零售、家庭服务等场景。但长程任务和多步规划中容易遇到瓶颈。
- 世界模型:在行动前预测动作结果,用于规划、仿真训练、合成数据生成。离收入更远,验证标准尚不清晰。代表公司:极佳视界、星源智、苏度科技。
- VLA+世界模型融合:VLA负责执行,世界模型负责预测和规划。NVIDIA的Cosmos平台也强调World Action Model。国内代表:自变量机器人、星海图、至简动力、它石智航。
资本重估的原因
- 机器人本体趋于同质化,仅靠硬件参数难以支撑长期估值。
- 真实机器人数据采集成本高昂,行业寻求遥操作、仿真合成、世界模型生成等替代方案。
- 大模型行业需要新增长故事,具身智能提供了从生成文本到改变物理世界的想象空间。
当前挑战
- VLA路线真实场景泛化难,Demo可完成一个任务,但无法确保连续稳定工作8小时。
- 世界模型路线验证标准不足,视频预测逼真不等于物理预测准确。
- 融合路线系统复杂度高,需要同时具备模型、数据、仿真、本体和工程落地能力。
这轮融资实质是行业路线投票:未来的机器人公司核心资产是硬件本体、场景数据还是可迁移的机器人大脑?目前答案正向后者倾斜,但最终形态尚无定论。
