别着急宣布VLA已死

2026/05/09 21:39阅读量 2

英伟达科学家范麟熙在红杉AI Ascent大会上称“为VLA默哀”,引发“VLA已死”讨论。但事实并非如此:传统VLA在物理理解上存在短板,但其作为任务理解接口的价值仍在,正被世界模型等技术增强而非替代。机器人发展需要任务理解、状态预测、运动控制和数据闭环多层能力协同,VLA和世界模型并非简单的替代关系。

事件概述

英伟达首席研究科学家范麟熙(Jim Fan)在红杉AI Ascent大会上表示“为VLA默哀”,被媒体概括为“VLA已死”,引发具身智能行业焦虑。但这一判断是对传统VLA范式的反思,并非放弃VLA本身。VLA仍作为机器人任务理解的关键接口存在,但需要与世界模型、仿真等技术重新组合。

核心信息

  • VLA的局限:VLA擅长语义泛化,但无法直接理解物理世界(如摩擦力、物体变形、接触动力学)。其本质是将高维视频降维到语言域进行对齐训练,导致与特定机器人本体强绑定,只能“知其然”地复刻经验,难以处理需物理推理的长尾问题。
  • VLA未被抛弃:英伟达仍在使用Cosmos等世界基础模型为GR00T等机器人模型生成数据,而非放弃VLA。传统“视觉/语言输入→动作输出”的简化范式不够用,但VLA能力本身并未失效。
  • 世界模型的价值与风险:世界模型(如WAM)通过预测未来状态辅助机器人,用途包括数据生成、仿真训练和状态预测。但目前定义混乱(超30家中国公司宣称做世界模型),且存在幻觉风险:物理错误的视频生成可能误导训练。
  • 机器人多层能力架构:一个可部署的机器人需要任务理解(VLA)、状态预测(世界模型)、运动控制、数据闭环四层能力。部分团队尝试将世界模型融入VLA架构,如智平方的GOVLA 1.0(Video2Act)嵌入世界模型完成逻辑推理和行动预测。

值得关注

行业前沿正从单一模型叙事走向分层架构叙事。VLA需要进化而非被埋葬,世界模型需要落地而非被神化。最终竞争焦点在于谁能将任务理解、世界预测、运动控制和真实数据闭环集成为可部署系统,而非争夺流行词。

准备好启动您的定制项目了吗?

现在咨询,即可获得免费的业务梳理与技术架构建议方案。