别着急宣布VLA已死

2026/05/09 21:39阅读量 2

英伟达科学家范麟熙在红杉AI Ascent大会上称“为VLA默哀”，引发“VLA已死”讨论。但事实并非如此：传统VLA在物理理解上存在短板，但其作为任务理解接口的价值仍在，正被世界模型等技术增强而非替代。机器人发展需要任务理解、状态预测、运动控制和数据闭环多层能力协同，VLA和世界模型并非简单的替代关系。

事件概述

英伟达首席研究科学家范麟熙（Jim Fan）在红杉AI Ascent大会上表示“为VLA默哀”，被媒体概括为“VLA已死”，引发具身智能行业焦虑。但这一判断是对传统VLA范式的反思，并非放弃VLA本身。VLA仍作为机器人任务理解的关键接口存在，但需要与世界模型、仿真等技术重新组合。

核心信息

VLA的局限：VLA擅长语义泛化，但无法直接理解物理世界（如摩擦力、物体变形、接触动力学）。其本质是将高维视频降维到语言域进行对齐训练，导致与特定机器人本体强绑定，只能“知其然”地复刻经验，难以处理需物理推理的长尾问题。
VLA未被抛弃：英伟达仍在使用Cosmos等世界基础模型为GR00T等机器人模型生成数据，而非放弃VLA。传统“视觉/语言输入→动作输出”的简化范式不够用，但VLA能力本身并未失效。
世界模型的价值与风险：世界模型（如WAM）通过预测未来状态辅助机器人，用途包括数据生成、仿真训练和状态预测。但目前定义混乱（超30家中国公司宣称做世界模型），且存在幻觉风险：物理错误的视频生成可能误导训练。
机器人多层能力架构：一个可部署的机器人需要任务理解（VLA）、状态预测（世界模型）、运动控制、数据闭环四层能力。部分团队尝试将世界模型融入VLA架构，如智平方的GOVLA 1.0（Video2Act）嵌入世界模型完成逻辑推理和行动预测。

值得关注

行业前沿正从单一模型叙事走向分层架构叙事。VLA需要进化而非被埋葬，世界模型需要落地而非被神化。最终竞争焦点在于谁能将任务理解、世界预测、运动控制和真实数据闭环集成为可部署系统，而非争夺流行词。

阅读原文详情

事件概述

核心信息

值得关注

准备好启动您的定制项目了吗？