智元首席科学家罗剑岚:具身智能的Scaling Law,要在真实部署闭环中验证
2026/06/17 14:14阅读量 1
上海创智学院副教授、智元机器人首席科学家罗剑岚在专访中指出,具身智能不能简单照搬大语言模型的Scaling Law,当前行业的核心矛盾是真机数据不足,以及模型训练与真实部署的割裂。他认为,机器人真正的突破在于构建“部署-数据-迭代”的闭环,并在未来12-18个月内,有团队能在半结构化场景中率先跑通数据飞轮。
事件概述
在36氪的专访中,上海创智学院副教授、智元机器人首席科学家罗剑岚(前伯克利博士、Google X与DeepMind研究科学家)分享了其对具身智能行业现状的观察和判断。
核心观点
- 具身智能不能照搬NLP的Scaling Law:离线Loss下降不必然对应真实部署成功率提升。机器人的金标准是真实场景的部署效能,而非数据规模或Loss值。
- 行业多在微调而非预训练:当前多数所谓的“机器人基础模型”实际是在已有开源底座上做任务适配或“中训练”(Mid-training),并非真正由大规模、异构、真实交互数据驱动的预训练阶段。
- 数据飞轮是关键:真正的突破点在于,随着部署机器人台数增加,新场景适配成本持续下降,模型迭代效率持续提升。目前学界和业界无法精确计算达到该临界点所需的数据量级。
- 未来12-18个月是窗口期:有团队能在便利店、商超、仓储等半结构化场景中率先跑通“部署—数据—迭代”的正向循环,将建立先发优势。
技术布局
罗剑岚回国后主要推动三个技术支点:
- SOP(可扩展在线后训练):解决大规模机器人在线后训练所需的基础设施问题,包括低延迟数据回流、云端计算等。
- LWD(部署中学习):打破“训练—部署”的割裂状态,让机器人能在实际场景中持续进化。
- τ0-WM世界模型:动作条件的预测模型(action-conditioned predictive model),在机器人执行动作前,评估不同候选动作可能带来的未来后果,帮助选择更可靠的动作,而非仅生成视频。
关于VLA与世界模型
- 罗剑岚不认同“VLA已死”的观点,认为语言(Language)在复杂任务拆解与长程推理中不可或缺。
- 未来真正的突破在于VLA与世界模型的融合:用VLA处理语言驱动的宏观规划,用世界模型保障物理执行的精准度。
数据与部署
- 当前真机交互数据仍然稀缺,替代数据方案(如第一视角数据)在小数据规模下有用,但等到真实部署数据足够多后,其价值会被重新评估。
- 硬件已不是核心瓶颈,真正的短板在于从模型、数据到整个链路的持续迭代能力,即闭环能力。
