智元首席科学家罗剑岚：具身智能的Scaling Law，要在真实部署闭环中验证

2026/06/17 14:14阅读量 1

上海创智学院副教授、智元机器人首席科学家罗剑岚在专访中指出，具身智能不能简单照搬大语言模型的Scaling Law，当前行业的核心矛盾是真机数据不足，以及模型训练与真实部署的割裂。他认为，机器人真正的突破在于构建“部署-数据-迭代”的闭环，并在未来12-18个月内，有团队能在半结构化场景中率先跑通数据飞轮。

事件概述

在36氪的专访中，上海创智学院副教授、智元机器人首席科学家罗剑岚（前伯克利博士、Google X与DeepMind研究科学家）分享了其对具身智能行业现状的观察和判断。

核心观点

具身智能不能照搬NLP的Scaling Law：离线Loss下降不必然对应真实部署成功率提升。机器人的金标准是真实场景的部署效能，而非数据规模或Loss值。
行业多在微调而非预训练：当前多数所谓的“机器人基础模型”实际是在已有开源底座上做任务适配或“中训练”（Mid-training），并非真正由大规模、异构、真实交互数据驱动的预训练阶段。
数据飞轮是关键：真正的突破点在于，随着部署机器人台数增加，新场景适配成本持续下降，模型迭代效率持续提升。目前学界和业界无法精确计算达到该临界点所需的数据量级。
未来12-18个月是窗口期：有团队能在便利店、商超、仓储等半结构化场景中率先跑通“部署—数据—迭代”的正向循环，将建立先发优势。

技术布局

罗剑岚回国后主要推动三个技术支点：

SOP（可扩展在线后训练）：解决大规模机器人在线后训练所需的基础设施问题，包括低延迟数据回流、云端计算等。
LWD（部署中学习）：打破“训练—部署”的割裂状态，让机器人能在实际场景中持续进化。
τ0-WM世界模型：动作条件的预测模型（action-conditioned predictive model），在机器人执行动作前，评估不同候选动作可能带来的未来后果，帮助选择更可靠的动作，而非仅生成视频。

关于VLA与世界模型

罗剑岚不认同“VLA已死”的观点，认为语言（Language）在复杂任务拆解与长程推理中不可或缺。
未来真正的突破在于VLA与世界模型的融合：用VLA处理语言驱动的宏观规划，用世界模型保障物理执行的精准度。

数据与部署

当前真机交互数据仍然稀缺，替代数据方案（如第一视角数据）在小数据规模下有用，但等到真实部署数据足够多后，其价值会被重新评估。
硬件已不是核心瓶颈，真正的短板在于从模型、数据到整个链路的持续迭代能力，即闭环能力。

阅读原文详情

事件概述

核心观点

技术布局

关于VLA与世界模型

数据与部署

准备好启动您的定制项目了吗？