卧安机器人发布OneModel 1.7:隐式通路连接世界模型与动作模型,LIBERO成功率99%
卧安机器人发布世界动作模型OneModel 1.7 FrontoStria-RL,其RL-LWAM架构通过Predictive Policy Latent隐式传导机制连接世界模型与动作执行模块。在LIBERO评测上平均成功率99%,真机日常操作成功率99%,高精度任务97%。该模型被高盛报告提及为推进VLA+World Model融合方向的代表之一。
事件概述
2026年5月20日,卧安机器人(OneRobotics,6600.HK)正式发布自研世界动作模型OneModel 1.7 FrontoStria-RL。该模型通过名为Predictive Policy Latent(PPL)的隐式传导通路,将世界模型对场景的理解直接传导至动作执行模块,不依赖显式的中间图像或坐标传递。相关核心论文已于5月12日在arxiv公开。
核心架构:RL-LWAM
OneModel 1.7采用RL-LWAM(RL-Latent World Action Model)架构,由三大核心模块构成:
- World Model:负责对环境状态、物体关系、空间结构及动态变化建立预测能力,输出结构化场景理解。
- Predictive Policy Latent:将World Model的理解转化为潜在空间中的策略表征,传递给下游模块。训练时利用未来信息引导动作决策方向,部署时仅依赖当前观测,信息密度高、推理快、无生成式噪声。
- Understand Expert + Skill 体系:将场景理解与任务指令对接,分解子技能并实现跨任务复用。
- Action Expert + MCF-Proto:MCF-Proto(Motion-Centric Action Frame)围绕任务相关局部运动结构组织动作原型,降低对相机视角和机器人初始位姿的敏感度。在LIBERO-plus扰动测试中,相机视角变化下成功率69.7%,机器人位姿偏差下66.0%,分别领先最强基线3.3和15.7个百分点。
此外,架构包含RL闭环和Success Memory机制:部署后持续利用真实反馈优化模型,并存储成功经验轨迹辅助决策。在SimplerEnv仿真中,Retrieve-then-Steer策略将CogACT平均成功率从75.8%提升至79.5%。
评测数据
- LIBERO标准测试:平均成功率99%,领先π0.5、GR00T-N1.5、OpenVLA-OFT等主流模型。
- 真机端到端验证:日常操作任务成功率约99%,高精度任务(拔插试管、倒咖啡豆等)约97%。
- 乒乓球对打:高动态、实时对抗场景下接球成功率达91.2%,验证了World Model与Action Expert在实时响应中的协同。
行业背景与数据布局
高盛于5月26日发布的人形机器人中期盘点报告中,将卧安机器人列为4家“正在推进VLA+World Model融合方向”的公司之一,并直接提及OneModel 1.7的latent world action model架构。报告指出行业正从单一VLA框架转向VLA/VTLA与World Model融合的多模态执行栈,真实世界数据是首要瓶颈。
2026年5月,卧安机器人中标深圳市“AI生态创新社区设备购置与场地搭建项目”,金额4495.32万元,建设具身智能数据全链条服务中心,涵盖onero H1机器人、UMI数据采集终端及家庭、康养、零售等真实场景。这是目前业内规模最大的聚焦家庭场景的具身智能数据采集中心项目,旨在获取真实操作轨迹、力觉反馈等数据以驱动RL闭环和Success Memory进化。
一脑多形策略
OneModel作为跨形态AI底座,支撑卧安的三类产品:家庭服务机器人onero H1、网球机器人Acemate、陪伴机器人Kata Friends。不同形态机器人共享World Model的场景理解能力、任务分解能力和经验积累。例如Kata Friends的模型基于onero H1的OneModel蒸馏而来。卧安产品覆盖超90个国家,服务超500万家庭,多形态产品产生的真实交互数据为模型迭代提供多样化训练信号。
关键结论
OneModel 1.7的核心贡献在于通过Predictive Policy Latent隐式通路解决了世界模型到动作执行的传导断层。该方案在评测和真机部署中验证了有效性,但仍有待更大规模真实家庭场景的持续验证。随着数据基础设施的启动,RL闭环和Success Memory的进化飞轮有望加速运转。
