地平线开源4亿参数人形机器人“小脑”大模型HoloMotion-1
2026/05/19 18:14阅读量 6
地平线发布并开源4亿参数机器人小脑大模型HoloMotion-1,面向人形机器人全身控制。模型采用MoE-Transformer架构,通过稀疏激活和KV-cache推理,端侧可达约300FPS实时运行,已实现从视频、动捕等数据学习任意姿态的motion tracking能力。
事件概述
地平线正式发布并开源 HoloMotion-1,一个 4 亿参数的人形机器人“小脑”大模型,专注于全身运动控制。该模型结合 MoE 稀疏激活与 KV-cache 推理机制,在保持参数规模的同时降低单步推理开销,实现端侧约 300FPS 的实时运行能力,远高于常见的 50Hz 控制频率要求。
核心信息
- 模型架构:采用 MoE-Transformer policy,以参考动作和机器人本体观测为输入,通过 reference-conditioned router 进行稀疏专家路由,再经 Transformer 主干和 action head 输出全身控制动作。
- 推理性能:在报告设置下推理延迟降至 3.32ms,对应约 300FPS,可满足真实机器人高频控制需求。
- 当前能力:重点解决“模仿任意姿态”(Imitate Any Pose),即通用 motion tracking 任务。机器人可从互联网视频、光学动捕、VR 遥操作、惯性动捕等多来源数据中学习复杂全身姿态,并迁移到真实机器人上稳定执行。
- 工具链:提供从环境配置到真实机器人部署的端到端工具链,支持基于自定义数据重新训练或直接使用预训练模型进行部署验证。
值得关注
HoloMotion-1 是 HoloMotion 技术路线的第一阶段。未来演进方向包括:
- 遵循任意指令:支持 VR、遥控器、语言等模态命令,从“模仿动作”走向“根据指令生成动作”。
- 跨越任意地形:结合视觉、激光雷达、世界模型,实现楼梯、坡道等复杂环境稳定移动。
- 控制任意本体:通过 body encoder 和 body embedding 适配不同尺寸、自由度和结构的人形机器人。
