银河通用发布人形机器人通用小脑大模型AstraBrain-WBC 0.5，零样本泛化成功率92.58%

2026/06/22 17:48阅读量 2

银河通用联合研究团队在CVPR 2026发布全球首个人形通用小脑GPT基座大模型AstraBrain-WBC 0.5。该模型引入20亿帧人类行为数据，采用Transformer架构与双阶段训练，真机零样本泛化成功率92.58%，在多项指标上超越SONIC等方法，验证了人形运动控制领域的Scaling Law。

事件概述

银河通用联合研究团队在美国科罗拉多州丹佛会议中心举行的CVPR 2026上发布了全球首个人形通用小脑GPT基座大模型——AstraBrain-WBC 0.5。该模型通过引入海量人类行为数据、Transformer架构及双阶段训练，实现了对未见动作的零样本泛化跟踪，并在多项指标上超越现有最优方法（SONIC、TWIST、Any2Track等）。

核心信息

数据规模：模型基于20亿帧（约20亿token）人类动作数据训练，是此前常用数据集AMASS（约720万帧）的200倍以上，参数量达80.4M。
性能表现：在真机实测中，机器人可零样本完成武术踢腿、篮球运球、华尔兹等高动态动作，无需任务微调。在四个未见舞蹈动作的跟踪误差对比中，MPJPE、MPJVE等指标显著优于SONIC等方案。当模型参数扩展至80.4M时，零样本泛化成功率达92.58%，而传统三层MLP仅为76.89%。
技术方案：
1. 数据基建：整合AMASS、LAFAN1、MotionMillion、Motion-X++及超1000小时内部采集数据，通过谐波运动嵌入（HME）聚类为约300个运动簇，统一重定向至宇树G1的29自由度关节空间。
2. 架构升级：采用因果Transformer（Causal Transformer）替代浅层MLP，利用其长时序上下文捕捉能力，实现全局动作连贯性。
3. 双阶段训练：第一阶段为每个运动簇训练PPO专家（共约300个），消耗15000 GPU小时中的75%；第二阶段使用DAgger算法将专家知识蒸馏到单一模型中，消除分布偏移，兼顾高性能与通用性。
工程优化：通过ONNX导出、TensorRT编译、C++流式通道等，在单张RTX 4090上将端到端推理延迟压至1.5毫秒以下，低于传统方案TWIST的2.79—3.32毫秒。

值得关注

范式扩展：该工作基于2024年伯克利团队“Humanoid Locomotion as Next Token Prediction”的思路，将从单一行走扩展到全身运动（舞蹈、武术、搬运等），实现从“只会走”到“全身动”的跨越。
产业意义：AstraBrain-WBC 0.5作为预训练运控基座，开源了代码和部分工具，允许研究者直接零样本跟踪新动作，大幅降低人形机器人运动控制的研究门槛。

阅读原文详情

事件概述

核心信息

值得关注

准备好启动您的定制项目了吗？