银河通用发布人形机器人通用小脑大模型AstraBrain-WBC 0.5,零样本泛化成功率92.58%
2026/06/22 17:48阅读量 2
银河通用联合研究团队在CVPR 2026发布全球首个人形通用小脑GPT基座大模型AstraBrain-WBC 0.5。该模型引入20亿帧人类行为数据,采用Transformer架构与双阶段训练,真机零样本泛化成功率92.58%,在多项指标上超越SONIC等方法,验证了人形运动控制领域的Scaling Law。
事件概述
银河通用联合研究团队在美国科罗拉多州丹佛会议中心举行的CVPR 2026上发布了全球首个人形通用小脑GPT基座大模型——AstraBrain-WBC 0.5。该模型通过引入海量人类行为数据、Transformer架构及双阶段训练,实现了对未见动作的零样本泛化跟踪,并在多项指标上超越现有最优方法(SONIC、TWIST、Any2Track等)。
核心信息
- 数据规模:模型基于20亿帧(约20亿token)人类动作数据训练,是此前常用数据集AMASS(约720万帧)的200倍以上,参数量达80.4M。
- 性能表现:在真机实测中,机器人可零样本完成武术踢腿、篮球运球、华尔兹等高动态动作,无需任务微调。在四个未见舞蹈动作的跟踪误差对比中,MPJPE、MPJVE等指标显著优于SONIC等方案。当模型参数扩展至80.4M时,零样本泛化成功率达92.58%,而传统三层MLP仅为76.89%。
- 技术方案:
- 数据基建:整合AMASS、LAFAN1、MotionMillion、Motion-X++及超1000小时内部采集数据,通过谐波运动嵌入(HME)聚类为约300个运动簇,统一重定向至宇树G1的29自由度关节空间。
- 架构升级:采用因果Transformer(Causal Transformer)替代浅层MLP,利用其长时序上下文捕捉能力,实现全局动作连贯性。
- 双阶段训练:第一阶段为每个运动簇训练PPO专家(共约300个),消耗15000 GPU小时中的75%;第二阶段使用DAgger算法将专家知识蒸馏到单一模型中,消除分布偏移,兼顾高性能与通用性。
- 工程优化:通过ONNX导出、TensorRT编译、C++流式通道等,在单张RTX 4090上将端到端推理延迟压至1.5毫秒以下,低于传统方案TWIST的2.79—3.32毫秒。
值得关注
- 范式扩展:该工作基于2024年伯克利团队“Humanoid Locomotion as Next Token Prediction”的思路,将从单一行走扩展到全身运动(舞蹈、武术、搬运等),实现从“只会走”到“全身动”的跨越。
- 产业意义:AstraBrain-WBC 0.5作为预训练运控基座,开源了代码和部分工具,允许研究者直接零样本跟踪新动作,大幅降低人形机器人运动控制的研究门槛。
