具身智能新范式:英伟达开源机器人技能库ASPIRE,Jim Fan称训练思路变了

2026/07/01 17:33阅读量 6

英伟达开源机器人技能库ASPIRE,通过让机器人反复执行任务、分析失败并修复代码,将验证过的经验沉淀为可复用技能。该方法将训练从梯度下降变为技能打磨,使机器人随技能库积累而持续进步。在Robosuite双臂交接任务中成功率从20%提升至92%,泛化测试中技能库越厚新任务成功率越高。

事件概述

英伟达GEAR团队推出ASPIRE(Agentic Skill Programming through Iterative Robot Exploration),一个开源的机器人技能库框架。ASPIRE让机器人通过“写代码→执行→看轨迹→修程序→存技能”的循环持续学习,将训练产物从模型权重转变为不断扩展的技能库。Jim Fan称这代表一种全新的持续学习范式:训练从梯度下降变成技能打磨(Skill Refinement),分布式训练变成多个Agent各自练习不同技能并汇总经验。

核心方法

ASPIRE基于Code as Policy范式,让大模型(如GPT/Claude)编写机器人控制程序并调用感知、规划等API。与传统方法不同,ASPIRE在机器人执行失败后,不仅记录错误,还会分析多模态执行轨迹(感知结果、运动规划、抓取过程等),由Agent自动迭代修复程序。成功后,系统将验证过的修复经验总结为一条Skill存入Skill Library。例如,当机器人因规划器目标点落在障碍物缓冲区而无法接近目标时,Agent分析后生成新Skill:从45°、90°、180°等不同角度重新接近,直到找到无碰撞路径。该Skill可复用至其他相似场景。

ASPIRE采用三阶段pipeline:

  • Robot Execution Engine:记录每次感知、规划、抓取等操作的输入/输出、视觉证据和错误日志。
  • Skill Library:Agent修复程序后,将经验沉淀为可复用的知识条目(如SAM3文本提示写法、桌边物体多角度接近策略等)。
  • Evolutionary Search:系统生成多条候选控制程序,让它们在执行环境中跑,根据幸存程序和失败轨迹继续迭代。

实验结果

论文在LIBERO-90、Robosuite、BEHAVIOR-1K三个基准上测试。在Robosuite双臂物体交接任务中,ASPIRE将成功率从20%提升至92%。在泛化测试中,先在LIBERO-90积累Skill Library,再直接迁移到未见过的LIBERO-Pro Long长任务,不更新技能库。随着技能库越来越丰富,机器人成功率从几乎为0提升至31%。

该项目由GEAR团队完成,主要作者包括Runyu Lu(密歇根大学博士二年级,GEAR实习)、Yuubo Wu(UIUC)、Ethan Kou(UC Berkeley本科)等。Jim Fan、朱玉可、Guanzhi Wang、石冠亚均在作者名单中。

准备好启动您的定制项目了吗?

现在咨询,即可获得免费的业务梳理与技术架构建议方案。