具身智能新范式：英伟达开源机器人技能库ASPIRE，Jim Fan称训练思路变了

2026/07/01 17:33阅读量 6

英伟达开源机器人技能库ASPIRE，通过让机器人反复执行任务、分析失败并修复代码，将验证过的经验沉淀为可复用技能。该方法将训练从梯度下降变为技能打磨，使机器人随技能库积累而持续进步。在Robosuite双臂交接任务中成功率从20%提升至92%，泛化测试中技能库越厚新任务成功率越高。

事件概述

英伟达GEAR团队推出ASPIRE（Agentic Skill Programming through Iterative Robot Exploration），一个开源的机器人技能库框架。ASPIRE让机器人通过“写代码→执行→看轨迹→修程序→存技能”的循环持续学习，将训练产物从模型权重转变为不断扩展的技能库。Jim Fan称这代表一种全新的持续学习范式：训练从梯度下降变成技能打磨（Skill Refinement），分布式训练变成多个Agent各自练习不同技能并汇总经验。

核心方法

ASPIRE基于Code as Policy范式，让大模型（如GPT/Claude）编写机器人控制程序并调用感知、规划等API。与传统方法不同，ASPIRE在机器人执行失败后，不仅记录错误，还会分析多模态执行轨迹（感知结果、运动规划、抓取过程等），由Agent自动迭代修复程序。成功后，系统将验证过的修复经验总结为一条Skill存入Skill Library。例如，当机器人因规划器目标点落在障碍物缓冲区而无法接近目标时，Agent分析后生成新Skill：从45°、90°、180°等不同角度重新接近，直到找到无碰撞路径。该Skill可复用至其他相似场景。

ASPIRE采用三阶段pipeline：

Robot Execution Engine：记录每次感知、规划、抓取等操作的输入/输出、视觉证据和错误日志。
Skill Library：Agent修复程序后，将经验沉淀为可复用的知识条目（如SAM3文本提示写法、桌边物体多角度接近策略等）。
Evolutionary Search：系统生成多条候选控制程序，让它们在执行环境中跑，根据幸存程序和失败轨迹继续迭代。

实验结果

论文在LIBERO-90、Robosuite、BEHAVIOR-1K三个基准上测试。在Robosuite双臂物体交接任务中，ASPIRE将成功率从20%提升至92%。在泛化测试中，先在LIBERO-90积累Skill Library，再直接迁移到未见过的LIBERO-Pro Long长任务，不更新技能库。随着技能库越来越丰富，机器人成功率从几乎为0提升至31%。

该项目由GEAR团队完成，主要作者包括Runyu Lu（密歇根大学博士二年级，GEAR实习）、Yuubo Wu（UIUC）、Ethan Kou（UC Berkeley本科）等。Jim Fan、朱玉可、Guanzhi Wang、石冠亚均在作者名单中。

阅读原文详情

事件概述

核心方法

实验结果

准备好启动您的定制项目了吗？