浙江人形机器人创新中心联合港中文提出RAM模型,破解三维空间感知难题

2026/05/06 14:21阅读量 2

浙江人形机器人创新中心联合香港中文大学、浙江大学等机构,在《Science Robotics》上发表RAM三维空间理解与操作模型。该模型通过检索增强构建外部三维知识库,提升视觉语言模型的空间感知能力,实现语言指令驱动任务平均成功率89.17%,图像引导操作成功率92%,并可适配GPT、Qwen-VL等主流大模型及人形机器人平台。

近日,浙江人形机器人创新中心联合香港中文大学、浙江大学等机构,在《Science Robotics》上发表了机器人空间智能研究成果——RAM三维空间理解与操作模型。

该模型旨在解决现有视觉语言大模型在三维空间感知方面的不足,通过检索增强技术构建外部三维知识库,实现了物体位姿的精准理解与长程任务规划。

核心数据

  • 语言指令驱动操作平均成功率:89.17%
  • 图像引导操作成功率:92%

适配能力:RAM可适配GPT、Qwen-VL等大模型以及各类人形机器人平台。

准备好启动您的定制项目了吗?

现在咨询,即可获得免费的业务梳理与技术架构建议方案。