浙江人形机器人创新中心联合港中文提出RAM模型,破解三维空间感知难题
2026/05/06 14:21阅读量 2
浙江人形机器人创新中心联合香港中文大学、浙江大学等机构,在《Science Robotics》上发表RAM三维空间理解与操作模型。该模型通过检索增强构建外部三维知识库,提升视觉语言模型的空间感知能力,实现语言指令驱动任务平均成功率89.17%,图像引导操作成功率92%,并可适配GPT、Qwen-VL等主流大模型及人形机器人平台。
近日,浙江人形机器人创新中心联合香港中文大学、浙江大学等机构,在《Science Robotics》上发表了机器人空间智能研究成果——RAM三维空间理解与操作模型。
该模型旨在解决现有视觉语言大模型在三维空间感知方面的不足,通过检索增强技术构建外部三维知识库,实现了物体位姿的精准理解与长程任务规划。
核心数据:
- 语言指令驱动操作平均成功率:89.17%
- 图像引导操作成功率:92%
适配能力:RAM可适配GPT、Qwen-VL等大模型以及各类人形机器人平台。
