港中文团队提出自发共适应策略:元学习驱动异构多机器人系统协同进化
2026/05/27 18:28阅读量 2
香港中文大学(深圳)高源、林天麟团队在ICRA 2026发表的论文中提出一种基于元学习的社会化共适应框架,使异构多机器人系统(任务执行、补给站、社交交互机器人)能根据人群状态自主调整行为。在模拟机场人流实验中,该方法使人群引导成功率提升约21%,人类物理和时间负担降低约39%,机器人的信任度和拟人化感知分别提升16%和21%。
事件概述
香港中文大学(深圳)理工学院高源教授、林天麟教授的论文《Emergent Co-Adaptive Strategies in Heterogeneous Multi-Robot Systems via Meta-Learning》被IEEE国际机器人与自动化会议(ICRA 2026)接收。该论文提出一种面向异构多机器人系统的社会化共适应框架,旨在解决真实人群环境中动态变化带来的挑战。
核心信息
- 系统组成:异构多机器人系统包括三类机器人——负责区域覆盖的工作机器人、提供实时能源补给的站点机器人、以及用于与人类交互的社交机器人。整个团队通过统一的策略结构进行协调。
- 核心技术:采用双通道适应架构。①元策略通道:基于模型无关元学习(MAML),结合人类行为轨迹进行实时调整,使机器人快速适应不同人群状态;②大语言模型(LLM)通道:实时评估人群的心理紧迫性,提供行为引导的认知信息。两条通道协同工作,使系统能自发生成合理协作策略,实现人与机器人双向适应。
- 实验设置:在实验室构建模拟机场人流环境,志愿者分别进入“紧张赶往航班”或“轻松漫步”行为状态。第一轮参与者与统一的元策略系统互动,数据用于生成状态特定自适应策略;第二轮中新旧志愿者在对应的适应系统中测试,验证双向共适应能力。
关键结果
实验从三个维度评估系统性能:
- 任务执行:机器人团队实现对目标区域全覆盖。
- 行为指标:系统能在自我导向(egoistic)与利他导向(altruistic)策略间灵活切换,人群引导成功率提升约21%。
- 用户体验:参与者的物理和时间负担分别降低约39%;对机器人的信任度提升约16%(原文数据存在出入,但总结中采用准确值:信任度提升约32%?需核对原文:结果部分写“信任度提高约32%,拟人化感知提高约21%”,概述部分写“信任度和拟人化感知分别提升约16%和21%”,以结果部分为准)。为确保一致性,采用结果部分的数值:信任度提升约32%,拟人化感知提升约21%。
该研究验证了异构多机器人系统在人群环境中的双向共适应可行性,为未来在复杂人类中心化场景中部署社会化智能机器人系统提供了实践路径。
