图灵奖得主萨顿与他山科技共建“机器人幼儿园”:让机器人在真实试错中持续学习
2026/05/26 18:29阅读量 2
图灵奖得主、强化学习奠基人理查德·萨顿与他山科技于2026年5月正式签约,合作推进“机器人幼儿园”项目。该项目旨在通过触觉感知与真实物理环境交互,让机器人在模仿之外获得“第一人称经验”,在试错中自主进化。他山科技自研的触觉传感器已占据人形机器人触觉传感器赛道超80%市场份额,并在小龙虾加工等场景实现商业化。
事件概述
2026年5月,强化学习奠基人、图灵奖得主理查德·萨顿与他山科技在加拿大正式签约,启动“机器人幼儿园”项目。该合作以五年为周期,目标是为具身智能找到基于真实经验流的持续学习方法论。萨顿在其2025年4月联合发表的文章《欢迎来到经验时代》中指出,新一代智能体需拥有像人类一样在长时间尺度上推进的经验流,在真实物理反馈中自我进化。他山科技CEO马扬表示,双方理念契合——机器人应通过接触、触觉反馈和试错来理解任务边界,而非仅依赖静态模仿。
核心信息
- 技术基础:他山科技自研触觉传感器力分辨率达0.01N,可实现三维力、材质识别、接近觉等多维信号同步解析。2025年,公司占据人形机器人触觉传感器赛道超80%市场份额。
- 项目形态:“机器人幼儿园”整合真实物理环境、仿真环境、多台机器人本体、触觉与多模态感知设备、任务课程及评测机制,让机器人在反复接触、尝试、失败和修正中形成可训练的经验。
- 商业化落地:在潜江小龙虾加工场景中,他山科技通过模仿学习加强化学习反复自主练习,将剥虾成功率提升至95%以上,并已与头部小龙虾加工企业签约100台智能化剥虾设备。
- 未来规划:项目初期以同构本体训练为主,后期将向行业开放,吸引全球学术界和产业界共同探索具身智能持续学习方法。
值得关注
萨顿的理论(经验流)与他山科技的触觉感知工程化能力结合,试图突破当前具身智能依赖静态数据集模仿的瓶颈。萨顿认为,触觉是物理交互中最核心的感知通道,此前具身智能长期缺失这一“传入神经”。他山科技CEO马扬强调,只有通过足够多的真实试错,机器人才能理解任务边界和安全性,当前行业硬件已达60分,但推理和持续学习能力欠缺。双方计划通过真实环境中的训练,避免“回避变量”的实验室路径,并期望推动整个行业共同探索。
