图灵奖得主萨顿与他山科技共建“机器人幼儿园”：让机器人在真实试错中持续学习

2026/05/26 18:29阅读量 2

图灵奖得主、强化学习奠基人理查德·萨顿与他山科技于2026年5月正式签约，合作推进“机器人幼儿园”项目。该项目旨在通过触觉感知与真实物理环境交互，让机器人在模仿之外获得“第一人称经验”，在试错中自主进化。他山科技自研的触觉传感器已占据人形机器人触觉传感器赛道超80%市场份额，并在小龙虾加工等场景实现商业化。

事件概述

2026年5月，强化学习奠基人、图灵奖得主理查德·萨顿与他山科技在加拿大正式签约，启动“机器人幼儿园”项目。该合作以五年为周期，目标是为具身智能找到基于真实经验流的持续学习方法论。萨顿在其2025年4月联合发表的文章《欢迎来到经验时代》中指出，新一代智能体需拥有像人类一样在长时间尺度上推进的经验流，在真实物理反馈中自我进化。他山科技CEO马扬表示，双方理念契合——机器人应通过接触、触觉反馈和试错来理解任务边界，而非仅依赖静态模仿。

核心信息

技术基础：他山科技自研触觉传感器力分辨率达0.01N，可实现三维力、材质识别、接近觉等多维信号同步解析。2025年，公司占据人形机器人触觉传感器赛道超80%市场份额。
项目形态：“机器人幼儿园”整合真实物理环境、仿真环境、多台机器人本体、触觉与多模态感知设备、任务课程及评测机制，让机器人在反复接触、尝试、失败和修正中形成可训练的经验。
商业化落地：在潜江小龙虾加工场景中，他山科技通过模仿学习加强化学习反复自主练习，将剥虾成功率提升至95%以上，并已与头部小龙虾加工企业签约100台智能化剥虾设备。
未来规划：项目初期以同构本体训练为主，后期将向行业开放，吸引全球学术界和产业界共同探索具身智能持续学习方法。

值得关注

萨顿的理论（经验流）与他山科技的触觉感知工程化能力结合，试图突破当前具身智能依赖静态数据集模仿的瓶颈。萨顿认为，触觉是物理交互中最核心的感知通道，此前具身智能长期缺失这一“传入神经”。他山科技CEO马扬强调，只有通过足够多的真实试错，机器人才能理解任务边界和安全性，当前行业硬件已达60分，但推理和持续学习能力欠缺。双方计划通过真实环境中的训练，避免“回避变量”的实验室路径，并期望推动整个行业共同探索。

阅读原文详情

事件概述

核心信息

值得关注

准备好启动您的定制项目了吗？