Genesis AI 发布 GENE-26.5 基础模型:单个模型实现单手打蛋、解魔方、弹钢琴
2026/05/07 14:43阅读量 10
Genesis AI 在沉寂近一年后发布首个机器人基础模型 GENE-26.5,展示单手打蛋、解魔方、弹钢琴等十多项复杂操作。模型、灵巧手、控制栈、仿真器均为自研,单模型在大多数任务上只需不到1小时训练数据,背后是1.05亿美元种子轮支持。
事件概述
Genesis AI 于 2026 年 5 月 7 日发布首个机器人基础模型 GENE-26.5,并公开一系列机器人操作演示。该模型在同一个权重下完成打鸡蛋、拧试管盖、弹钢琴、解魔方、切番茄等复杂任务,全程自主运行、1 倍速。前 1x 副总裁 Eric Jang 和宋舒然教授等业内专家转发赞叹。
核心信息
- 模型架构:GENE-26.5 采用 flow matching 对语言、视觉、触觉、动作等多模态数据进行联合轨迹建模,支持异构数据一起训练。同一个模型处理控制、状态估计、逆动力学等所有任务,缺失模态通过去噪推断。除钢琴用 RL 单独训练外,其余技能共享同一套权重。
- 硬件系统:配备 20 个可反向驱动自由度的灵巧手(Genesis Hand 1.0),与人手大小 1:1,覆盖柔软材料。自研中间件运行在 PREEMPT_RT 实时内核上,EtherCAT 通信 500Hz,端到端延迟最低 3ms,控制精度相比原厂控制器提升一个数量级。
- 数据采集:配套数据采集手套可无损映射人手动作,成本为传统方案的 1%,采集效率是遥操作的 5 倍。手套数据、第一人称视频、第三人称互联网视频三层来源,已收集超过 20 万小时多模态数据。
- 训练与评估:预训练遵循 scaling law,在 Genesis World 仿真器中做大规模闭环评估(每个数据点对应 200 个设置、150 小时机器人执行时间)。微调阶段每个新任务仅需 20-30 分钟数据(不到 200 episodes),预训练规模越大微调效果越好。
- demo 表现:烹饪场景 4 分钟完成 20 个子任务,成功率 90-95%(单手打蛋和用刀转移番茄 50-60%),操作速度约为人类的六七成。其他场景包括实验室移液、解魔方、做冰沙、吸管翻转、多物体抓取、线束整理、弹钢琴(约 130BPM)。
- 团队与融资:CEO 周衔(CMU 博士,Genesis 物理引擎发起人),总裁 Théophile Gervet(CMU 出身,前 Skild AI/Mistral AI 研究员)。2025 年中获 1.05 亿美元种子轮(Eclipse 和 Khosla Ventures 领投,Eric Schmidt 等参投),团队 60 人。
值得关注
- Genesis AI 采取全栈自研策略(硬件、控制、数据、模型、仿真),用“人手大小 1:1”灵巧手解决“具身差距”,使人类动作数据可直接迁移。
- 评估瓶颈通过仿真器大幅加速,CEO 表示模型迭代速度的真正限制在于评估。
- 团队计划很快公布第一个全身通用机器人,不局限于手部操作。
