破壳机器人许华哲:两年内中国将涌现可用家庭机器人,弃VLA转攻世界模型
2026/04/27 09:00阅读量 13
清华交叉信息研究院助理教授许华哲创立具身智能公司「破壳机器人」,预测两年内中国将出现具备通用能力的家庭机器人。该公司近期完成数千万美元天使轮融资,由云启资本领投,并采用独特的UAG架构与世界模型路线,旨在解决家庭场景的复杂任务泛化问题。许华哲认为家庭场景比工厂更混乱且数据丰富,是训练通用AGI的最佳土壤,其第一代32B参数模型已完成首轮训练。
事件概述
2026年4月,前「星海图」首席科学家兼联合创始人、清华大学交叉信息研究院助理教授许华哲创立了新的具身智能公司「破壳机器人」。他提出激进判断:两年内,中国将出现可用的家庭机器人。该机器人虽非全能,但能完成精细清洁、长序列多步骤家务(如完整洗衣流程)等上一代设备无法胜任的任务。
目前,「破壳机器人」已完成数千万美元天使轮融资,由云启资本领投,顺为资本、弘晖基金、小米战投、星海图等产业方及多家一线市场化基金跟投。公司成立仅一个月,已组建约20人的核心团队,完成了第一代32B参数规模的具身世界模型训练及硬件迭代。
核心观点与商业逻辑
- 场景选择:许华哲认为,当前大量人形机器人进入工厂仅是“用新人性做旧时代的事”,真正的通用人工智能(AGI)应在家庭场景诞生。家庭环境任务混乱随机、数据丰富,是训练通用模型的最佳土壤;而工厂场景多为确定性任务,缺乏通用性挑战。
- 产品定义:家庭机器人将定位为“科技潮品 + 家庭助手 + 管家”的复合体,而非单纯的人力替代工具。用户购买的是改变生活方式的体验,预计起售价在五位数人民币区间。
- 技术愿景:追求泛化性的本质是“美与影响力”。许华哲希望用最简洁优雅的模型解决人类复杂生活问题,实现AI向生产力的真正转化。
技术路线创新
「破壳机器人」在关键技术路线上做出了差异化选择,未跟随行业主流的VLA(视觉-语言-动作)基座模型方案:
- 模型架构:构建直接输入和输出“视频 - 动作”的世界模型。提出独特的UAG架构(Unconditioned Action Guidance),采用并联式预训练替代传统的瀑布式级联,将强化学习贯穿预训练与部署全过程,据称可实现训练效率提升5倍以上。
- 强化学习应用:不仅用于后训练,还应用于离线预训练阶段。利用价值函数评估数据质量,让模型理解失败边界,突破人类示范数据的上限,实现在多任务上的高成功率与高速度。
- 数据采集闭环:构建了三层高质量数据采集方案:
- 外骨骼方案:通过机械臂直接操作,精度高、反馈直接。
- UMI手套方案:佩戴与机器人手部构型一致的硬手套采集,效率高、数据量大,确保人机动作一致性。
- 第一人称视角:记录人类日常干活的Ego-centric视频数据。
行业背景与进展
- 行业趋势:全球具身智能创业者正转向家庭深水区。硅谷公司Generalist AI在GEN-1模型上验证了Scaling Law,精细操作任务成功率从64%提升至99%;Sunday Robotics推出Umi手套方案并将机器人Memo送入家庭做家务。
- 自身进展:许华哲表示,相比2023年,当前中国硬件供应链更成熟,开源数据量已达几十万小时,融资环境也更友好。第一代32B模型已完成首轮训练,正处于数据迭代爬坡期;定制采集手套已迭代五六个版本,计划于8月末展示全新形态的数采系统。
- 团队与文化:团队包含AI侧天才少年与To C量产交付经验的硬件工程师。许华哲强调团队文化需具备“极致、坦诚、利他”特质,推崇扁平化组织与弹性协作模式。
