Figure 03 机器人展示“边走边做家务”能力,Helix 02 系统实现全身自主控制
人形机器人公司 Figure 发布新视频,展示其 Figure 03 机器人在客厅环境中自主完成收拾玩具、清洁茶几、整理抱枕及关闭电视等复杂家务任务。此次升级核心在于全新 AI 控制系统 Helix 02,它通过单一神经网络实现了行走与操作的同时进行(loco-manipulation),打破了以往机器人需“走-停-做”的局限。尽管目前售价高昂且场景仍受控,但该演示验证了通过增加数据而非重写代码即可扩展通用家务技能的可行性路径。
事件概述
人形机器人公司 Figure 于三月发布了一段在社交媒体广泛传播的视频,展示了 Figure 03 机器人在未受人类指令干预的情况下,独立完成客厅家务的全过程。视频中,机器人从进入散乱的客厅开始,依次完成了捡拾玩具、擦拭茶几、整理沙发抱枕以及使用遥控器关闭电视等操作,全程一镜到底,无遥控介入。
核心信息:Helix 02 系统与全身自主性
此次演示并非硬件更新,而是基于去年发布的 Figure 03 硬件平台,搭载了全新的 AI 控制系统 Helix 02。其核心突破在于实现了“全身自主性”(full-body autonomy):
- 移动与操作统一控制:Helix 02 利用单一神经网络同时控制行走、平衡和操作,彻底解决了传统机器人“走 - 停 - 做 - 停”的低效模式。机器人可以在移动中端碗、用胯关门,甚至在双手被占用时用脚踢开洗碗机门。
- 三层架构设计:
- System 2(慢思考):负责语义理解与任务规划(如判断物品乱序、决定执行顺序)。
- System 1(快思考):以每秒 200 次的频率将视觉、触觉等传感器数据转化为关节动作目标。
- System 0(本能层):新增底层控制器,以每秒 1000 次频率运行,负责平衡与协调。该层由超过 1000 小时的人类运动数据和强化学习训练而成,用仅 10M 参数的神经网络替代了原有的近 11 万行手写 C++ 代码。
硬件配合与场景挑战
为了支撑 Helix 02 的高阶能力,Figure 03 硬件进行了针对性优化:
- 感知增强:手掌内嵌广角摄像头提供近距离视觉反馈,指尖配备高灵敏度触觉传感器(可感知 3 克力),支持精准抓取微小物体或精确挤出液体。
- 安全与交互:机身覆盖可拆卸清洗的软性材料,内置多密度泡沫防夹伤;脚底集成无线充电线圈,支持自动回充。
- 场景升级:相比年初厨房场景中相对固定的物品摆放,客厅环境更具挑战性。玩具位置随机、软性物品物理行为不可预测、通道狭窄需侧身通过,且涉及喷雾瓶擦拭、遥控器按键等工具使用,要求机器人不仅识别物体,还需理解其用法。
行业意义与展望
Figure 强调,从厨房到客厅的跨越并未更换算法或进行专项工程优化,仅通过增加训练数据即实现了技能迁移。这印证了类似大语言模型的 Scaling Law 逻辑:一个通用 AI 架构,随着更多物理世界数据的输入,可涌现出更多家务技能。
- 商业化现状:目前 Figure 03 预估售价在 5 万至 10 万美元之间,且演示场景为受控环境,距离普通家庭普及仍有距离。
- 未来路径:Figure 计划通过 BotQ 工厂年产 1.2 万台机器人,目标四年累计出货 10 万台。每台机器人作为数据采集终端,将通过 10Gbps 毫米波网络回传真实家庭场景数据,用于迭代训练 Helix 系统。正如 Brett Adcock 所言,当前制约出货的不是需求,而是 AI 通用性的完善程度,而此次演示标志着这一目标的实质性推进。
