时薪15美元的新工种:将人类肢体动作数据化以训练人形机器人
2026/04/26 17:10阅读量 2
为应对人形机器人训练所需真实世界动作数据的极度短缺,Micro1、Scale AI等公司全球招募工人佩戴头戴设备录制家务视频,时薪约15美元。这些源自普通家庭的“默会知识”被转化为机器可处理的数据,引发了关于数据殖民主义和劳动价值的深层讨论。尽管采集速度极快,但达到训练所需的数十亿小时规模仍需漫长周期,且工人对数据最终用途缺乏知情权。
事件概述
随着特斯拉(Tesla)、Figure AI等公司加速开发人形机器人,训练模型所需的真实世界动作数据变得极为紧缺。为此,Micro1、Scale AI、Encord 等数据采集公司在全球范围内招募工人,通过佩戴头戴式摄像头记录日常家务动作,以构建物理人工智能(Physical AI)的训练数据集。
核心信息
- 招募规模与来源:Micro1 已在 71 个国家招募约 4000 名工人,每月收集超过 16 万小时的视频素材;Scale AI 和 Encord 也在同步进行类似招募。DoorDash 于 2026 年 3 月推出 Tasks 应用,允许送餐员顺带录制家务视频(排除隐私法律严格的州)。
- 工作模式与门槛:
- 应聘者需先通过名为 Zara 的 AI 智能体面试并提交试录视频。
- 合格者将获得额头头带支架及任务清单,要求双手始终在镜头内,动作保持“自然速度”。
- 硬件门槛:必须使用带有 LiDAR 传感器的 iPhone(iPhone 12 Pro 及以上机型)。
- 审核机制:视频经 AI 与人工双重审核,仅约 50% 可用。拒收原因包括光线不足、手部移出画面、动作过快或背景杂乱。
- 薪酬与地域差异:
- 基础时薪约为 15 美元,按有效录制时间计酬,无效录制无收入。
- 美国家庭环境数据价值更高,时薪可达印度或越南工人的三倍(如洛杉矶 vs. 钦奈)。
- 数据需求缺口:Micro1 副总裁 Arian Sadeghi 指出,目前月度 160 万小时远远不够,预计需要几十亿小时数据才能满足训练需求。按当前速度,完成该目标需连续工作约一万年。
值得关注
- 幽灵劳动显形:此类工作延续了 Mary Gray 和 Siddharth Suri 在《Ghost Work》中描述的“幽灵劳动”概念——即支撑 AI 系统却隐形的底层人工劳动。不同的是,过去是屏幕前的点击标注,现在则是身体动作本身成为被定价和转售的原材料。
- 数据殖民主义:Nick Couldry 和 Ulises Mejias 提出的“数据殖民主义”框架在此案例中体现明显:科技公司从发展中国家普通家庭提取日常生活数据,转化为高价值资产,而数据来源方处于产业链末端,缺乏对数据流向和用途的知情权。
- 默会知识的外化:哲学家迈克尔·波兰尼(Michael Polanyi)提出的“默会知识”(Personal Knowledge)指那些无法用语言完全表达、依附于身体实践的知识(如叠衣服的手感、平衡感)。此次大规模数据采集,是人类历史上首次尝试将此类隐性知识外化为机器可处理的数据。
- 市场展望:据预测,2026 年全球人形机器人市场规模将达 42.3 亿美元,2027 年累计安装量有望突破 10 万台。训练这些机器人的数据,正来自当下从事体力劳动的普通人群。
参考资料
- MIT Technology Review: Humanoid data training gig economy
- Scale AI Blog: Physical AI Data Collection
