AI“炼化”人类:巴菲特与刷马桶者在数据面前并无区别

2026/05/07 19:13阅读量 2

具身智能训练需要海量人类动作数据,无论是巴菲特的公开演讲还是普通人的日常家务,都被大规模采集用于训练机器人。DoorDash、Uber等平台及Micro1等公司正以零工模式在全球收集数据,行业年支出超1亿美元。2025年人形机器人领域投资超60亿美元,但高质量动作数据仅50万小时,远不能满足需求。

事件概述

AI正在平等地学习人类行为数据——无论是巴菲特的投资经验还是普通人洗碗、叠衣的日常动作,都被转化为训练数据,用于培育具身智能。伯克希尔股东大会上出现的“AI巴菲特”仅需其过往媒体数据即可生成,而DoorDash、Uber等平台则通过零工经济采集普通人的日常动作。

核心信息

  • 数据采集规模化:DoorDash配送员被要求佩戴随身摄像机拍摄洗碗视频,Uber司机上传照片训练模型。Micro1公司在全球50多个国家雇佣数千兼职人员,将iPhone固定在头上录制家务动作,时薪约15美元。机器人公司每年花费超1亿美元购买真实世界数据。

  • 具身智能数据饥渴:2025年人形机器人领域投资超60亿美元,中国具身智能相关企业注册量同比翻倍。但当前高质量动作数据仅约50万小时,远低于训练需求。真机遥操作数据价格高达500-1000元/小时,高动态动作(如跑酷)约10元/秒,日常家务数据相对较低。

  • 全球数据竞赛:中国方面,智元机器人在多城布局数据采集中心,帕西尼感知科技新建4座超级数据工厂,京东宣称要建成全球最大数据采集中心。有公司在小区租下数十套房子专门收集家居数据,动捕公司也加入高难度动作数据采集。

  • 从语言到行为模型:与语言模型不同,动作模型需理解三维空间和物理规律,复杂度更高。当前日常家务数据采集门槛较低,类似早期语言模型由肯尼亚劳工标注,未来具身智能成熟后可能仅需高难度动作数据。

值得关注

动作数据采集窗口期有限。随着具身智能技术进步,日常动作数据价值可能迅速下降,高难度、动态数据将成为下一个争夺焦点。

准备好启动您的定制项目了吗?

现在咨询,即可获得免费的业务梳理与技术架构建议方案。