Aether AI 获 2000 万美元种子轮融资,推因果世界模型挑战具身智能泛化瓶颈
2026/07/02 12:36阅读量 2
具身智能公司 Aether AI 宣布完成 2000 万美元种子轮融资,由经纬创投领投。公司推出因果世界模型,旨在让机器人理解物理世界的因果机制而非表面相关性,以解决当前具身大脑在真实环境中的泛化难题。该路线区别于视频生成、3D 重建和 JEPA 等主流世界模型,内部测试显示成功率和样本效率显著提升。
事件概述
具身智能领域长期面临泛化能力不足的瓶颈:在模拟环境中表现优异的机器人,进入真实工厂后往往失效,需要重新采集数据和训练。为解决这一问题,构建能够理解物理世界规律的“世界模型”成为热门方向,但多数路线聚焦于视频生成、3D 重建或隐空间状态转移。
核心信息
- 公司融资:Aether AI 宣布完成 2000 万美元种子轮融资,由经纬创投领投,英诺基金、SWC Global、九合创投参投。创始人黄碧薇为加州大学圣地亚哥分校(UCSD)助理教授,在因果发现领域拥有 13 年研究经验,师从因果发现奠基人 Clark Glymour 及 Bernhard Schölkopf 等。
- 技术路线:因果世界模型区别于三条主流路线:
- 视频生成路线:像素级渲染效果好,但可能生成物理上不可能的动画(如杯子穿桌),不适合精准控制。
- 3D 生成路线:空间结构还原好,但缺乏时间维度的动力学和因果交互。
- JEPA 路线:隐空间状态转移巧妙,但易丢失精细交互信息(如摩擦力、接触力)。
- 因果世界模型:在隐空间显式学习因果变量、结构和动力学,回答“是什么导致下一步发生”。
- 三大核心要素:
- 因果变量提取:从原始数据中拆解形状、速度、摩擦系数等独立物理变量。
- 因果结构学习:显式建模变量间的影响关系(如手的力量、速度如何决定抓取成功率)。
- 因果动力学建模:学习状态随时间与动作的转移规则,而非仅仅拟合轨迹。
- 系统架构:底层为 Transformer,中间层是因果世界模型与模块化架构(类似 MoE),顶层为 Agent 系统,全部由因果思维驱动。
- 数据需求:约 80% 数据来自模拟、第一视角和公开视频,20% 为遥操数据;因果模型能从中提取相关性模型读不出的深层信息。
- 性能表现:在机器人操作任务上,因果世界模型相比传统世界模型实现 25%-50% 的成功率提升,5-10 倍样本效率提升;部分案例仅用 50 条高质量数据即可达到可靠成功率。
值得关注
- 范式意义:创始人黄碧薇将 AI 发展划分为四个范式:相关性小模型 → 因果性小模型 → 相关性大模型 → 因果性大模型。当前行业处于第三范式,因果世界模型试图推动至第四范式。
- 克服相关性模型的局限:
- 数据永远不够:物理世界连续状态空间与机器学习独立数据假设冲突。
- 场景覆盖不全:模型未学到真正通用的规律。
- 物理世界需要干预:机器人错误动作会不可逆地改变世界,被动预测(如 LLM 的下一词预测)不适用。
- 关键在于因果之梯的第二层(干预)和第三层(反事实能力)。
- 公司目标:预期明年机器人具备较强泛化和长程任务能力;明年晚些时候结合移动与操作能力;未来走向开放环境的持续学习。
- 资本赌注:作为种子轮公司,Aether AI 选择非共识路线,资本押注的是范式颠覆而非成熟路线的执行优化。如果能够将因果理论优势转化为量化的泛化能力、长程任务能力和数据效率,将形成厚实商业壁垒。
