李飞飞押注空间智能:AI的下一个维度从“读懂语言”转向“理解世界”

2026/05/27 08:00阅读量 2

李飞飞在三次访谈中系统阐述,空间智能是AI的下一个前沿,语言模型天然有损,无法真正理解物理世界。其创立的World Labs推出Marble模型,可生成可交互的3D世界,规模虽远小于GPT-5,但已在游戏、影视、医疗等领域落地。公司已完成10亿美元融资,估值50亿美元,并开源3D渲染引擎,加速降低空间智能技术门槛。

事件概述

斯坦福大学教授、World Labs创始人李飞飞在a16z Podcast(2025年6月)、思科AI峰会(2026年2月)和Lenny's Podcast(2026年5月)三次访谈中,系统论证了“空间智能(Spatial Intelligence)”才是AI的下一个前沿。她指出,当前大语言模型依赖的语言本质上是一种有信息损失的压缩格式,无法让AI真正理解并操作三维物理世界。

核心信息

  • 进化论视角:视觉与空间感知催生了5.4亿年前的寒武纪大爆发,而语言只有约50万年历史。在真实3D/4D物理世界中进行理解、推理、交互的能力是基础性的,与语言智能同等重要。
  • 世界模型缺失:李飞飞在硅谷午餐会上提出“我们缺一个世界模型”,认为语言不是故事的终点。a16z合伙人Martin Casado补充道,仅自动驾驶赛道就投入约1000亿美元、耗时20年才走到今天,空间智能的难度可见一斑。
  • Marble模型:World Labs第一代模型Marble(2024年底发布)可接收文本、图片、视频或简单3D输入,生成具有永久一致性的可交互3D世界,与Sora等视频生成模型有本质区别——后者只是像素动画,而Marble拥有几何结构。
  • 规模对比:GPT-5训练算力约10^26 FLOPS,Marble小几个数量级。原因在于高质量3D物理数据稀缺,且该领域仍处于Scaling Law上升曲线早期。
  • 应用案例:游戏开发、索尼虚拟制作(电影制作周期缩短40倍)、机器人训练、室内设计、OCD/恐高症等心理治疗的沉浸式环境、个性化瑜伽空间等。
  • 融资与开源:2026年2月完成10亿美元融资,英伟达、AMD、a16z参投,估值升至约50亿美元。4月开源3D高斯溅射渲染引擎Spark 2.0,实现网页端亿级3D场景实时渲染,转向“产品+开源生态”双轨策略。
  • 对AGI的看法:李飞飞在Lenny's Podcast中表示“AGI更像营销术语”,当前AI无法完成幼儿级的空间推理任务(如数视频中的椅子数量),也无法从数据中推导出牛顿力学定律。
  • 技术双刃剑:她反对技术乌托邦主义和末日论调,主张以“文明更加美好”作为AI成功的定义,强调人的尊严和自主性应成为技术开发与治理的核心。

值得关注

  • 李飞飞分享个人经历:因眼角膜受伤失去立体视觉后,只能以时速10英里开车,以此论证3D感知的不可替代性。
  • Casado指出,从一张二维照片模型就能生成完整的360度3D表示,用户可测量、堆叠、操作。
  • World Labs团队约30人,已融资超10亿美元。李飞飞承认竞争远超预期,并引用进化论表明:感知先于语言,空间先于符号,AI的空间智能进化正被压缩到几年内完成。

准备好启动您的定制项目了吗?

现在咨询,即可获得免费的业务梳理与技术架构建议方案。