Physical Intelligence 押注机器人操作系统:以56亿美元估值领跑,核心在于数据飞轮与通用底座

2026/04/08 19:02阅读量 2

美国具身智能公司 Physical Intelligence(PI)避开硬件本体研发,专注于构建适配任意硬件的机器人操作系统,最新估值达56亿美元(约385亿人民币)。其核心战略是通过真实世界数据驱动模型进化,利用语言标注实现弱监督学习,并推动推理从显式文本向空间语义联合表征转型。创始人 Sergey Levine 指出,机器人进入家庭的最大挑战在于应对场景多样性及人机交互的长尾问题,而非单纯的动作执行能力。

事件概述

美国具身智能公司 Physical Intelligence (PI) 近期在行业访谈中阐述了其技术路线与商业逻辑。作为一家不生产机器人本体的软件公司,PI 在2024年底完成6亿美元融资后,估值达到56亿美元(约合人民币385亿元),高于部分全栈自研硬件的竞争对手。其联合创始人、UC伯克利大学副教授 Sergey Levine 强调,公司的核心赌注在于打造类似操作系统的通用基础模型,而非单一形态的硬件。

核心信息与技术路径

1. 数据飞轮:真实世界驱动与弱监督时代

  • 策略选择:PI 采用类似特斯拉自动驾驶的逻辑,优先构建具备实用价值的系统以自主采集真实数据,而非追求理论上的终极数据集规模。
  • 数据痛点突破:针对机器人行业缺乏统一格式和低成本标注的问题,PI 转向“真实世界 + 多任务学习”路线。关键突破在于引入语言标注替代传统的动作级监督,使机器人犯错时仅需通过自然语言反馈即可优化,标志着行业正进入“弱监督时代”。
  • 路线融合:虽然目前侧重真实数据,但 Levine 承认未来可能与仿真路线融合,两者并非互斥。

2. 操作系统底座:解耦形态的通用智能

  • 核心理念:反对专用机器人或仅聚焦人形机器人的路线,主张开发适配任意硬件的“操作系统级”基础模型。优秀的基础模型应与机器人形态解耦,能自主适配操控躯体与工具。
  • 物理认知能力:不同于大语言模型处理文本,机器人模型的核心是建立对物理世界的直觉预判能力。通过整合多来源、多场景数据,让模型具备类似人类的举一反三能力,从而降低新应用拓展的门槛。

3. 中层推理:从显式语言到隐式表征

  • 瓶颈转移:行业共识认为,机器人发展的瓶颈已从“动作执行”转向“决策理解”。
  • 表征转型:当前研发重点在于突破纯文本推理的低效性(如思维链外挂的局限)。新的方向是将推理从“显式语言”转向“隐式结构”,即在模型内部直接形成空间 + 语义 + 动作的联合表征,类似于人类做事时的直觉判断,而非逐句思考。

行业挑战与展望

家庭场景落地的终极障碍

  • 时间预期:尽管部分从业者预测2030-2035年机器人将进入家庭,但 Levine 提出更保守的观点:若2050年机器人仍未普及,主因将是未能解决场景多样性人机交互长尾问题
  • 高风险任务:家庭环境充满不可预知的突发状况,且涉及照护老人、婴儿等高风险任务,要求模型具备极端鲁棒性,确保每一次决策都符合人类预期。

商业模式张力

  • 长期主义:PI 坚持软件优先战略,接受长周期技术曲线。其面临的独特矛盾在于:数据飞轮依赖硬件落地,但估值逻辑要求软件先行。因此,公司需通过算法的极致性换取硬件厂商的买单,而非依赖自有硬件销售。

准备好启动您的定制项目了吗?

现在咨询,即可获得免费的业务梳理与技术架构建议方案。