灵初智能王启斌:操作才是具身皇冠上的明珠,移动只是入场券

2026/06/02 18:46阅读量 2

灵初智能创始人王启斌在访谈中强调,具身智能的核心在于操作能力,移动只是基础。公司坚持轮式+双臂路线,自研数据手套采集亚毫米级人类数据,以世界模型替代VLA架构,并采用“小全栈”模式。他认为行业两年内将分化,灵初将专注通用灵巧操作,并建议智驾创业者不要低估操作智能的鸿沟。

事件概述

灵初智能创始人兼CEO王启斌在访谈中阐述了其对具身智能赛道的核心判断与公司战略。王启斌拥有从消费电子到移动机器人的跨界经验,2024年创立灵初,定位为通用灵巧操作模型公司。

核心观点

  • 操作是皇冠上的明珠:王启斌认为,移动能力只是入场券,机器人能否完成任务的最后一步取决于操作能力。因此灵初从一开始就锚定轮式底盘+双臂的形态,而非人形机器人。
  • 数据洞察:灵初自研穿戴式多模态数据手套,采集视觉、触觉、关节角数据,3D轨迹精度达亚毫米级。目前已积累约10万小时人类数据用于预训练世界模型,综合成本为真机遥操作方案的十分之一,计划推出便携式众包版本。
  • 技术路线:今年4月发布的Psi-R2(策略模型)和Psi-W0(动作条件型世界模型)替代了旧的VLA架构。Psi-W0在训练中加入了约30%的失败样本,让模型理解失败如何发生。
  • 商业模式:灵初采取“小全栈”模式——不涉及移动底盘和核心零部件自研,但做整机设计和全栈软件。王启斌指出,具身模型与硬件深度耦合,纯算法授权模式在1-2年内难以走通。

行业判断

  • 竞争格局:当前行业处于全栈竞争阶段,但预计两年后分化:部分公司专注本体代工、运控或操作模型与系统集成。灵初将专注于轮式+双臂形态的通用灵巧操作。
  • 场景选择:避开泛化性要求极高的家庭场景和节拍极快的工业流水线,选择物流、零售、服务等中间态场景。
  • 对智驾创业者的建议:从移动智能到操作智能的鸿沟巨大,且窗口期更短;不应一开始就做通用平台,而应窄切口扎进去,先把一种硬件形态和操作任务做闭环。

未来计划

灵初计划在6-7月发布基于更大几十万小时数据的新模型,实现更长程、更泛化的任务,年底目标达到类似π0.7的语言操控能力,并实现百万小时级人类数据积累。

准备好启动您的定制项目了吗?

现在咨询,即可获得免费的业务梳理与技术架构建议方案。