星海图创始人高继扬:具身智能三层路线无捷径,100万小时真实数据计划启动
2026/06/17 18:55阅读量 2
星海图在首届全球开发者大会(WDC)上公布100万小时高质量真实数据计划,联合发起数据公司亦数智能。创始人高继扬提出具身智能“本能、作业、进化”三层技术路线,认为数据是底层生产资料,并透露100万小时数据成本约1-2亿元。同时发布开源VLA基础模型G0.5,但受算力限制,双足人形Kengo需至年底才能适配。公司还启动“星途计划”孵化生态,商业模式沿整机销售→方案订阅→物理世界Token销售演进。
事件概述
星海图(2023年成立)于2026年6月16日举办首届全球开发者大会(WDC),公布数据、模型、生态三方面战略布局。核心动作包括:联合发起数据公司“亦数智能”,提出100万小时超高质量真实数据计划;发布新一代VLA基础模型G0.5并开源;联合凯辉基金启动创业孵化项目“星途计划”。
核心信息
1. 数据策略:100万小时真实数据,成本1-2亿元
- 星海图联合北京亦庄成立亦数智能(星海图持股25%,认缴2500万元),首批共建企业包括原力灵机、蚂蚁数科、百度智能云、猎聘、海天瑞声等15家。
- 创始人高继扬强调“数据不是辅助,是底层生产资料”,公司最坚定押注真实数据,不信任仿真/合成数据(认为与真机差异大,难以有效用于算法)。
- 数据成本拆解:人类行为数据(Human centric data)约50-100元/小时;机器人遥操作数据(Robot centric data)约250元/小时,市场上有的报价达300-350元/小时(含约10%-20%毛利)。
- 100万小时数据采集对应1亿-2亿元成本。高继扬认为这是“必须发生的投入”,对比大模型每年数亿美元算力支出,数据投入划算。
- 短期内数据量提升引入UMI+Ego(廉价替代方案),但内部判断非终局;长期以真机数据为核心,逐步引入互联网身体数据、人类行为数据、物品交互数据。
2. 模型路线:三层技术架构,G0.5适配轮式而非双足人形
- 星海图CTO赵行公布三层技术路线:
- 本能智能:强化学习为主,模仿学习为辅(如英伟达Sonic、Mimic跳舞控制),让机器人协调全身;
- 作业智能:当前主流,模仿学习为主,强化学习辅助,让机器人干活(G0.5处于此层);
- 进化智能:AI重新定义机器人形态。
- G0.5关键特性:将视觉、语言、思维链与动作统一进自回归生成框架,实现“边理解边执行”闭环推理。
- 适配形态:G0.5更适配双臂智能或轮式双臂(如R1 Lite、R1 Pro、单臂A1Z),双足人形Kengo仍处“本能智能”阶段。
- G0.5迁移到Kengo需等到2026年底,主因小型人形机器人端侧算力不足(NVIDIA Jetson Thor功耗高、体积大),需轻量化版本。
- 另外,星海图年初发布第一版世界模型Fast-WAM,通过去除推理阶段视频预测,保留训练阶段世界表征,推理速度提升4倍以上,可在消费级显卡运行5亿-10亿参数模型。
3. 生态布局:投资+孵化+开放
- 联合凯辉基金发布“星途计划”,重点关注数据驱动智能、应用场景突破、下一代核心技术。
- 星海图过去一年已投资近10家企业,未来3-5年目标投资30-50家。CFO罗天奇称投资为构建产业拼图,而非单纯财务回报。
- 高继扬表示没有任何一家公司能独自定义具身智能,星海图走“生态平权”路线(区别于智元的“航母式孵化”),开放技术、工具、接口降低门槛。
4. 商业模式三段式演进
- 第一阶段:整机销售,承担场景验证功能。
- 第三阶段:物理世界Token销售。
- 2024年10月首批Galaxea R1本体交付斯坦福李飞飞实验室,李飞飞基于该平台发布全身移动操作机器人套件方案。
值得关注
- 具身智能行业对真实数据的共识与成本认知:100万小时数据成本1-2亿元,与算力成本比约1:10。
- G0.5开源开源及技术路线“三层”划分,为行业提供可参考的演进框架。
- 端侧算力(Thor)成为人形机器人VLA落地的关键瓶颈,轻量化需求明确。
- 星海图加速生态化布局,通过投资、孵化、开放平台构建产业拼图。
