星海图创始人高继扬：具身智能三层路线无捷径，100万小时真实数据计划启动

2026/06/17 18:55阅读量 2

星海图在首届全球开发者大会（WDC）上公布100万小时高质量真实数据计划，联合发起数据公司亦数智能。创始人高继扬提出具身智能“本能、作业、进化”三层技术路线，认为数据是底层生产资料，并透露100万小时数据成本约1-2亿元。同时发布开源VLA基础模型G0.5，但受算力限制，双足人形Kengo需至年底才能适配。公司还启动“星途计划”孵化生态，商业模式沿整机销售→方案订阅→物理世界Token销售演进。

事件概述

星海图（2023年成立）于2026年6月16日举办首届全球开发者大会（WDC），公布数据、模型、生态三方面战略布局。核心动作包括：联合发起数据公司“亦数智能”，提出100万小时超高质量真实数据计划；发布新一代VLA基础模型G0.5并开源；联合凯辉基金启动创业孵化项目“星途计划”。

核心信息

1. 数据策略：100万小时真实数据，成本1-2亿元

星海图联合北京亦庄成立亦数智能（星海图持股25%，认缴2500万元），首批共建企业包括原力灵机、蚂蚁数科、百度智能云、猎聘、海天瑞声等15家。
创始人高继扬强调“数据不是辅助，是底层生产资料”，公司最坚定押注真实数据，不信任仿真/合成数据（认为与真机差异大，难以有效用于算法）。
数据成本拆解：人类行为数据（Human centric data）约50-100元/小时；机器人遥操作数据（Robot centric data）约250元/小时，市场上有的报价达300-350元/小时（含约10%-20%毛利）。
100万小时数据采集对应1亿-2亿元成本。高继扬认为这是“必须发生的投入”，对比大模型每年数亿美元算力支出，数据投入划算。
短期内数据量提升引入UMI+Ego（廉价替代方案），但内部判断非终局；长期以真机数据为核心，逐步引入互联网身体数据、人类行为数据、物品交互数据。

2. 模型路线：三层技术架构，G0.5适配轮式而非双足人形

星海图CTO赵行公布三层技术路线：
- 本能智能：强化学习为主，模仿学习为辅（如英伟达Sonic、Mimic跳舞控制），让机器人协调全身；
- 作业智能：当前主流，模仿学习为主，强化学习辅助，让机器人干活（G0.5处于此层）；
- 进化智能：AI重新定义机器人形态。
G0.5关键特性：将视觉、语言、思维链与动作统一进自回归生成框架，实现“边理解边执行”闭环推理。
适配形态：G0.5更适配双臂智能或轮式双臂（如R1 Lite、R1 Pro、单臂A1Z），双足人形Kengo仍处“本能智能”阶段。
G0.5迁移到Kengo需等到2026年底，主因小型人形机器人端侧算力不足（NVIDIA Jetson Thor功耗高、体积大），需轻量化版本。
另外，星海图年初发布第一版世界模型Fast-WAM，通过去除推理阶段视频预测，保留训练阶段世界表征，推理速度提升4倍以上，可在消费级显卡运行5亿-10亿参数模型。

3. 生态布局：投资+孵化+开放

联合凯辉基金发布“星途计划”，重点关注数据驱动智能、应用场景突破、下一代核心技术。
星海图过去一年已投资近10家企业，未来3-5年目标投资30-50家。CFO罗天奇称投资为构建产业拼图，而非单纯财务回报。
高继扬表示没有任何一家公司能独自定义具身智能，星海图走“生态平权”路线（区别于智元的“航母式孵化”），开放技术、工具、接口降低门槛。

4. 商业模式三段式演进

第一阶段：整机销售，承担场景验证功能。
第三阶段：物理世界Token销售。
2024年10月首批Galaxea R1本体交付斯坦福李飞飞实验室，李飞飞基于该平台发布全身移动操作机器人套件方案。

值得关注

具身智能行业对真实数据的共识与成本认知：100万小时数据成本1-2亿元，与算力成本比约1:10。
G0.5开源开源及技术路线“三层”划分，为行业提供可参考的演进框架。
端侧算力（Thor）成为人形机器人VLA落地的关键瓶颈，轻量化需求明确。
星海图加速生态化布局，通过投资、孵化、开放平台构建产业拼图。

阅读原文详情