首个物理AI数据基座“无垠”在浙发布,虚实融合破解机器人数据荒

无问智科于浙江德清正式发布业界首个物理AI数据基座平台“无垠”,旨在解决具身智能领域高质量数据稀缺及Sim2Real鸿沟难题。该平台通过VR遥操、动作捕捉等多模态真实采集与高保真生成式仿真技术结合,已积累超1000TB数据并开源1万小时数据集。平台构建了从数据采集、模型训练到商业落地的全闭环工具链,覆盖家庭、工业及商业六大核心场景,吸引地平线、地瓜机器人等50余家企业共建生态。

事件概述

近日,无问智科在浙江德清正式发布行业首个物理AI数据基座平台——“无垠”。该平台针对具身智能(Embodied AI)面临的“数据荒”痛点,提出“虚实融合”的数据供给路线,旨在打通从数据采集、模型训练到商业化落地的全链路。

核心信息

1. 技术路线:虚实融合打破瓶颈

当前物理AI数据获取面临三大困境:真实采集成本高、虚拟仿真存在Sim2Real(仿真到现实)鸿沟、互联网视频缺乏物理交互模态。“无垠”平台采用取长补短的策略:

  • 多模态真实采集:涵盖VR遥操、外骨骼遥操作、UMI、动作捕捉、Human-centric数据及EGO视角等,是目前行业内模态最全的采集方式。
  • 高保真生成式仿真:联合地平线发布EmbodiedGen数字表亲和数字远亲功能,可将真实场景1:1还原至虚拟世界,并在布局、材质、光照及交互物品上进行任意泛化,实现指数级数据放大。
  • 跨本体数据迁移:提供转换工具链,解决不同机器人本体间数据不通用问题,实现一套数据适配多种硬件。

2. 数据规模与开源计划

  • 存量数据:平台已积累超1000TB规模的混合数据。
  • 资产库:拥有百万级可毫米级物理交互的simready仿真资产,覆盖全场景、全品类、全模态。
  • 开源举措:CTO于春磊宣布将开源1万小时高质量数据,以缓解行业燃眉之急。

3. 三大核心能力体系

无问智科定义“数据基座”需具备以下三项核心能力:

  • 高质量数据体系:结合大量真实场景采集与大规模高保真合成数据。
  • 高价值场景生态:依托顶尖仿真技术复刻训练场,覆盖德清全域及长三角高价值真实终端场景。
  • Real2Sim2Real全闭环工具链:包含数据采集范式、自动化标注、生成式仿真及智能化评测,实现端到端打通。

4. 应用场景与落地验证

平台数据覆盖物流仓储、家庭服务、酒店文旅、工业制造、办公服务和商业零售等六大核心作业场景。发布会现场展示了具体落地案例:

  • 星动纪元:利用平台数据打造具身智能通用物流场景解决方案。
  • 中国优选:宣布首家未来新零售旗舰门店落地长三角(德清)具身智能数据采集训练场。

5. 生态合作与战略意义

目前已有50多家头部玩家入驻生态,包括地平线、星动纪元、灵心巧手、云深处和地瓜机器人等。

  • 深度战略合作:地平线提供具身智能大脑基础模型,地瓜机器人提供芯片算力软硬底座,无问智科提供数据基座,三方形成“算力+算法+数据”完整闭环,助力具身智能量产落地。
  • 行业背景:2026年初具身智能赛道融资超20起,累计金额超200亿元,行业对标准化数据基础设施的需求迫切。

值得关注

该平台的发布标志着具身智能行业从单纯追求算法或算力,转向构建以数据为核心的基础设施生态。通过开源部分数据和提供全链路工具链,无问智科试图降低行业门槛,加速物理AI从实验室走向工厂和家庭。

准备好启动您的定制项目了吗?

现在咨询,即可获得免费的业务梳理与技术架构建议方案。