四家机器人厂商联合注资「智域基石」，构建具身智能数据编译基础设施

2026/03/31 21:37阅读量 427

具身智能数据公司「智域基石」完成数千万元天使轮融资，投资方包括灵初智能、穹彻智能、浙江人形及智平方四家机器人厂商。该公司计划建设超万平米真机采集工厂，目标在2026年积累200PB异构数据，并推出自动化“数据编译管线”解决多模态数据时空对齐与低信噪比难题。其商业模式旨在从单纯的数据生产向标准化资产订阅及行业基础设施演进，以应对具身智能领域的“数据供给危机”。

事件概述

具身智能领域新兴项目「智域基石」（Data Foundation for Embodied AI）近日完成数千万元天使轮融资。本轮融资由四家机器人厂商共同领投，分别为灵初智能、穹彻智能、浙江人形和智平方。公司核心定位是构建具身智能时代的数据入口与训练输入基础设施，致力于将海量杂乱的物理世界原始数据，精准编译为高质量的任务训练语料。

核心团队与背景

CEO 杨哲轩：前 PingCAP 核心成员，拥有大规模分布式系统与底层架构设计背景，系连续创业者。
CTO 徐良威：具备腾讯、小鹏机器人从业经验，专注于机器人软硬件及具身智能算法数据需求。
COO 张计业：前华为地市总经理，曾任具身智能公司「穹彻智能」生态负责人。

核心业务与技术架构

「智域基石」通过引入大数据行业理念，搭建了一套打破传统“废料堆砌”模式的自动化“数据编译管线”，主要包含以下关键能力：

全量数据质检：摒弃传统抽检模式，利用分布式计算与弹性伸缩架构，对视觉、深度、关节位姿及力触觉等多模态数据进行全量质检，从源头剔除高达95%的无效噪音。
异构湖仓底座重构：针对真实物理数据高熵、多源异构及采样频率异步（如视觉30Hz与关节控制500Hz）的特征，自研数据引擎实现毫秒级高精度“时空戳对齐”，将混沌记录锚定为大模型可解析的高价值时序资产。
数据编译与原子化：将非标数据转化为带有明确动作意图与物理约束的“技能原子”，提取语义片段并建立版本号与血缘追踪，确保资产可追溯。
智能检索与组配：开发类SQL查询引擎，支持按场景、技能、动作基元进行语义化调用。例如，客户可直接指令调取“厨房场景”中“拿杯子”且成功率>95%的结构化数据流。
标准化打包与弹性交付：自动将结构化片段打包为带版本号的标准化数据集，支持S3云原生直连或高吞吐线下物理阵列交付，打通从数据精炼厂到算力集群的最后一公里。

产能规划与里程碑

硬件设施：计划在全国建立面积超1万平方米的真机数据采集工厂，部署机器人数量超400台，覆盖异构硬件形态超10种。
数据规模：预计2026年内积累超过200PB异构数据。
业务拓展：今年第二季度将从真机数据生产全面拓展至Ego-Centric（第一人称视角）领域，掌控模型后训练与预训练的数据入口。

商业演进路线

公司规划了三阶段发展路径：

第一阶段（2026-2027）：抢占高质量物理数据入口。对标英伟达 EgoScale 路线，自研 Ego-Centric 穿戴设备获取稀缺预训练语料；联合政企与头部厂商建设采集工厂。目前在手订单已近亿元。
第二阶段（2027-2029）：转向“标准化资产订阅”。将通用动作与场景提炼为开箱即用的行业标准数据集，通过长期框架协议实现单点资产重复变现。
第三阶段（2029+）：开放API与开发者生态，构建通用基座与数据交易市场，实现数据资产的规模化分发与全生态复用。

行业洞察

创始人指出，当前具身智能面临“懂算法的不懂工程量产，懂量产的不懂机器人硬件”的结构性错位，导致大量原始数据沦为消耗算力的“废料”。2026年被视为行业跨越商业鸿沟的关键节点，若无法将海量物理记录高效“编译”为训练输入，大模型在真实场景中的泛化能力将面临严峻挑战。「智域基石」试图通过技术架构重构，实现数据加工环节的人力解耦，预计未来核心环节人力需求可降低至少50%，从而构建高毛利的基础设施壁垒。

阅读原文详情