高德发布ABot全栈具身体系：15项SOTA，构建AGI级闭环智能

2026/04/19 15:50阅读量 2

4月19日，高德在2026北京亦庄机器人半程马拉松上正式发布全球首个面向AGI的全栈具身技术体系“ABot”，并公开首款开放环境全自主具身机器人“高德途途”。该体系通过数据、模型、应用三层飞轮设计，攻克了数据稀缺与仿真鸿沟难题，其核心组件在PBench等权威评测中斩获15项SOTA。随着ABot全体系的开源，具身智能研发范式正从单点突破转向基于真实场景持续进化的系统协同。

事件概述

4月19日，阿里巴巴旗下高德正式对外发布全球首个面向AGI（通用人工智能）的全栈具身技术体系“ABot”。同日，基于该体系打造的四足机器人“高德途途”在2026北京亦庄机器人半程马拉松上完成实战演示，成功协助视障人士在复杂开放环境中完成避障与人群穿行，标志着具身智能技术从实验室走向真实应用场景的突破。

核心架构：三层飞轮闭环

ABot体系摒弃了传统具身智能“单点拼凑”的路径，采用数据、模型、应用深度咬合的三层飞轮设计，实现“数据驱动模型、模型服务应用、应用反哺数据”的持续进化闭环：

1. 数据层：ABot-World

作为底层仿真基座，ABot-World是全球首个将物理定律深度嵌入生成全流程的可微分动力学引擎。

架构创新：采用14B DiT架构，以观测与动作为输入，在潜空间直接生成符合时空动力学的未来状态序列。
成本压缩：通过3DGS冷启动空间基座，将手机拍摄或航测图等稀疏输入转化为高保真3D场景，大幅降低数据获取成本。
物理对齐：首创Diffusion-DPO物理偏好对齐框架，由VLM生成物理规则清单并独立判别，有效抑制违反物理规律的行为。
规模效应：累计生产万级3D真实场景、百万级推理数据与千万级训练轨迹，覆盖99%典型生活场景，彻底打通“虚拟训练-真实部署”闭环。

2. 模型层：运动双核（ABot-N & ABot-M）

ABot-N（导航基座）：全球首个实现五大核心导航任务“大一统”的VLA基座模型。采用层级式“大脑-动作”架构，在VLN-CE、HM3D-OVON等7大权威基准上刷新SOTA，具备意图理解、自主决策与零样本泛化能力。
ABot-M（操作基座）：全球首个统一架构的具身操作基座模型。提出全球首个动作流形学习，将学习目标转为流形投影，显著提升动作生成稳定性。在LIBERO、RoboCasa GR1等评测中全面超越π0.5、UniVLA等强基线，实现跨形态迁移的系统性领先。

3. 应用层：ABot-Claw

作为具身版“龙虾”执行中枢，ABot-Claw首创“Map as Memory”理念，重构记忆机制。

集中式Harness架构：将高德地图与用户私有地图设为全局认知锚点，多模态感知数据统一映射至共享语义空间，形成可动态刷新的“世界记忆”。
云端 - 边缘协同：采用两级设计兼顾智能深度与执行可靠性，支持多种异构机器人的并行协作、任务接力及故障自动接续。
闭环纠错：内置闭环反馈与纠错机制，在模糊指令理解与跨机导引等复杂场景中验证了鲁棒性。

关键成果与影响

SOTA成绩：ABot系列模型在全球15项权威基准测试中取得SOTA（State-of-the-Art），其中ABot-World是唯一在物理合规性、动作可控性、零样本泛化三大维度均达第一的模型；ABot-N与ABot-M合计斩获11项SOTA。
技术突破：解决了具身智能领域长期存在的数据稀缺、Sim-to-Real（仿真到现实）鸿沟以及技能泛化瓶颈。
开源计划：高德宣布将开源ABot全体系，旨在重塑具身智能研发范式，加速AGI时代的到来。
行业意义：依托近10亿月活产生的海量时空数据，高德构建了不依赖单点技术突破，而是依靠真实场景飞轮持续运转的体系化优势。

阅读原文详情