ICRA 2026:仅需每帧10个深度点,低成本雷达深度补全模型攻克野外度量深度估算

2026/05/28 14:59阅读量 2

一篇ICRA 2026论文提出基于Depth Anything V2的深度补全模型,通过引入稀疏深度测量的第四输入通道,仅利用每帧约10个深度点即可在野外低纹理环境下预测高精度密集深度图。模型在Nvidia Jetson AGX Orin上实现53ms/帧的实时延迟,并采用无人机图像结合SfM与Blender渲染的合成数据管线降低数据采集成本。

事件概述

ICRA 2026 录用论文《Depth Completion in Unseen Field Robotics Environments Using Extremely Sparse Depth Measurements》提出一种深度补全模型,利用极度稀疏的深度测量点(如低成本雷达,每帧仅10个点级别),在深海、冰川、农业等缺乏纹理与尺度信息的野外无结构环境中,预测高精度的密集度量深度。

核心创新

  • 第四通道融合架构:基于最先进的单目深度估计模型 Depth Anything V2 (DAV2),修改编码器层,引入表示稀疏深度测量的“第四输入通道”。该设计保留了原模型的泛化能力,同时注入了绝对尺度信息。
  • 针对野外场景的合成数据管线:为解决真实野外深度数据集匮乏的问题,利用无人机图像结合运动恢复结构(SfM)生成带纹理的3D网格,再通过Blender渲染多视角图像与深度真值,生成高质量合成训练集,大幅降低数据采集成本。

关键成果

  • 模型在 Nvidia Jetson AGX Orin 边缘计算平台上实现端到端延迟 53ms/帧,满足野外移动机器人实时机载计算需求。
  • 在工业厂房、农田、冰川、压载舱和水下峡湾等五个未见过的复杂野外场景中,仅依赖极稀疏深度提示,即可成功输出高精度密集度量深度图。
  • 该团队已开源代码、野外环境测试数据集与预训练权重(GitHub: field-robotics/extreme-sparse-depth-completion),项目主页提供高帧率真机运行 Demo 视频(Project Page)。

准备好启动您的定制项目了吗?

现在咨询,即可获得免费的业务梳理与技术架构建议方案。