ICRA 2026：仅需每帧10个深度点，低成本雷达深度补全模型攻克野外度量深度估算

2026/05/28 14:59阅读量 2

一篇ICRA 2026论文提出基于Depth Anything V2的深度补全模型，通过引入稀疏深度测量的第四输入通道，仅利用每帧约10个深度点即可在野外低纹理环境下预测高精度密集深度图。模型在Nvidia Jetson AGX Orin上实现53ms/帧的实时延迟，并采用无人机图像结合SfM与Blender渲染的合成数据管线降低数据采集成本。

事件概述

ICRA 2026 录用论文《Depth Completion in Unseen Field Robotics Environments Using Extremely Sparse Depth Measurements》提出一种深度补全模型，利用极度稀疏的深度测量点（如低成本雷达，每帧仅10个点级别），在深海、冰川、农业等缺乏纹理与尺度信息的野外无结构环境中，预测高精度的密集度量深度。

核心创新

第四通道融合架构：基于最先进的单目深度估计模型 Depth Anything V2 (DAV2)，修改编码器层，引入表示稀疏深度测量的“第四输入通道”。该设计保留了原模型的泛化能力，同时注入了绝对尺度信息。
针对野外场景的合成数据管线：为解决真实野外深度数据集匮乏的问题，利用无人机图像结合运动恢复结构（SfM）生成带纹理的3D网格，再通过Blender渲染多视角图像与深度真值，生成高质量合成训练集，大幅降低数据采集成本。

关键成果

模型在 Nvidia Jetson AGX Orin 边缘计算平台上实现端到端延迟 53ms/帧，满足野外移动机器人实时机载计算需求。
在工业厂房、农田、冰川、压载舱和水下峡湾等五个未见过的复杂野外场景中，仅依赖极稀疏深度提示，即可成功输出高精度密集度量深度图。
该团队已开源代码、野外环境测试数据集与预训练权重（GitHub: field-robotics/extreme-sparse-depth-completion），项目主页提供高帧率真机运行 Demo 视频（Project Page）。

阅读原文详情

事件概述

核心创新

关键成果

准备好启动您的定制项目了吗？