ICRA 2026 | EndoDDC:扩散模型赋能稀疏到稠密深度重建

2026/05/27 18:51阅读量 2

香港中文大学任洪亮教授团队提出EndoDDC方法,通过融合图像、稀疏深度与深度梯度特征,借助扩散模型优化深度图,解决内镜环境下弱纹理和反射的深度估计难题。该方法在C3VD和StereoMIS数据集上全面超越当前SOTA方法,仅需RGB和稀疏深度图即可输出精准稠密深度图。

事件概述

香港中文大学任洪亮教授团队提出的论文《EndoDDC: Learning Sparse to Dense Reconstruction for Endoscopic Robotic Navigation via Diffusion Depth Completion》被机器人领域顶会ICRA 2026录用。该方法针对微创手术中内镜机器人导航的深度估计难题,提出一种稀疏到稠密的深度补全框架。

核心方法

EndoDDC通过融合RGB图像、稀疏深度信息与深度梯度特征,借助扩散模型迭代优化深度图。主要创新点包括:

  • 稀疏到稠密重建框架:仅依赖RGB图像和稀疏深度图即可输出稠密深度图,摆脱对稠密标注数据或自监督尺度模糊的依赖。
  • 深度梯度融合模块:采用卷积门控循环单元(ConvGRU)迭代处理深度值与梯度信息,为弱纹理区域提供几何引导,提升重建精度。
  • 基于深度梯度的条件扩散模型:以初始粗深度图为起点,利用深度梯度特征约束去噪过程,确保全局一致性与物理合理性。

实验表现

在公开内镜数据集C3VD和StereoMIS上,EndoDDC在所有评估指标(RMSE、MAE、REL、δ准确率)上均超越当前最优方法。与最优深度补全模型OGNI-DC相比,在C3VD上RMSE降低5.28%、MAE降低7.84%。面对50~50000不同稀疏度的输入,仍能稳定输出高质量稠密深度图。

论文信息

  • 论文题目:EndoDDC: Learning Sparse to Dense Reconstruction for Endoscopic Robotic Navigation via Diffusion Depth Completion
  • 作者:林胤恒†、黄一鸣†、崔贝雷、白龙、高沪昕、任洪亮、赖捷文*(均来自香港中文大学,白龙同时隶属阿里巴巴达摩院)
  • 会议:ICRA 2026

准备好启动您的定制项目了吗?

现在咨询,即可获得免费的业务梳理与技术架构建议方案。