ICRA 2026 | EndoDDC:扩散模型赋能稀疏到稠密深度重建
2026/05/27 18:51阅读量 2
香港中文大学任洪亮教授团队提出EndoDDC方法,通过融合图像、稀疏深度与深度梯度特征,借助扩散模型优化深度图,解决内镜环境下弱纹理和反射的深度估计难题。该方法在C3VD和StereoMIS数据集上全面超越当前SOTA方法,仅需RGB和稀疏深度图即可输出精准稠密深度图。
事件概述
香港中文大学任洪亮教授团队提出的论文《EndoDDC: Learning Sparse to Dense Reconstruction for Endoscopic Robotic Navigation via Diffusion Depth Completion》被机器人领域顶会ICRA 2026录用。该方法针对微创手术中内镜机器人导航的深度估计难题,提出一种稀疏到稠密的深度补全框架。
核心方法
EndoDDC通过融合RGB图像、稀疏深度信息与深度梯度特征,借助扩散模型迭代优化深度图。主要创新点包括:
- 稀疏到稠密重建框架:仅依赖RGB图像和稀疏深度图即可输出稠密深度图,摆脱对稠密标注数据或自监督尺度模糊的依赖。
- 深度梯度融合模块:采用卷积门控循环单元(ConvGRU)迭代处理深度值与梯度信息,为弱纹理区域提供几何引导,提升重建精度。
- 基于深度梯度的条件扩散模型:以初始粗深度图为起点,利用深度梯度特征约束去噪过程,确保全局一致性与物理合理性。
实验表现
在公开内镜数据集C3VD和StereoMIS上,EndoDDC在所有评估指标(RMSE、MAE、REL、δ准确率)上均超越当前最优方法。与最优深度补全模型OGNI-DC相比,在C3VD上RMSE降低5.28%、MAE降低7.84%。面对50~50000不同稀疏度的输入,仍能稳定输出高质量稠密深度图。
论文信息
- 论文题目:EndoDDC: Learning Sparse to Dense Reconstruction for Endoscopic Robotic Navigation via Diffusion Depth Completion
- 作者:林胤恒†、黄一鸣†、崔贝雷、白龙、高沪昕、任洪亮、赖捷文*(均来自香港中文大学,白龙同时隶属阿里巴巴达摩院)
- 会议:ICRA 2026
