中文标题: 分辨自适应自监督单目深度估计
提出问题
- 传统的无监督深度估计方法如果在固定分辨率上训练,则迁移到其他分辨率上存在严重退化。
创新点
- 提出一种分辨率自适应的无监督深度学习框架(RA-Depth)来学习场景深度尺度不变性。具体地说,来为同一场景生成任意尺度的图像。
- 设计了一个双高分辨率网络,利用多路径编码器和解码器来聚合多尺度特征,以进行精确的深度推断。
- 为了明确地学习场景深度的尺度不变性,在不同尺度的深度预测中建立了一个跨尺度的深度一致性损失。
算法简介
任意比例的数据增强
- 原始尺寸图像被resize 成低,中, 高分辨率图像,然后打补丁,复制,裁切成低,中, 高分辨率原始尺寸的输入图像。
Dual HRNet
- 使用HRnet18作为编码器,类HRnet结构作为解码器。
- HRNet的特点:1.参数量少。2. 特征沟通多。
跨尺度深度一致性损失
- 约束预测结果中 D t L 、 D t M 、 D t H D^L_t、D^M_t、D^H_t DtL、DtM、DtH中对应区域的深度应该相同。
实验结果
- 消融实验中的BaseLine是HRnet18+Mono2-Decoder。
参考文献
He M, Hui L, Bian Y, et al. RA-Depth: Resolution Adaptive Self-supervised Monocular Depth Estimation[C]//Computer Vision–ECCV 2022: 17th European Conference, Tel Aviv, Israel, October 23–27, 2022, Proceedings, Part XXVII. Cham: Springer Nature Switzerland, 2022: 565-581.