目录
- 概述
- 细节
- 基准模型
- 点云置信度生成网络
- 特征聚合 DGCNN
概述
本文是基于单目图像的3D目标检测方法,是西安电子科技大学的郭鑫宇学长的硕士学位论文。
【2021】【单目图像的3D目标检测方法】
细节
基准模型
作者还是按照伪雷达点云算法
的流程设计的,并且将单目深度估计的网络和基于点云的3D检测网络替换
成了最先进的DORN网络和PV-RCNN网络,这就构成了本文的基准模型。
点云置信度生成网络
这部分是作者第三章的内容,主要研究
的是如何得到更加优质的伪雷达点云,来作为下一阶段3D检测网络的输入。
这个问题我见到过两种思路
,一种
是改进单目深度估计的网络,使得生成的深度图像质量尽可能的高,从而得到高质量的伪点云;另一种
就是不改动单目深度估计网络,而是想办法提高生成伪点云的质量,这也正是作者的想法。
那该如何提高伪点云的质量呢?
作者给出的想法就是剔除掉不可靠的点云,保留可靠的点云。
那具体该怎么做呢?
作者考虑了伪点云是有深度图像转换而来的,就开始研究深度图像,发现了以下两个性质,依靠着这两个性质提出了置信度的概念,依靠置信度筛选点云。
- 在目标中心位置附近的深度估计最为准确,而在目标与背景间过渡区域的平均误差最高。
- 单目深度图的深度误差随距离的增加而非线性上升。
作者将第一个性质表示出来,成为局部置信度,将第二个性质表示出来,称为全局置信度,结合这两个置信度得到最终的置信度。注意
,我们这边得到的置信度其实还是图像中逐像素的置信度,想要得到点云的置信度,应该对点云进行投影,对应投影位置的置信度,就是点云置信度。