目录
一、导言
二、先导知识
1、FCGF
三、相关工作
1、深度学习的点云配准
2、对抗密度变化的方法
3、对比学习
四、GCL方法
1、U型曲线假设
一、导言
该论文来自于ICCV2023,上海交通大学提出的基于组对比学习的方案,来提取密度不变的几何特征,并用于户外的LiDAR点云的点云配准,该论文是三维点云问题中第一次研究密度变化。
由于以往的基于深度学习的配准方法如Predator,在处理远距离点云时会出现严重配准错误,这是因为两个点云观测点密度存在差异。本文提出训练密度不变的特征提取器,对比学习的正样本应该是独立同分布的。使用组对比学习方法,将收集到的LiDAR点云数据组进行对齐,从而保证对齐后的特征是密度不变的。
二、先导知识
1、FCGF
FCGF来自于Feature Correspondence Graph for Fast Point Cloud Registration这篇论文,该论文用于对三维点云测量后数据消除伪样本对。FCGF中提到使用全卷积网络就算点云特征,以及提出新的度量学习损失。
FCGF中网络结构使用的是Res-Unet,并且所有的卷积操作使用的是三维的Voxel Conv而不是KPconv,但本论文的结构中并没有用类似的残差结构,只是借用了Voxel Conv。
FCGF中的损失函数考虑了四种情况:对比损失、三元组损失、最难对比损失和最难三元组损失。
(1)传统的标准对比损失
正样本尽量靠近,负样本保持α距离远。其中表示是否为正样本对,是为1,不是为0,表示点对距离,α为负样本对最小距离,下标+表示。
注意:先运算+,后运算平方。使Loss尽量为0,正样本对尽量为0。
(2)FCGF中的对比损失
FCGF中改进的对比损失基于正样本距离应小于,负样本距离应大于。其中与上公式相同,正样本对为1,否则为0,负样本对指示为,负样本对为1,否则为0。
(3)三元组损失
三元组损失中包含锚点、正样本点和随机的一个负样本点。尽量使得锚点靠近正样本点,远离负样本点,使得Loss尽量为0。
(4)最难对比损失
最难对比损失中,表示正样本数量,均表示以i,j为球心的负样本数量,代表负样本权重系数。最难对比损失保证每个正样本可以受到最难的负样本的影响。
(5)最难三元组损失
最难三元组损失相同,找到每个正样本中最难的负样本,并最小化正负样本之间的间隔。
三、相关工作
1、深度学习的点云配准
(1)基于Patch的配准
一般会考虑在Patch嵌入基础上应用对比损失,再对局部Patch提取特征。但由于基于Patch的方法经常重复计算,且大部分Patch重叠,而计算缓慢且冗余。
(2)基于完全卷积
在FCGF中,考虑到全卷积(Voxel Conv)工作来在一次前传递过程中提取整个点云的密集特征,并将对比损失用在每一个点。
在D3Feat和Predator中更是使用Kpconv以及增加重叠注意机制,来提高效率。虽然在室内的近距离激光雷达问题中重叠和效率是最重要的,但对于远距离室外点云来说,密度方差问题才是根本问题,这也是本文的改进中心。
2、对抗密度变化的方法
(1)体素化:通过将点云转化为体素形式降低密度差异,但效果有限。
(2)采样方法:如最远点采样,通过主动丢弃部分点来贴近密度一致,但破坏原有特征描述。
(3)密度估计方法:基于距离的方法、核密度估计KDE、SDV方法,但需要足够量的采样才能对抗密度变化。
3、对比学习
对比学习一般用于视觉领域,现在也扩展到音频、文字等,由于稳定性和信息量的提高,采样更多、更困难的负样本来提高特征质量,对正样本的改进很少。本文考虑使用组对比学习,来优化三维点云配准中的密度变化问题。
四、GCL方法
GCL方法如何用在点云配准?
参考上图的左侧部分,对于原始的backbone进行多次GCL工作,更新backbone的权重,再砍右侧部分,将backbone作为推理框架(测试框架)的一部分,输入源点云和目标点云,通过ransac后处理,求得姿态估计。
GCL方法
GCL方法共有三个阶段:
首先,在输入的点云中随机采样一个中心点云组,以及周围采样多个临近点云(保证均匀分布),形成多个点云组。
然后,计算每个点云组内部的特征相似度,并最小化组内特征差异,提高特征密度不变性。
最后,最大化不同组之间的特征差异,增强特征区分度。
以往的PCL方法
PCL(Pair contrastive learning)成对对比学习,指的是以往使用点对关系来进行点云配准的工作。
1、U型曲线假设
由于传统的成对对比学习中采样存在偏差,正样本特征并不是独立分布的,而存在强相关性,所以我们考虑这个强相关性是满足什么共性。
过去的近距离点云配准工作中,正样本近距离存在强相关性,远距离存在弱相关性,不会对近距离点云造成大的影响。而远距离点云配准后,强相关性消失,更容易收到采样影响。
对于下图来说,表示两个激光雷达位置,位置不变,对于共线的点分别与两个激光雷达测量点与雷达距离得到,当采样多个点时满足右图U型曲线。
那为什么容易采样到共线的点呢?
由于点云密度不一致的问题,导致对于室外场景远距离点云数据中,更容易采集到路边这种点,导致密度较大,此时再进行统计点云数据,会出现多条共线的点(被迫),所以存在U型曲线,但对于外景的理解并没有意义,所以我们通过其他的方式克服这种采样的影响,从而诞生了GCL方法。
论文参考:https://arxiv.org/abs/2307.09788
FCGF参考:FCGF