最近在学习SLAM技术与测绘三维影像重建的相关知识,结合自己的感受,撰写一下对于单目视觉SLAM利用无人机影像重建三维地形的一些看法。
1. 单目视觉SLAM系统在三维地形重建中所面临的挑战有哪些?
单目视觉SLAM众所周知的一个问题是:深度的不确定性。为了能够使单目传感器能够估计自身的深度及其位置,必须使相机必须具有良好的运动(特别是平移),并能够观察到部分或者完全相同的场景(即场景具有一定的重叠率),这也是摄影测量学中对于影像拍摄的要求。
因此,利用其他传感器所产生的数据进行辅助观测就成为了一种比较常见的补充手段,比如惯性测量数据。目前,各类型无人机都配备了IMU这类惯性测量设备,能够为单目SLAM系统提供更为充足的观测数据,有助于解决单目SLAM中遇到的深度估计模糊问题。
2. 哪一种类型的视觉SLAM系统更加适合无人机影像三维地形生成?
一般来说,SLAM能够生成稀疏或者稠密的点云地图。
稠密地图能够提供更为丰富的场景信息,但是也增加了外点产生的机率。而稀疏地图能够保持点云数量在一定数量之下,更加适合构建网格(mesh)的构建。
从跟踪方式的来说,直接法包含了对应像素的强度信息,可以直接在点云地图中使用;所懈怠的颜色通道信息也能够生成带颜色的点云。而间接法采用的是特征描述子对图像进行抽象,无法存储关于强度的信息。因此,如果仅只是做表面重建,而不是点云地图,间接法更具优势。
此外,视觉传感器的类型也是这一问题需要考虑的因素,这里直接说结论了:全局快门的相机要比卷帘快门的相机更适合直接法SLAM系统,而带有卷帘快门相机的无人机来说,使用基于特征的SLAM系统可能会更好。
3. 间接法(比如ORB-SLAM3)和间接法(比如DSO、LDSO等)所生成的点云与真值相比,精度如何?如何对其进行评价?
首先,评估点云的最佳方式就是要求数据集中具有使用激光扫描仪采集的真实点云数据,并使用RMSE评估。但如果没有此类数据,可以使用SFM等替代技术构建非直接测量的伪真值数据;再使用MPPE等方法进行评估,以补偿构造的伪真值中的稀疏性。
其次,视觉传感器的类型和标定同样影响了结果的精度。全局快门的传感器由于没有引入伪影,所以建议大家首选。对于直接法的SLAM系统来说,正确的光度校准也是除几何校准外,必须要考虑的问题。
最后,就是SLAM系统的初始化参数同样可以影响点云地图的精度。
4. 如何采集无人机影像才能保证系统的稳定?
从这一点来看,我们可以借鉴摄影测量的相关知识,比如进行航迹的规划,采用一种蛇形方式进行影像的获取,并且设定好相关参数,保证一定的航向重叠与旁向重叠。如下图:
同时,我们还需要注意在大范围旋转或者地面缺少可靠特征时,视觉SLAM系统容易失去对自身位置的跟踪,也就是进入LOST的状态。
参考文献:《Evaluation of Monocular Visual SLAM Methods on UAV Imagery to Reconstruct 3D Terrain》