论文阅读:RGBD GS-ICP SLAM

news2025/1/20 18:37:52

目录

概要

Motivation

整体框架流程

技术细节

小结


论文地址:[2403.12550] RGBD GS-ICP SLAM (arxiv.org)

代码地址:https://github.com/Lab-of-AI-and-Robotics/GS-ICP-SLAM


概要

RGBD GS-ICP SLAM 是一种结合通用迭代最近点算法(Generalized Iterative Closest Point, G-ICP)和3D高斯投影(3D Gaussian Splatting, 3DGS)的密集表示SLAM系统,旨在通过共享同一3D高斯地图提高SLAM性能。该方法通过在跟踪与映射过程间交换协方差信息,减少了冗余计算,提升了跟踪精度和地图质量,实现了最高107 FPS的实时性能。

Motivation

尽管基于3DGS的SLAM方法利用了高速渲染,但它们未能解决一个根本性问题:无法直接利用三维显式表示并通过二维图像渲染间接跟踪三维空间。即使大多数当前的基于3DGS的SLAM利用RGB-D数据,也忽视了显式表示的使用。

(1)提出了一个实时密集表示SLAM,结合了G-ICP和3DGS,实现了整个系统的极高速度(最高达107 FPS)和地图的优质性。

(2)通过将G-ICP用于跟踪,该系统积极利用三维信息,并显著减少了跟踪过程所需的时间。

(3)通过共享G-ICP和3DGS的协方差,并采用尺度对齐技术,实现了计算成本的减少和3DGS原始数据的快速收敛。

整体框架流程

系统概述。 系统的输入是RGBD帧。通过对当前深度图像进行降采样和重新投影来生成点云,并在GICP过程中利用它。在GICP过程中,从点云中创建源高斯,并通过将它们与目标高斯(这些高斯是3D GS地图的子集)对齐来估计当前相机姿态。如果当前帧被确定为关键帧或仅用于地图的关键帧,将源高斯添加到3D GS地图中作为新的基元。同时,在地图构建过程中,优化高斯与高斯的颜色和不透明度集,与跟踪过程同时进行。

  • 输入RGBD帧:系统输入RGBD帧并生成当前帧的点云。
  • G-ICP跟踪:使用G-ICP计算帧之间的协方差,通过最优变换矩阵对齐点云,实现相机位姿估计。
  • 关键帧选择:根据几何对应关系动态选择关键帧。
  • 3DGS映射:将选择的关键帧作为3DGS映射的一部分,优化高斯的坐标和协方差。
  • 并行优化:在跟踪的同时进行映射优化,保证系统性能。

技术细节

  • G-ICP跟踪:通过计算当前帧和地图的高斯协方差矩阵,找到最优位姿变换。通过最大似然估计计算出每帧的最优变换矩阵。
  • 3DGS映射:在映射过程中,3DGS将3D空间表示为高斯集合,通过光栅化方法加速渲染。跟踪过程中计算的协方差直接用于映射,避免了冗余计算。
  • 关键帧选择:根据当前帧与地图的几何对应关系选择关键帧,避免跟踪过程中误差积累​。报告的数值代表来自 Replica 数据集的八个场景的平均结果。当每 n 帧选择关键帧(以蓝色表示)时,跟踪准确性明显较低。相反,这篇文章的关键帧选择方法产生了最高的跟踪准确性。

在 Replica office4 上分离关键帧选择。 证明了少量跟踪关键帧可以产生准确的轨迹估计(案例1),而大量建图关键帧可以提高渲染性能(案例2)。因此,作者采用案例3,在不同的间隔时间内分别选择跟踪关键帧和映射关键帧。

  • 尺度对齐:通过在G-ICP跟踪中对帧的尺度进行正则化,保证高精度的位姿估计​。

不足

  • 噪声问题:该系统过度依赖深度信息,在处理真实环境中的深度噪声时,重建地图的质量受限
  • 图像质量权衡:为提高速度,系统在某些场景下可能牺牲一定的图像重建质量​。

优点

  • 高效计算:通过共享跟踪与映射过程中的高斯协方差,减少了冗余计算,大幅提升系统速度​。
  • 实时性能:系统的处理速度最高可达107 FPS,能够支持实时SLAM。
  • 准确跟踪:与传统方法相比,系统显著提高了相机位姿的估计精度,尤其是在复杂场景下​。

小结

RGBD GS-ICP SLAM 通过结合G-ICP与3DGS,实现了高效的跟踪和映射。该系统通过共享协方差信息和动态关键帧选择,提升了SLAM的性能和速度,同时在追求高效的同时仍保持了较高的地图重建质量。

文章提出了RGBD GS-ICP-SLAM,这是一种利用三维高斯表示进行高保真度空间表示的密集表示SLAM系统。作者证明了利用单一三维高斯地图进行跟踪和建图的G-ICP和3DGS的融合可以产生相互的好处。跟踪和建图过程之间的高斯交换与尺度对齐最小化了冗余计算并构建了一个高效的系统。此外,动态关键帧选择方法提高了跟踪和建图性能。通过广泛的实验,所提出的方法在空间表示、相机位姿估计和总系统速度方面呈现出最先进的性能。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2125399.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【基础算法总结】前缀和

目录 一,前缀和算法介绍二,算法原理和代码实现【模板】前缀和【模板】二维前缀和724.寻找数组的中心下标238.除自身以外数组的乘积560.和为k的子数组974.和可被k整除的子数组525.连续数组1314.矩阵区域和 三,算法总结 一,前缀和算…

可能一拆为二,英特尔为何走到今天这一步?

【科技明说 | 科技热点关注】 近来看到外媒消息说,英特尔迫于经营压力,也不得不铤而走险,欲将英特尔一分为二,即芯片制造与芯片设计分离开,互相剥离,独立发展。 于是乎,英特尔将分拆…

图卷积神经网络GNN(一)

图卷积神经网络GNN 研究学习的背景 对于图神经网络(GNN)来输入的数据是图。(解决输入数据不规则情况)输入的格式不是固定的 研究涵盖:节点分类(nodeclassification)、边预测(link…

​ArcGIS Pro和ArcGIS的10大区别

本文来源:水经注GIS公众号 如果你经常使用ArcGIS 进行制图和分析,那么你一定听说过ArcGIS Pro,这款软件是Esri未来主打的一款桌面GIS软件,那么这款软件和ArcGIS相比有什么不同呢,这里为你列举了两款软件的10大区别&am…

海康威视相机在QTcreate上的环境配置教程(qt+opencv+海康SDK)

环境配置教程 前言:环境配置:1.海康SDK2.opencv 参考导入文件 前言: 配置环境是编程的第一步,所以写这篇文章来指导环境的配置。如果已经配置好了,想在qt上使用海康的摄像头,可以参考这篇文章:…

骨传导耳机哪个品牌好用?良心测评推荐5大高分骨传导耳机!

在快节奏、数字化的生活时代,耳机成为连接外界与个人世界的桥梁,尤其在户外运动和健身场景中更是不可或缺。传统入耳式耳机虽然携带方便、音质优秀,但长时间佩戴会对耳道和鼓膜造成压力,甚至引发耳部不适。为解决这一痛点&#xf…

windows下自启springboot项目(jar+nginx)

1、将springboot项目打包为jar 2、新建文本文档 test.txt,并输入 java -jar D:\test\test.jar(修改为自己的jar包位置) 保存 然后修将后缀名改为 .bat 3、在同一目录再新建 文本文档test.txt,输入以下内容,&…

Meme“淘金”热潮下:Meme发射平台的安全风险分析

2023年,Meme赛道成为加密市场和各大公链生态的重点关注板块之一,尤其是在Solana等公链上,Meme代币迎来了爆发。许多Meme代币的交易量飙升,年初Solana生态中的Meme代币交易额甚至达到百亿美元。乘着Meme代币的东风,Meme…

VSCode配置 C/C++ 开发环境

目录 1.概述 2. 安装 C/C 扩展 3. 安装编译器 3.1.Windows 3.2.macOS 3.3.Linux 4. 配置 VSCode 5. 构建和运行 1.概述 在 Visual Studio Code (VSCode) 中配置 C/C 开发环境,需要安装一些扩展和正确配置编译器。以下是详细的步骤: 2. 安装 C/C…

Agilent MSO7104A安捷伦示波器1G 4通道

Agilent MSO7104A安捷伦示波器1G 4通道 附加功能: 带宽:1 GHz 通道:4 个模拟和 16 个数字 采样率:4 GSa/s 记录长度:标准 8 Mpts MegaZoom III 深存储器 垂直分辨率:8位 自动缩放和峰值检测 有见地的…

数据分类:成功DLP的基本要求

现如今我们存储数据的方式发生了巨大变化,从优质硬盘到今天的云存储解决方案,存储技术的进步大幅削减了成本,并使组织能够呈指数级增长的数据,我们都在利用这一点。 事实上,数据每年以惊人的 25% 的速度增长&#xff…

顶级PCVR头显具备什么配置?清晰度如何?

头戴式显示器是VR体验中用户与虚拟现实环境交互不可或缺的一部分。高端的头显通常可为使用者提供具有超高分辨率的高清画面,因此当你拥有一部高端的VR头显,虚拟世界将如真实世界一样呈现在你眼前。 说到顶级头显我们就不得不提到Varjo,Varjo是…

最全的性能测试性能诊断工具清单

给做性能问题的诊断需要用到的工具分一下类的话,主要有以下类,网络通信报文抓取工具、基础软件监控工具、第三方资源监控工具、专业性能诊断工具和反编译工具。 接下来我们就分别说说,每类里面都有哪些工具。首先第一类是网络通信报文抓取工…

【CanMV K230 AI视觉】人脸3D网格

【CanMV K230 AI视觉】人脸3D网格 人脸3D网格 (动态测试效果可以去下面网站自己看。) B站视频链接:已做成合集 抖音链接:已做成合集 人脸3D网格 人脸3D网格,在检测到人脸后用多个点描绘整个脸,从而把人脸…

Java导入、导出excel保姆级教程(附封装好的工具类)

前言 我们在日常开发中,一定遇到过要将数据导出为Excel的需求,那么怎么做呢?在做之前,我们需要思考下Excel的组成。Excel是由四个元素组成的分别是:WorkBook(工作簿)、Sheet(工作表)、Row(行)、Cell(单元格)&#xff…

深度学习-目标检测(四)-Faster R-CNN

目录 一.模型框架 二:步骤详细 1.conv layers 2.RPN 3.anchors 4.cls layer分类 5.reg layer回归 6.Proprosal 7.Rol pooling 8.Classification 三.训练 1.训练RPN网络 2.全连接层部分训练: 都看到这里了,点个赞把!&a…

adb有线连接正常,adb connect失败

adb connect失败 1. 确认两个设备在同一个局域网 2. 确认此网络是否有adb连接的权限(有的公司网络不允许adb) 3. 确认防火墙设置 如果前面3步都确认没问题,Ping ip也能成功,那么有可能就是端口的问题: step1: 先用有线连接设备&#xff0…

DBeaver连接数据库报连接错误:Public Key Retrieval is not allowed

问题描述 使用DBeaver软件连接mysql数据库的时候,有如下提示信息: 解决办法 点击驱动属性->找到allowPublicKeyRetrieval这项,把值设置为TRUE,再点击连接测试 可以成功连接到mysql数据库,问题解决~

面试题 Spring bean 循环依赖解决方案以及三级缓存讲解

文章目录 Spring bean 循环依赖1.1 什么是循环依赖1.2 Spring循环依赖几种情况 什么是三级缓存到底是什么东西,三级缓存做了什么?三级缓存源码讲解 Spring bean 循环依赖 1.1 什么是循环依赖 当面试官问到你给我讲一下什么是循环依赖吧,该如…

简单数据库sqlite

目录 数据库 简介 1、分类: 大型 中型 小型 2、名词: 3、嵌入式数据库: 4、sqlite3的安装: LTS long term support 5.1、sqlite3的使用: 0、启动sqlite3 1、系统维护命令:> .help 5.2、标准SQL…