SLAM论文速递【SLAM—— TwistSLAM:动态环境下的约束SLAM】—4.17(2)

news2024/11/14 1:55:55

论文信息

题目:

Optimization RGB-D 3-D Reconstruction Algorithm Based on Dynamic SLAM
基于动态SLAM的RGB-D三维重建算法优化

论文地址:

https://ieeexplore.ieee.org/abstract/document/10050782

发表期刊:

 IEEE Transactions on Instrumentation and Measurement ( Volume: 72)

标签

几何+深度学习、动态特征点剔除、特征点重提取

摘要

为实现智能机器人动态环境下的SLAM系统建图,在动态分割框架DynaSLAM的基础上,提出一种鲁棒的动态特征分割SLAM三维重建算法。该算法采用特征点重提取的方法来解决原始特征点数量不足的问题。在预处理阶段,设计了优化的极线几何模型,并与Mask R-CNN联合进行图像分割。在点云后处理阶段,利用核主成分分析(PCA)进行降噪处理,然后设计基于八叉树的动态滤波方法进行进一步处理。这种处理有效地消除了额外的动态异常值。在TUM和Bonn数据集上的实验结果表明,该算法在高动态环境下比DynaSLAM算法取得了10%以上的姿态估计精度提升,并优于目前最先进的(SOTA)算法。

内容简介

本文提出了一种动态滤波点云优化稠密重建算法。提高了动态环境下位姿估计的准确性,减少了重建模型中残留的动态特征。下面是本文最重要创新的总结:
1)对Mask R-CNN和多视图几何分割得到的图像进行特征点重提取,增加有效特征点的数量。利用关键帧进行三维重建,更新三维模型。

2)利用对极几何和高斯分布概率模型,设计多视角几何方法,以提高判断的准确性和动态分割效果。

3)采用核主成分分析(PCA)和八叉树模型调节的统计滤波,消除离群点云,分割动态特征点并滤除其他噪声点

首先,利用Mask R-CNN对每帧RGB图像中潜在的动态对象(主要是人)进行分割;
同时,对分割后的像素点采用膨胀法进行放大。
同时,采用一种低成本的跟踪方法获得摄像机的近似位姿。
然后,利用投影误差参考关键帧检测动态点;然后,通过深度学习方法和多视图几何分割方法得到掩模,并根据掩模去除深度图像对应的深度信息;
对于去除动态信息的帧,再次提取特征点;利用特征点重新训练词袋模型,构建新的词汇树。
在此基础上,构建当前帧,计算相机位姿以生成地图。在构建图的过程中,对当前点云进行下采样后,首先利用核PCA进行闪烁,然后利用八叉树方法进行统计滤波,去除动态特征。这个过程可以进一步过滤几个剩余的动态特征。
在这里插入图片描述

评价

该文提出了一套动态SLAM和三维重建优化算法。该算法继承ORB SLAM2的位姿估计和后端优化框架,借鉴并增强了DynaSLAM动态分割算法,设计了一种基于极线几何模型的多视角几何方法,增强了动态分割性能。采用特征点重提取来解决特征丢失问题。利用核PCA和八叉树模型调节的统计滤波,对点云进行筛选优化,剔除外部点,从而降低噪声。所提算法在多个动态数据集的映射中表现出良好的准确性和稳定性。适合在复杂的动态环境中运行。然而,该算法仍然存在问题。现有的深度学习框架结合多角度几何方法在动态特征不明显和无法完全过滤的情况下是无效的,需要开发更鲁棒的未来深度学习框架或新的分割技术。所提算法的速度也有待提高。

阅读启发

该文章利用几何方法和深度学习的方法滤除动态特征点,然后对滤除的图像进行特征重提取,解决了滤除后特征的点少的问题,这是我理解到的创新思路,由于刚入门slam,许多理论上的知识还不懂,可能会有一些理解不到位的地方。
总的来说,该论文的创新点比较新颖,采用特征点重提取的方法值得借鉴,

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/447302.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Apache POI 实现用Java操作Excel完成读写操作

简介 Apache POI是一个用于操作Microsoft Office格式文件(包括xls、docx、xlsx、pptx等)的Java API库。POI全称为Poor Obfuscation Implementation,是Apache Software Foundation的一个开源项目。它提供了一组Java API,使得Java程…

LLM_StableDiffusion_studio发布

背景: 从chatgpt发布到现在已经超过半年时间,AGI的势头越来越猛。大家都在做各种的尝试和组合,把chatgpt通用的强大的知识表达和理解能力尝试应用在自己的业务场景。前期也是出现非常多的业务应用,但是主要还是围绕chatgpt本身已…

循环神经网络(RNN)简单介绍—包括TF和PyTorch源码,并给出详细注释

文章目录 循环神经网络(RNN)入门教程1. 循环神经网络的原理2. 循环神经网络的应用3. 使用keras框架实现循环神经网络3.1导入对应的库及加载数据集3.2.数据预处理3.3定义RNN模型3.4训练模型3.5测试模型 4.使用PyTorch框架实现上述功能—注释详细5.结论 循…

动静态库的制作和使用

动静态库 一,什么是库二,静态库的制作静态库原理 三,动态库的制作四,动态库的配置五,动态库的加载 一,什么是库 🚀库这个东西我们一直在使用,举个简单了例子,无论你是用…

netplan, NetworkManager, systemd-networkd简介

1、systemd-networkd简介 systemd-networkd是systemd 的一部分 ,负责 systemd 生态中的网络配置部分(systemd-networkd.service, systemd-resolved.service)。使用 systemd-networkd,你可以为网络设备配置基础的 DHCP/静态IP网络等,还可以配…

U8W/U8W-Mini使用与常见问题解决

U8W/U8W-Mini使用与常见问题解决 U8WU8W/U8W-mini简介准备工作U8W/U8W-mini在线联机下载U8W/U8W-mini脱机下载第一步,把程序下载到U8W/U8W-mini烧录器中:第二步,用U8W/U8W-mini烧录器给目标单片机脱机下载 U8W/U8W-mini烧录器使用中常见的问题…

初识Linux运维

一.初识Linux 1.Linux系统内核 内核提供了Linux系统的主要功能,如硬件调度管理的能力。 Linux内核是免费开源的,任何人都可以查看内核的源代码,甚至是贡献源代码。 2.Linux系统发行版 内核无法被用户直接使用,需要配合应用程…

淘宝iOS拍立淘微距能力探索与实现

画面模糊问题的源头也是来自用户的微距体验不佳,我们对问题深入分析,适当拆解。通过 Apple Development Doc 的查阅及实践,一步步抽丝剥茧,最终完美解决用户的体验痛点,也为我们自身沉淀了展示微距的能力。 前言 在最近…

Unix和Linux

UNIX 诞生于 20 世纪 60 年代末 Windows 诞生于 20 世纪 80 年代中期 Linux 诞生于 20 世纪 90 年代初 1965 年,贝尔实验室、美国麻省理工学院和通用电气公司联合发起了Multics 工程计划,目标是开发一种交互式的、具有多道程序处理能力的分时操作系统&a…

NTP服务与SSH服务

NTP:时间同步服务,采用UDP协议,端口号为123。 配置NTP时间服务器,确保客户端主机能和服务主机同步时间 首先,我们必须确保服务端与客户端在同一时区。 更改时区:timedatectl set-timezone asia/shanghai …

隋唐洛阳“西宫”:上阳宫的GIS视角

隋唐洛阳城简介 营建 隋大业元年(605年),在隋炀帝的授意下,隋代著名城市设计师宇文恺,在汉魏故城以西重新选址,历时8个月,日役劳工200万,兴建新都洛阳城。 城和苑 隋唐洛阳城采用…

页面注册案例

效果图: 分析业务模块: 发送验证码模块各个表单验证模块勾选已经阅读同意模块下一步验证全部模块:只要上面有一个input验证不通过就不同意提交 业务 1 :发送验证码 用户点击之后,显示05秒后重新获取时间到了&…

大国护眼学习笔记01

第一天(23.4.17) 2—11节什么是近视? 1、“近视离焦”是指成像点落在视网膜的哪里? 前面 2、“远视离焦”是指成像点落在视网膜的哪里? 后面 3、眼轴变长时,成像点会往前移还是往后移? 前移 4、…

毛灵栋 : 以兴趣为壤,育能力之实 | 提升之路系列(一)

导读 为了发挥清华大学多学科优势,搭建跨学科交叉融合平台,创新跨学科交叉培养模式,培养具有大数据思维和应用创新的“π”型人才,由清华大学研究生院、清华大学大数据研究中心及相关院系共同设计组织的“清华大学大数据能力提升项…

【RP-RV1126】Ubuntu上配置Buildroot Qt 开发板远程开发调试环境(SSH)

文章目录 一、前提二、基础设置建设Buildroot编译Qt5配置SSHBuildroot文件系统添加账号密码开发板联网Buildroot文件系统构建时打开rsync功能 三、QtCreator配置3.1 配置Qt交叉编译套件(Kits)配置Kits里面的交叉编译器配置Kits里面的qmake工具最后配置Kits 3.2 配置远程部署设备…

VLAN基础实验

实验要求: 1、PC1和PC3所在接口为Access接口 PC2/4/5/6处于同一网段:其中PC2可以访问PC4/5/6 PC4可以访问PC5,但不能访问PC6 PC5不能访问PC6 2、PC1/3与PC2/4/5/6不再同一网段 3、所有PC通过DHCP获取IP地址,且PC1/3可以正常访问PC2/4/5/6 实…

tkinter-TinUI-xml实战(9)crosschat客户端

tkinter-TinUI-xml实战(9)crosschat客户端 引言声明文件结构核心代码服务端连接登录界面主页面主文件 结语 引言 CrossChat(十字街)是一个线上匿名群聊平台,类似Hack.Chat。 现在通过websocket简单地构建一个cc的客户…

随机蛙跳算法 (SFLA)简单实现(Matlab代码实现)

目录 💥1 概述 📚2 运行结果 🎉3 参考文献 👨‍💻4 Matlab代码 💥1 概述 随着计算机科学与技术的迅速发展,人类生存空间的扩大以及认识与改造世界范围的拓宽,人们对科学技术提出了新的和更高的要求,其…

android中线程池的选择

线程池是把一个或多个线程通过统一的方式进行调度和重复使用的技术。 避免了因为线程过多而带来使用上的开销。 在安卓开发中,为了更好的性能体验,我们在选择线程池的时候,需要从具体需求来考虑,主要考虑以下几方面: …

计算机类专业的普通校招生毕业如何“卷”一份好工作?

毕业差不多两年的校招生有感 一、为什么写这篇文章?二、我 → 一名普通的校招生前身三、我 → 一名普通的校招生养成四、校招如何拿到offer?五、总结 一、为什么写这篇文章? 一开始我写CSDN是为了记录自己学习技术的小日记,小总结…