SLAM论文速递:SLAM—— MID-Fusion:基于八叉树的对象级多实例动态SLAM—4.26(1)

news2025/1/6 20:24:47

论文信息

题目:

MID-Fusion:Octree-based Object-Level Multi-Instance Dynamic SLAM

MID-Fusion:基于八叉树的对象级多实例动态SLAM

论文地址:

https://ieeexplore.ieee.org/abstract/document/8794371

发表期刊:

2019 International Conference on Robotics and Automation (ICRA)

标签

xxxx

摘要

摘要本文提出了一种新的基于对象级八叉树体表示的多实例动态RGB D SLAM系统。它可以在动态环境中提供鲁棒的摄像机跟踪,同时连续估计场景中ar二元物体的几何、语义和运动属性。对于每个传入的帧,进行实例分割,以检测目标,并使用几何和运动信息完善掩膜边界。同时,使用面向对象的跟踪方法估计每个现有运动目标的姿态,并在静态场景下鲁棒地跟踪相机姿态。基于估计的相机姿态和物体姿态,将分割的掩码与现有模型相关联,并将相应的颜色、深度、语义和前景物体概率增量融合到每个物体模型中。与现有方法相比,该系统是第一个从单个RGB-D相机生成对象级动态体数据地图的系统,可直接用于机器人任务。该方法可以在CPU上以2 ~ 3hz的速度运行,不包括实例分割部分。通过在合成和真实世界序列上进行定量和定性测试来证明其有效性。

内容简介

本文提出了第一个用于室内环境应用的对象级动态体数据地图,可以表示每个对象模型的自由空间和表面连通性。通过利用基于八叉树的结构进一步提高其存储效率。尽管显示了一些基于深度学习的有希望的结果,但大多数方法[,只是利用神经网络的预测,没有在地图融合中进行太多细化。本文通过将语义预测融合到对象模型中来集成和改进语义预测。本文的主要贡献分为四个主要部分。本文提出

1)第一个使用体表示的RGB-D多实例动态SLAM系统;
2)一种更鲁棒的跟踪方法,利用测量不确定性加权并被重新参数化以进行目标跟踪;
3)一种使用几何、光学和语义信息的集成分割;
4)在基于八叉树的对象模型中概率融合语义分布和前景对象概率。
在这里插入图片描述
图2显示了我们提出的系统的管道。该方法由分割、跟踪、融合和光线投射4部分组成。通过Mask R-CNN对每个输入的RGB-D图像进行处理以进行实例分割,然后进行几何边缘分割和运动残差跟踪以细化掩膜边界(第IV-D部分)。对于跟踪,首先对除人体掩模区域(Section IV-B)以外的所有顶点跟踪摄像机,然后从此姿态进行光线投射,以查找此帧中当前可见的对象。这也有助于将局部对象掩码与现有对象模型关联起来。评估每个物体的运动残差,以确定它是否在运动中,然后跟踪运动物体(第IV-C节),并针对静态世界(包括当前静态物体)改进相机姿态(第IV-B节)。利用相机和物体的估计姿态,深度和颜色信息,以及预测的语义和前景概率融合到目标模型中(第IV-E节)。可见物体的检测以及光线投射将在第四- f节中解释。

评价

论文标题:基于对象级八叉树体素表示的多实例动态RGB-D SLAM系统

方法:

使用对象级八叉树体素表示实现多实例动态RGB-D SLAM系统。
通过测量不确定性加权和重新参数化对象跟踪,实现更加稳健的跟踪方法。
集成利用几何、光度和语义信息的分割方法。
将语义分布和前景对象概率融合到八叉树对象模型中。
创新点:

提出了第一个使用体积表示的RGB-D多实例动态SLAM系统。
通过权重测量不确定性的方法,提高了跟踪的稳定性。
集成了几何、光度和语义信息的分割方法,使得分割更为准确。
将语义分布和前景对象概率融合到八叉树对象模型中,提高了地图表示的精度。
精炼总结:
这篇论文提出了一种基于八叉树体素表示的多实例动态SLAM方法。通过集成几何、光度和语义信息的分割方法,更加稳健的跟踪方法,以及将语义分布和前景对象概率融合到八叉树对象模型中,实现了在动态环境中对摄像机位姿的稳定跟踪和对场景中各个物体的连续估计。实验结果证明了该方法在室内环境中的有效性。

创新建议(结合动态场景下的SLAM问题):

结合深度学习方法,进一步提高动态对象检测和分割的准确性。
探索在户外环境中应用此方法,并对不同环境条件下的性能进行评估。
针对特定的动态场景(如人群聚集、交通繁忙等),优化算法以适应这些特殊情况。
将此方法与其他传感器(如激光雷达、IMU等)融合,以提高鲁棒性和准确性。
在建立地图的过程中,引入物体的运动模型,以预测动态物体在短时间内的运动,从而进一步提高SLAM系统的性能。

阅读总结

创新点很多,值得借鉴,本人表示没看懂

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/462698.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

LVS-NAT模式

什么是群集? 多台主机组成的一个整体,提供一个ip访问通道,所有的主机干一件事 提供同样的服务。 群集有哪些类型? ①负载均衡群集(LB): 提高系统的响应能力,处理更多的访问请求&am…

Linux进程(1)

目录 ⛹🏽进程简介⛹🏽查看进程⛹🏽系统调用🚴🏽获取进程标示符🚴🏽创建进程 ⛹🏽进程状态🚴🏽孤儿进程:🚴🏽进程优先级 ⛹…

一次使用netcat的经验记录

1.netcat安装 参考:https://my.oschina.net/u/3530967/blog/1560985 2.netcat使用 参考:https://zhuanlan.zhihu.com/p/83959309 3.创建udp服务 (1)使用:nc -l -u -p 8810 创建udp服务端监听8810端口 在另一台机…

基于信度感知的半监督医学图像分类对比自集成

文章目录 Reliability-Aware Contrastive Self-ensembling for Semi-supervised Medical Image Classification摘要本文方法Reliability-Aware Contrastive Mean TeacherWeight FunctionReliability-Aware Consistency LossReliability-Aware Contrastive LossObjective Functi…

windows 安装mysql5.7

确认是否安装了mysql winr 输入services.msc , 找mysql 下载 链接:https://pan.baidu.com/s/1zPuvzjWovky3MrpNlIt9uw 提取码:y52i 安装 https://blog.csdn.net/u012318074/article/details/124042756 家目录下新建配置文件 my.ini 注意路径中 // &a…

企业进行数字化转型的优劣势分别有哪些?

数字化转型是指将数字技术融入企业的方方面面,从而导致企业运营方式和为客户创造价值的方式发生根本性变化。企业数字化转型既有优势也有劣势,概述如下: 优点: 提高效率和生产力:数字化转型使企业能够自动化和简化业…

Session服务端会话追踪

1. Session基本使用 将数据(cookie)保存在客户端不安全,因为客户端在不停的进行着网络传输,所以把数据存储在服务端。 存储的对象就是session,例如AServlet往session中存数据,BServlet往session中读数据。 …

纯 CSS 实现几个 Loading 效果

1. 平滑加载 <div class"progress-1"></div>.progress-1 {width:120px;height:20px;background:linear-gradient(#000 0 0) 0/0% no-repeat#ddd;animation:p1 2s infinite linear; } keyframes p1 {100% {background-size:100%} }linear-gradient(#000 0…

11.java程序员必知必会类库之word处理库

前言 正常业务中&#xff0c;可能涉及到和合作方签约电子合同&#xff0c;此时&#xff0c;我们需要先设计合同模板&#xff0c;维护固定内容&#xff0c;将可变的内容通过占位符替代&#xff0c;等签章的时候&#xff0c;生成pdf,然后可以根据设计的合同章的坐标&#xff0c;…

家庭私人影院 - Windows搭建Emby媒体库服务器并远程访问 「无公网IP」

文章目录 1.前言2. Emby网站搭建2.1. Emby下载和安装2.2 Emby网页测试 3. 本地网页发布3.1 注册并安装cpolar内网穿透3.2 Cpolar云端设置3.3 Cpolar内网穿透本地设置 4.公网访问测试5.结语 1.前言 在现代五花八门的网络应用场景中&#xff0c;观看视频绝对是主力应用场景之一&…

第十章_Redis集群(cluster)

是什么 定义 由于数据量过大&#xff0c;单个Master复制集难以承担&#xff0c;因此需要对多个复制集进行集群&#xff0c;形成水平扩展每个复制集只负责存储整个数据集的一部分&#xff0c;这就是Redis的集群&#xff0c;其作用是提供在多个Redis节点间共享数据的程序集。 官…

cad怎么转换成pdf格式,3个方法快速搞定

cad怎么转换成pdf格式&#xff1f;首先我们来了解一下CAD是什么。CAD是一种计算机辅助设计软件&#xff0c;其文件格式为DWG&#xff08;Drawing&#xff09;和DXF&#xff08;Drawing Exchange Format&#xff09;。DWG是CAD程序的本地文件格式&#xff0c;用于存储2D和3D图形…

【LLM】LLaMA简介:一个650亿参数的基础大型语言模型

LLaMA简介&#xff1a;一个650亿参数的基础大型语言模型 PaperSetup其他资料 作为 Meta 对开放科学承诺的一部分&#xff0c;今天我们将公开发布 LLaMA (大型语言模型 Meta AI) &#xff0c;这是一个最先进的大型语言基础模型&#xff0c;旨在帮助研究人员推进他们在人工智能这…

刘宇:如何打造快、稳、易、专的多元数据库运行平台

导语 4月8日下午&#xff0c;为期两天的第十二届数据技术嘉年华&#xff08;DTC 2023&#xff09;在北京新云南皇冠假日酒店圆满落下帷幕。大会以“开源融合数字化——引领数据技术发展&#xff0c;释放数据要素价值”为主题&#xff0c;汇聚产学研各界精英到场交流。云和恩墨作…

直面GPT-4的缺陷和风险,OpenAI提出多种安全应对措施

深入研究OpenAI官方团队发布的长达99页的技术报告&#xff0c;我们发现在GPT-4光鲜亮丽功能的背后&#xff0c;还隐藏了OpenAI团队付出的的汗水和努力&#xff0c;尤其是在缓解GPT模型自身缺陷和模型安全落地方面。 报告链接&#xff1a; https://arxiv.org/abs/2303.08774 一、…

UEditorPlus v3.0.0 样式CSS变量,支持Mind代码类型,若干问题修复

UEditor是由百度开发的所见即所得的开源富文本编辑器&#xff0c;基于MIT开源协议&#xff0c;该富文本编辑器帮助不少网站开发者解决富文本编辑器的难点。 UEditorPlus 是有 ModStart 团队基于 UEditor 二次开发的富文本编辑器&#xff0c;主要做了样式的定制&#xff0c;更符…

kafka单节点快速搭建

1.搭建使用centos7主机&#xff0c;关闭防火墙和selinux服务 2.创建kafka存放目录 mkdir /etc/kafka 3.从kafka官网下载安装包 我这里下载了3.3.1版本的kafka&#xff0c;放到kafka目录中 下载地址&#xff1a;Apache Kafka 4.解压安装包并更改名称 tar -zxvf /etc/kaf…

Three.js教程:顶点索引复用顶点数据

推荐&#xff1a;将 NSDT场景编辑器 加入你3D工具链 其他工具系列&#xff1a; NSDT简石数字孪生 顶点索引复用顶点数据 通过几何体BufferGeometry的顶点索引属性BufferGeometry.index可以设置几何体顶点索引数据&#xff0c;如果你有WebGL基础很容易理解顶点索引的概念&#…

如何建立Linux与git的连接?

文章目录 建立连接三板斧&#xff1a; 本文以Xshell为案例进行与git的连接&#xff01; 建立连接三板斧&#xff1a; add , commit ,push Linux与git远程连接的方法&#xff1a; 1.设置全局的用户名和邮箱 git config – global user.name “你的用户名” git config – glo…

JMeter学习(一)工具简单介绍

一、JMeter 介绍 Apache JMeter是100%纯JAVA桌面应用程序&#xff0c;被设计为用于测试客户端/服务端结构的软件(例如web应用程序)。它可以用来测试静态和动态资源的性能&#xff0c;例如&#xff1a;静态文件&#xff0c;Java Servlet,CGI Scripts,Java Object,数据库和FTP服务…