PREDATOR: Registration of 3D Point Clouds with Low Overlap

news2024/11/18 11:36:40

Abstract

这篇文章介绍了一种新的点云配准模型-Predator。该模型专注于处理低重叠的点云对,它更加关注于重叠区域的处理,其新颖之处在于一个重叠的注意块,作用是用于两个点云的潜在编码之间的早期信息交换。该模型大大提高了低重叠场景下的配准效率。

Introduction

首先讲了现在的配准已经有了很高的recall,但是仍然还有改进的空间。因为之前的方法聚焦于处理高重叠度(大于30%)的点云,然而低重叠度的配准在实际应用当中也是非常重要的。

现有的方法,在重叠度低于30%时,性能会飞速下降。但是人工仍然能记录这种操作。为了研究原因,作者构建了一个低重叠数据集进行了分析发现:描述子几乎不会被非重叠的区域损坏。而配准低重叠点云的关键是在哪里采样特征点,而并非去构建更好的描述子。同时作者发现,如果特征点主要从扫描的重叠部分采样,则可以实现很大的性能提升。

文章的主要贡献如下:

分析为什么现有的配准方法在低重叠状态下效果很差

提出了一个全新的重叠注意力块允许两个点云做一些信息交换同时关注重叠区域

提出了一种改进特征点描述符的方案

设计了一种新的损失函数来训练匹配分数

还提供了一个3DLoMatch数据集(主要是一些低重叠的扫描对)

Related work

介绍了点云配准常用的组件

局部3D特征描述子:讲了一些目前存在的方法,这个描述子的目的是提取一些局部几何信息的特征。

兴趣点采样:作者论述对一个点进行采样,需要这个点是显著的salient,而且必须位于两个点云的重叠区域。但是很多人都忽略了第二点。

深度学习的点云配准:介绍了一些深度学习的配准方法。

上下文本信息:类似于注意力机制,要求关注局部的信息。

Method

Predator是一个双流编码器-解码器网络架构,使用带有kpconvs风格的点卷积的残差块,架构可以分解为三个主要模块。

将两个点云编码为更小的超点集和相关的潜在特征编码,并共享权值。

重叠注意模块(在瓶颈中)可以提取两个点云的特征编码之间的协同上下文信息,并为每个叠加点分配两个重叠分数,量化叠加点本身及其软对应位于两个输入之间重叠的可能性。

将相互制约的瓶颈表示解码为逐点描述符,以及精炼的逐点重叠和匹配分数。

Problem Setting

点云配准问题,目的是找到一个刚体变换(包含旋转和平移),使得一个点云能够对齐到另一个点云。它强调了点云之间必须有足够的重叠,并且定义了一个用于评估重叠程度的公式,涉及最近邻搜索和欧几里得距离。此外,还提到当重叠比率大于0.1时就尝试进行配准。

Encoder

介绍了编码器的功能,也就是图中左边的模块

Overlap attention module

现在已经对两个点云分别进行了编码,但是它们当中并不存在对方的点云信息。所以需要进行一个交互(cross-talk)。

图卷积神经网络:通过图卷积网络去加强文本关系。

交叉注意力块:这个模块的目标是让两个点云的相对信息互相融合,以便更好地表示重叠区域。

瓶颈点的重叠分数:分数表示点云中特定超点(superpoint)位于重叠区域的概率。关于这一部分,首先,使用交叉注意力模块更新超点的特征,使其包含其他点云的上下文信息;其次,使用另一个GNN更新局部上下文,并计算超点的重叠分数,分数表示超点位于两个点云重叠区域的概率。此外,还介绍了一种计算超点之间软对应关系的方法,有助于预测超点的交叉重叠分数。

Decoder

解码器接收来自编码器的条件化特征,并与重叠分数和交叉重叠分数进行拼接,然后输出每个点的特征描述符、重叠分数和匹配性分数。这些输出用于后续的点云处理任务。解码器的架构包括上采样、线性层和跳跃连接,以增强特征的传递和利用。通过分离处理重叠分数和匹配性分数,解码器能够更准确地评估每个点作为匹配候选的好坏。网络通过训练学习到在重叠区域内预测高匹配性。

Loss Function

圆圈损失:描述了一种用于点云特征描述符学习的损失函数,通过调整特征空间中正负样本的距离,来优化特征描述符的性能。

重叠损失:描述了一种用于评估点云配准中重叠区域识别准确性的损失函数,通过二元分类的方式进行监督学习,以优化模型对重叠区域的识别能力。

匹配性损失:描述了一种用于评估点云匹配过程中匹配质量的损失函数,通过动态生成真实标签并进行二元分类,以优化模型对点云中可匹配点的识别能力。

Experiments

实验一共在四个数据集上进行,分别是3DMatch、3DLoMatch,合成的以对象为中心的ModelNet40,大型户外场景的odometryKITTI。

如图所示,左边是输入的点云序列,中间是模型推理出的可能的重叠区域,右侧是估计的配准结果。

3DMatch

这个官方数据集中只考虑了重叠大于30%的扫描部分,作者又添加了对应部分,考虑重叠在10%到30%的扫描对。

接下来提出了评价的指标,包括配准召回率,特征匹配召回率(定义为在地面真值转换(不检查是否可以从这些匹配中恢复转换)下具有>5%的“inlier”匹配且残差<10 cm的配对的分数),还引入了经验累积分布函数来评估相对重叠率。

相对重叠率:就是说predator专注于提高点云之间的重叠区域,通过预测重叠分数并丢弃得分低于0.5的点,来筛选出高重叠区域。结果就是超过一半的低重叠点云对的重叠率被提高到了30%的阈值以上。

与基于特征的方法的比较:predator与其它基于特征的配准方法进行了比较,该方法在低重叠的3DLoMatch数据集上明显优于现有的方法,而且在3DMatch上也有最高的配准召回率。但是也不能胜任所有的任务(比如下图所示的任务),同时作者提到,重要的部分是找到位于重叠区域的兴趣点(interest point)

接下来是对ModelNet40和odometryKITTI的实验。

Conclusion

介绍了PREDATOR,是一个专为低重叠点云的成对配准设计的深度模型。核心是重叠关注模块,该模块可以在点云的潜在编码之间进行早期信息交换,从而推断出哪些点可能位于重叠区域。

“捕食者”有很多可以扩展的方向。目前它是与全卷积点云编码器紧密耦合的,依赖于在瓶颈处有合理数量的超点。在点密度非常不均匀的情况下,这是一个限制。低重叠区域的配准是具有挑战性的,PREDATOR不能解决所有的情况。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2173885.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

AI跟踪报道第58期-新加坡内哥谈技术-本周AI新闻: OpenAI动荡时刻和Meta从未如此动人

每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗&#xff1f;订阅我们的简报&#xff0c;深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同&#xff0c;从行业内部的深度分析和实用指南中受益。不要错过这个机会&#xff0c;成为AI领…

深度学习与数学归纳法

最近发现&#xff0c;深度学习可以分为两个主要的阶段&#xff0c;分别是前向推理以及反向传播&#xff0c;分别对应着网络的推理和参数训练两个步骤。其中推理有时候也称为归纳推理。 在做参数训练的时候&#xff0c;本质上是在利用历史数据求网络参数的先验分布&#xff1b; …

leetcode每日一题day15(24.9.25)——公司命名

思路&#xff1a;首先如果没有相同的后缀&#xff0c;则无论只要不是相同的首字母交换都不会出现重复情况&#xff0c;如果有重复后缀&#xff0c;则还需多增加个不能和&#xff0c;首字符与另一相同后缀字串的首字符相同的字串交换。 主要矛盾已经明确&#xff0c;则可对矛盾…

MySql5.7.26安装和配置

一.下载&#xff1a; 地址MySQL :: Download MySQL Community Server 1、选择版本 根据自己需要选择32位或64位版本&#xff08;这里选择64位&#xff09;点击下载 进入到下载页面按下图操作 2.解压文件放置位置&#xff1a;这边将下载的文件解压到D:Software 下 解压后内部文…

Linux---文件io

1.系统调用 由操作系统实现并提供给外部应用程序的编程接口。(Application Programming Interface&#xff0c;API)。是应用程序同系统之间数据交互的桥梁。 C标准函数和系统函数调用关系。一个helloworld如何打印到屏幕。 man手册中一共有九卷&#xff0c;其中一卷就有讲到系…

快速了解graphql特点

graphql--快速了解graphql特点 1.它的作用2.demo示例2.1依赖引入2.2定义schema2.3定义GrapQL端点2.4运行测试2.5一些坑 今天浏览博客时看到graphQL,之前在招聘网站上第一次接触,以为是图数据查询语言, 简单了解后,发现对graphQL的介绍主要是用作API的查询语言,不仅限于图数据查…

目标检测系列(三)yolov2的全面讲解

YOLOv2&#xff08;论文原名《YOLO9000: Better, Faster, Stronger》&#xff09;作为该系列的第二个版本&#xff0c;对原始YOLO进行了显著的改进&#xff0c;进一步提高了检测速度和准确度。在精度上利用一些列训练技巧&#xff0c;在速度上应用了新的网络模型DarkNet19&…

个性化大语言模型:PPlug——让AI更懂你

在当今数字化转型的时代&#xff0c;大型语言模型&#xff08;LLMs&#xff09;已经成为了不可或缺的工具&#xff0c;它们在自然语言理解、生成和推理方面展现了非凡的能力。然而&#xff0c;这些模型普遍采用的是“一刀切”的方式&#xff0c;即对于相同的输入给予所有用户相…

828华为云征文|部署多功能集成的协作知识库 AFFiNE

828华为云征文&#xff5c;部署多功能集成的协作知识库 AFFiNE 一、Flexus云服务器X实例介绍二、Flexus云服务器X实例配置2.1 重置密码2.2 服务器连接2.3 安全组配置2.4 Docker 环境搭建 三、Flexus云服务器X实例部署 AFFiNE3.1 AFFiNE 介绍3.2 AFFiNE 部署3.3 AFFiNE 使用 四、…

【深度学习】(10)--ResNet残差网络

文章目录 ResNet残差网络1. 传统卷积神经网络的问题1.1 梯度消失和梯度爆炸1.2 退化问题 2. 解决问题2.1 梯度消失与爆炸2.2 退化问题 3. 残差结构结构归纳 4. BN&#xff08;Batch Normalization&#xff09; 总结 ResNet残差网络 ResNet 网络是在 2015年 由微软实验室中的何…

ComfyUI 完全入门:必备插件

前言 大家好&#xff0c;我是每天分享AI应用的月月&#xff01; ComfyUI 是一个基于 Stable Diffusion 的AI绘画创作工具&#xff0c;最近发展势头特别迅猛&#xff0c;但是 ComfyUI 的上手门槛有点高&#xff0c;用户需要对 Stable Diffusion 以及各种数字技术的原理有一定的…

小麦生长状态检测系统源码分享

小麦生长状态检测检测系统源码分享 [一条龙教学YOLOV8标注好的数据集一键训练_70全套改进创新点发刊_Web前端展示] 1.研究背景与意义 项目参考AAAI Association for the Advancement of Artificial Intelligence 项目来源AACV Association for the Advancement of Computer…

基于SpringBoot的新冠检测信息管理系统的设计与实现

文未可获取一份本项目的java源码和数据库参考。 国内外在该方向的研究现状及分析 新型冠状病毒肺炎疫情发生以来&#xff0c;中国政府采取积极的防控策略和措施&#xff0c;经过两个多月的不懈努力&#xff0c;有效控制了新发病例的増长&#xff0c;本地传播已经趋于完全控制…

万字面试题大模型面试,最全八股和答案

自ChatGPT开启大模型时代以来&#xff0c;大模型正迎来飞速发展&#xff0c;现在从事大模型开发相关工作可谓是处在时代的风口。那么大模型面试需要哪些技能和技巧呢&#xff0c;本文详细整理了全套的面试问题及答案&#xff0c;希望对大家有所帮助&#xff01; 目录 大模型&a…

如何让 Android 的前端页面像 iOS 一样“优雅”?

作者:方英杰&#xff08;崇之&#xff09; 最近在调研前端页面适配 Android 端异形屏的方案&#xff0c;调研过程中发现了一些比较有意思的点&#xff0c;本文主要是做一个总结。 一、提出问题 首先&#xff0c;我们需要知道 Android 上的前端适配面临着什么问题。 问题其实很…

视频怎么加字幕?视频加字幕的5种方法,小白进阶高手!

视频怎么加字幕&#xff1f;视频加字幕不仅可以添加内容的可读性&#xff0c;也避免很多语言错误&#xff0c;可以更-好地帮助观看者理解创作者的制作理念。对于视频创作的初学者而言&#xff0c;掌握几种简单易用的加字幕方法尤为重要。本文将详细介绍五种视频加字幕的方法&am…

一文速读 LLaMA3.2-Vision 模型的结构

随着 Meta 放出了 LLaMA3.2 系列模型&#xff0c;LLaMA 系列也是正式迎来了官方版本的多模态大模型 LLaMA3.2-Vision [1]。那我们就在本期内容中聊一聊 LLaMA3.2-Vision 模型的结构&#xff0c;希望对大家有所帮助。 相关代码位于 [2] 结论 先说结论&#xff0c;LLaMA3.2 的…

6.Javaweb-过滤器与监听器

Javaweb-过滤器与监听器 文章目录 Javaweb-过滤器与监听器一、过滤器**Filter接口API&#xff1a;** 过滤器生命周期1.创建&#xff08;Creation&#xff09;&#xff1a;2.初始化&#xff08;Initialization&#xff09;&#xff1a;3.执行&#xff08;Execution&#xff09;&…

【设计模式-状态模式】

定义 状态模式&#xff08;State Pattern&#xff09;是一种行为型设计模式&#xff0c;允许对象在其内部状态改变时改变其行为。该模式将状态的变化封装在状态对象中&#xff0c;从而使得对象的行为随着状态的变化而变化。 UML图 角色 Context&#xff08;上下文&#xff0…

使用scroll-behavior属性实现页面平滑滚动的几个问题

在较长的页面中&#xff0c;为了便于用户浏览&#xff0c;开发人员经常会使用锚点链接&#xff0c;锚点链接默认的效果是瞬间跳转&#xff0c;为了让用户体验更好&#xff0c;往往会添加滚动效果。我记得要实现滚动效果&#xff0c;以前一般是结合一段JavaScript代码来实现。 后…