论文解读 | 三维点云深度学习的综述

news2025/6/29 6:38:50

原创 | 文 BFT机器人 

图片

KITTI 是作为基准测试是自动驾驶中最具影响力的数据集之一,在学术界和工业界都被广泛使用。现有的三维对象检测器存在着两个限制。第一是现有方法的远程检测能力相对较差。其次,如何充分利用图像中的纹理信息仍然是一个开放性的问题。

多任务学习是三维目标检测的未来发展方向。有的学习了一个跨模态表示,以通过合并多个任务来实现最先进的检测性能。还有三维目标跟踪和场景流估计是一个新兴的研究课题得到了越来越多人的研究。

三维点云分割这一重要方向,它需要我们理解全局几何结构和每个点的细粒度细节。根据分割粒度分割方法可分为语义分割(场景级)、实例分割(目标级)和部分分割(部分级)三类。

图片

局部表示方法主要是通过对每个点的局部邻域进行建模来描述点云的局部特征,例如使用球形邻域或K近邻方法。全局表示方法则是通过对整个点云进行建模来描述点云的全局特征,例如使用基于几何形状的描述符或基于深度学习的方法。 主要讨论的是点云的局部和全局表示方法可以互相补充,从而提高点云的特征表达能力和分类性能。局部表示方法可以捕捉点云的局部特征和局部形状信息,而全局表示方法可以捕捉点云的全局特征和全局形状信息。因此,综合使用局部和全局表示方法可以更好地描述点云的形状和特征,提高点云的分类和识别性能。

图片

图2 基于深度学习的三维语义分割方法的时间顺序概述

点云表示中的采样和重构问题。具体来说,采样问题是指如何从原始点云中选择一部分点来表示整个点云,以减少计算量和存储空间。而重构问题则是指如何从采样点中重建出原始点云的形状和结构,以保证重构点云的准确性和完整性。采样过程中需要选择合适的采样密度和采样方法,以保证采样点的代表性和完整性。重构过程中需要选择合适的重构算法和参数,以保证重构点云的准确性和完整性,并尽可能减少重构误差和计算量。因此,该节的主要目的是介绍点云采样和重构的基本概念和方法,并讨论如何在采样和重构过程中平衡点云的准确性和效率。

01

实例分析

文中介绍了两种主要的语义分割方法:

基于图的方法和基于深度学习的方法。 基于图的方法主要是通过构建点云的图模型来实现语义分割,其中点云的每个点作为图的节点,点之间的关系作为图的边。然后,通过对图进行分割来实现点云的语义分割。

该方法的优点是可以利用点云的拓扑结构和几何信息,但是需要手动设计特征和权重,计算量较大。基于深度学习的方法主要是通过使用深度神经网络来实现点云的语义分割,其中点云的每个点作为网络的输入,网络输出每个点的语义类别。该方法的优点是可以自动学习特征和权重,计算量较小,但是需要大量的标注数据和计算资源。

零件分割

三维形状的零件分割的困难是双重的。首先,具有相同语义标签的形状部分具有较大的几何变化和模糊性。第二,具有相同语义意义的对象中的部分数量可能会有所不同。

零件分割是将三维形状分成其组成部分的任务,可用于形状分析和建模等任务。在零件分割中,一个三维形状被分成多个部分,每个部分都有一个语义标签。例如,在汽车的零件分割中,可以将汽车分成车门、车轮、引擎盖等部分。零件分割的难点在于,同一语义标签的形状部分具有很大的几何变化和歧义,而且具有相同语义含义的对象的零件数量可能不同。为了解决这些问题,研究人员提出了许多方法,例如基于体素的方法和基于表面的方法。其中,VoxSegNet和基于FCN的方法与基于表面的CRF相结合的方法是实现细粒度零件分割的一些方法。此外,零件分割还可以通过使用卷积神经网络(CNN)来实现。CNN可以从点云中提取特征,并将其用于零件分割。

此外,一些研究人员还使用图卷积神经网络(GCN)来处理点云数据,以实现更准确的零件分割。总的来说,零件分割是三维点云深度学习中的一个重要任务,其应用广泛,包括机器人、自动驾驶和虚拟现实等领域。

图片

图3 S3DIS、语义3D、ScanNet和语义KITTI数据集的比较语义分割结果

02

总结

本文介绍了现在最先进的三维理解方法,包括三维形状分类、三维物体检测和跟踪,以及三维场景和物体分割。并对这些方法进行了全面的分类和性能比较。同时也介绍了各种方法的优缺点,并列出了潜在的研究方向。

作者 | 小雨点

排版 | 春花

审核 | 猫

若您对该文章内容有任何疑问,请于我们联系,将及时回应。如果想要了解更多的前沿资讯,记得点赞关注哦~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/961817.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Qt应用开发(基础篇)——错误提示框 QErrorMessage

一、前言 QErrorMessage类继承于QDialog,是一个用来显示错误信息的对话框。 提示框QDialog 消息对话框 QMessageBox QErrorMessage错误消息对话框提供了一个主文本窗口、一个复选框、一个图标和按钮。文本框用来显示错误信息,复选框用来让用户选择未来是…

【实训项目】传道学习助手APP设计

1.设计摘要 跨入21世纪以来,伴随着时代的飞速发展,国民对教育的重视度也有了进一步的提升。我们不难发现虽然很多学习内容有学习资料或者答案,但是这些内容并不能达到让所有求学的人对所需知识进行完全地理解与掌握。所以我们需要进行提问与求助。那么一…

深入RocketMQ生产者负载均衡(顺序消息场景):剖析MessageGroupHash模式和SipHash算法

文章首发地址 RocketMQ生产者负载均衡中的MessageGroupHash模式 在RocketMQ顺序消息场景,默认使用MessageGroupHash模式的负载均衡策略。 MessageGroupHash模式下,生产者发送消息时,以消息组为粒度,按照内置的Hash算法&#xf…

实现无公网IP环境下远程访问本地Jupyter Notebook服务的方法及端口映射

文章目录 前言1. Python环境安装2. Jupyter 安装3. 启动Jupyter Notebook4. 远程访问4.1 安装配置cpolar内网穿透4.2 创建隧道映射本地端口 5. 固定公网地址 前言 Jupyter Notebook,它是一个交互式的数据科学和计算环境,支持多种编程语言,如…

电商数据监测的原因是什么

电商数据包含主流电商平台,如淘宝、天猫、京东、拼多多等,也包括抖音、快手等直播平台,另外外卖平台的数据、小时达平台的数据,都可称之为电商数据,电商数据其实也是品牌的线上产品链接,监测产品链接&#…

VBA快速插入签名(位置不固定)

实例需求:Excel中的多页表格如下图所示,其中包含多个“受益人签字”,其位置不固定,现在需要在其后插入签名图片。 签名图片为透明背景的PNG文件(左上角方框内的部分),图片文件属性信息如下图所示…

ERROR(IMPSP-365) innovus加endcap失败问题解析

我正在「拾陆楼」和朋友们讨论有趣的话题,你⼀起来吧? 拾陆楼知识星球入口 ERROR(IMPSP-365):Design has inst with SITE (xx_site),but the floorplan has no rows defined for this site.Any location for such instance will …

查询优化器内核剖析之产生候选执行计划执行计划成本估算

本篇的议题如下: 产生候选执行计划执行计划成本估算产生候选执行计划 我们知道,查询优化器的基本的目标就是为我们的查询语句找出一个比较高效的执行计划。 即使是一个非常简单的查询,也会存在很多的不同方式去访问数据,而这些不同的方式都是…

【设备树笔记整理7】实践操作

1 使用设备树给DM9000网卡_触摸屏指定中断 1.1 修改方法 根据设备节点的compatible属性,在驱动程序中构造/注册 platform_driver,在 platform_driver 的 probe 函数中获得中断资源。 1.2 实验方法 以下是修改好的代码:第6课第1节_网卡_触摸…

1.硬件结构

1.CPU如何执行程序? 图灵机的工作方式 纸带:一个一个连续的格子存放数据; 读写头:读取纸带上格子字符,读写头上有一些部件,比如存储单元、控制单元及运算流程 1、存储单元用于存放数据; 2、控…

《向量数据库指南》——向量数据库与人工智能是一对“双生子

在信息化社会中,数据的产生、储存和处理都成为了现代生活和工作中不可或缺的一部分。在这背景下,向量数据和向量数据库出现并发展起来,为我们解决了大量的问题,但同时也引出了新的问题和挑战。 首先,我们需要明白什么是向量数据。在人工智能时代,传统的结构化数据(如文本…

C++面试题(陆)-数据库(一)

目录 数据库 1.1SQL 1.1.1 介绍一下数据库分页 1.1.2 介绍一下SQL中的聚合函数 1.1.3 表跟表是怎么关联的? 1.1.4 说一说你对外连接的了解 1.1.6 SQL中怎么将行转成列? 1.1.7 谈谈你对SQL注入的理解 1.1.8 将一张表的部分数据更新到另一张表&am…

【wireshark抓取数据包-PGSQL协议】

测试查看PGSQL协议的网络流量数据明细 1)捕获过滤的条件设置,tcp.port5432(数据库的端口) 2)上面是wireshark的主窗口,分三大主块:Packlist List(数据包列表&#xff09…

Java设计模式:四、行为型模式-10:访问者模式

一、定义:访问者模式 访问者模式:核心在于同一个事物不同视角下的访问信息不同。 在一个稳定的数据结构下,例如用户信息、雇员信息等,增加易变的业务访问逻辑。为了增强扩展性,将两部分的业务解耦的一种设计模式。 二…

422规范详解

概述: 全称为EIA-TIA-422-B,于1994年发布。 典型电路由一个发送器和N个接收器以及一个中断匹配电阻组成。 发送器: 差分输出电压值在2V~10V之间。 4.1.1 发送器输出阻抗 要求A/B之间的差分阻抗≤100Ω。 4.1.2 开路特性 要求差分电压≤…

高阶MySQL语句

数据准备 create table ky30 (id int,name varchar(10) primary key not null ,score decimal(5,2),address varchar(20),hobbid int(5)); insert into ky30 values(1,liuyi,80,beijing,2); insert into ky30 values(2,wangwu,90,shengzheng,2); insert into ky30 values(3,lis…

手写Mybatis:第8章-把反射用到出神入化

文章目录 一、目标:元对象反射类二、设计:元对象反射类三、实现:元对象反射类3.1 工程结构3.2 元对象反射类关系图3.3 反射调用者3.3.1 统一调用者接口3.3.2 方法调用者3.3.3 getter 调用者3.3.4 setter 调用者 3.4 属性命名和分解标记3.4.1 …

Modbus TCP通信笔记

目录 1 Modbus TCP 数据协议1.1 数据格式1.2 报文头(MBAP头)1.3 功能码1.4 Modbus 地址映射到 CPU 地址 2 Modbus TCP 通讯数据示例2.1 功能码01 读离散输出线圈2.2 功能码02 读离散输入线圈2.3 功能码03 读保持寄存器2.4 功能码04 读输入寄存器2.5 功能码05 写单个离散输出寄存…

DevOps理念:开发与运维的融合

在现代软件开发领域,DevOps 不仅仅是一个流行的词汇,更是一种文化、一种哲学和一种方法论。DevOps 的核心理念是通过开发和运维之间的紧密合作,实现快速交付、高质量和持续创新。本文将深入探讨 DevOps 文化的重要性、原则以及如何在团队中实…

用Rust打印hello world!

步骤1 桌面新建1个名为 rustDemo 的文件夹(文件夹名字随便取) 步骤2 打开新建的文件夹,在地址输入栏输入 cmd 按回车键进入命令行窗口 步骤3 打开编译器,按 Ctrl S,保存文件到 rustDemo 文件夹中,保存的…