FastDGCNN

news2025/1/14 1:19:41

Faster Dynamic Graph CNN: Faster Deep Learning on 3D Point Cloud Data | IEEE Journals & Magazine | IEEE Xplore
​​​​​​​题目:Faster Dynamic Graph CNN: Faster Deep Learning on 3D Point Cloud Data(更快的动态图形CNN:对3D点云数据进行更快的深度学习)

Abstract

由于卷积神经网络(CNN)或递归神经网络(RNN)的非结构化和无序特征,很难将点云数据作为输入应用于卷积神经网络(CNN)。在这项研究中,这个问题是通过图CNN在规范空间中排列点云数据来解决的。所提出的图形CNN在网络的每一层动态工作,并通过捕获点的相邻信息来学习全局几何特征。此外,通过使用squeeze-and-excitation module(挤压激励模块)重新校准每层的信息,我们在性能和计算成本之间实现了良好的权衡,并设计了residual-type skip connection network(残差型跳过连接网络)来有效地训练深度模型。使用所提出的模型,我们在基准数据集(即ModelNet40和ShapeNet)的分类和分割方面实现了最先进的性能,同时能够比其他类似模型快2到2.5倍的模型训练。

I.Introduction

本研究的主要贡献如下:

  • 使用边缘卷积块上的重校准块可以提高边缘特征和点特征图的表达能力。

  • 使用跳跃密集网络,我们更快地学习了具有更多层数的模型。

  • 对所提出的模型进行实验,并在基准数据集上实现了最先进的性能,学习速度比其他类似模型快 2 到 2.5 倍。

II. Related Works

A. Deep Neural Network Architectures  深度神经网络架构

  • VGGNet [21] 和inception model(初始模型) [14] 可以在神经网络模型中提供改进的深度。
  • Batch normalization(批量归一化) [13] 可以通过插入模块来调整层输入来稳定学习过程。
  • ResNet [22], [23] 可以使用跳过连接有效地学习高深度模型
  • highway network(高速公路网络) [24] 可以使用门控机制调整短连接。
  • [25],[26]的作者通过改革网络之间的连接进一步改进了学习特征。

其他研究人员研究了如何调整进入网络的模块的功能。

  • 参考文献 [27], [28] 提出了分组卷积,通过增加变换的基数来提高性能。
  • 参考文献[14],[29],[30]提出了广义分组卷积概念 - 多分支收敛 - 实现了更灵活的算子配置。
  • 参考文献[31],[32]提出了一种自动化的学习方法,并表现出有竞争力的表现。
  • 参考文献 [33]、[34] 展示了映射到新的特征组合的跨通道相关性
  • 参考文献 [35] 提出了使用标准卷积滤波器的跨通道相关性 1×1 卷 积。

其他研究已经进行了以使用“注意力”来提高模型的性能,这可以被描述为权重重要性的向量。

  • 注意标识输入元素与其他元素的关联程度,并通过它们的总和来表示它们,以预测或估计任何输入元素
  • 注意力通常通过门控功能(如softmax或sigmoid)或顺序技术来实现[39]。
  • 作者在[41]中引入了使用沙漏模块[16]的强大干线和掩模连接机制,以及插入中间级之间的深度残差网络中的高容量单元,表现出优异的性能。
  • SE网络(SE-net)[18]专注于通道关系,使用重新校准通道功能的模块,在ImageNet识别方面实现了最先进的结果。

在本文中,我们提出了一种以3D点云数据为输入的DNN。与现有的3D深度学习模型相比,我们的模型使用跳过连接网络注意力重新校准块实现了最先进的性能

B.3D 数据表示

三维数据可以使用四种方法表示。
如图 1 所示:(a) 多视图、(b) 体素网格、(c) 点云 (4) 三角形网格。

  • 基于多视图的方法将3D对象表示为来自不同视点的一组图像。多视图方法可以通过将 3D 对象表示为一组 2D 图像来减小维度。但是,它不会显示 3D 特征,并且一个对象需要多个数据集。
  • 基于体素的方法是一种将对象转换为体素网格的表达式形式。体素是适合将 2D 处理方法自然扩展到 3D 的数据表示形式。但是,由于体素具有许多稀疏部分,并且以网格单元形式表示,因此无法有效捕获3D对象的细节,并且会产生很高的计算成本。
  • 基于点云的方法以3D坐标集表示。点云广泛用于3D对象和场景,如今可以使用3D扫描仪,深度相机和LIDAR设备获得许多3D点云数据集。
  • 三角形网格表示为近似几何表面的三角形面的集合,可以看作是从连续几何表面采样的3D点的集合。基于网格的方法旨在以易于渲染的方式表示表面。三角形网格最初是为计算机图形创建的,但对于3D视觉也很有用。

本研究结合了 3D 点云数据,因为点云对象模型比多视图、体素和基于网格的方法更逼真,并且相关的输入数据处理具有较低的计算成本。使用ModelNet40和ShapeNet(3D点云基准数据集)进行了分类和分割实验。

C. Geometric Deep Learning 几何深度学习

III. Method

  • 我们提出的模型受到DGCNN模型[12]的显着影响。
  • 基于边卷积,捕获点之间的几何特征(或边特征),并学习边缘特征。
  • DGCNN模型是基于多层感知器(MLP)构建的,
  • 而我们通过添加自己的跳接网络和重新校准块来构建更深,更快的网络。

A. Classification Model

1) Pipeline Model

  • 如图2所示,spatial transform block(空间变换块)和edge convolution blocks(边缘卷积块)是骨干模型的主要元素。
  • 空间变换块旨在通过应用估计的3 × 3矩阵将点云输入与规范空间对齐。
  • 为了估计这个3 × 3矩阵,使用了一个<连接每个点和k个相邻点之间的坐标差的>张量 (图3(a))。
  • k个最近邻和点的坐标之间的坐标差是串联的。
  • 因此,如图3(a) 所示,k-NN图后的特征图大小为n × k × (3 + 3) = n × k × 6。
  • 边缘卷积块计算每个点的边缘特征,并应用池化函数以输出具有n × n形状的张量。
  • 这里,n是作为输入进入的点数,a_{n}是所应用的MLP的大小 (图3(b))。

  • 边卷积块的详细描述如下。
  • 假设输入了F维点云数据集X = {p1,p2,·,pn} \subseteq\mathbb{R}^{F}
  • 对于大多数3D点云数据,F = 3,pi = (xi,yi,zi)。当添加纹理或颜色等信息时,F会增加。
  • 基于此F维点云数据集X,我们配置了一个有向图G = (V,E),其中包括V = {p1,p2,·,pn} 作为顶点集,而E\subseteqV × V代表边集。边集表示如下:

 其中:fΘ 是一个非线性函数,具有RF×RF→RF′ 和Θ 是一个可学习的参数。基于此配置V 和E ,G 被构造为k -最近邻图并反映在边缘卷积块中。函数fΘ 定义边要素的表示方式如下:

此非对称函数结合了以pi为中心的全局形状结构和以pj − pi为中心的局部邻域。最后,通过MLP的第l条通道的边缘特征表示如下:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/435852.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Android 对View 进行旋转、缩放、平移的属性变换后,获取外矩形顶点

文章目录 前言改变 View 的属性&#xff0c;进行旋转、缩放、平移输出 View 的属性 使用 matrix 映射 view 变换后的外矩形前(左)乘(preXxx)、后(右)乘(postXxx) 对映射结果的影响前(左)乘(preXxx) 的意义后(右)乘(postXxx) 结论 来张图 前言 Android View 通过平移、旋转、…

找PPT模板就上这5个网站~

分享几个可以永久免费下载PPT模板、素材的网站&#xff0c;上万个模板随便下载&#xff0c;赶紧收藏起来~ 1、菜鸟图库 https://www.sucai999.com/search/ppt/0_0_0_1.html?vNTYxMjky 网站素材非常全面&#xff0c;主要以设计类素材为主&#xff0c;办公类素材也很多&#x…

4、RSA终端指令

RSA总结 加密算法,都是数学知识对称加密(传统加密算法)RSA(三个人的名字)非对称加密(现代加密算法) 原根欧拉函数、欧拉定理(费马小定理)模反元素 m^(e * d) mod n ≡ m迪菲赫尔曼密钥交换RSA算法 RSA: 拆解两个(大)质数的乘积很难!所以RSA想对安全.加密: M ^e % N C解密: C…

前端学习:HTML头部、布局

目录 HTML头部 一、HTML 元素 二、head标签和header标签的不同 三、HTML 元素 四、HTML 元素 五、HTML 元素 六、 HTML 七、HTML元素 为搜索引擎定义关键词&#xff1a; 为网页定义描述内容&#xff1a; 每60秒刷新当前页面&#xff1a; 八、HTML 九、HTML头部元素…

Vue项目搭建流程

目录 1、通过命令创建 2、npm下载依赖 3、路由配置 4、配置组件 5、对axios进行二次封装 6、全局接口请求封装 7、配置跨域(反向代理) 1、通过命令创建 create vue 项目名 2、npm下载依赖 nmp i 依赖名版本号 axios1.2.1 echarts5.1.2 element-ui2.15.12 vue-router3…

56 openEuler搭建Mariadb数据库服务器-安装、运行和卸载

文章目录 56 openEuler搭建Mariadb数据库服务器-安装、运行和卸载56.1 安装56.2 运行56.3 卸载 56 openEuler搭建Mariadb数据库服务器-安装、运行和卸载 56.1 安装 配置本地yum源&#xff0c;详细信息请参考《openEuler 22.03-LTS 搭建repo服务器》。 清除缓存。 # dnf clean…

【SpringBoot】1、SpringBoot整合JWT实现Token验证

这里写目录标题 1.单点登录1.1 单系统登录1.1.1 单系统登录流程(使用Session实现单系统登录) 1.2 多系统(单点)登录1.2.1 单点登录实现方案1.2.1.1 Session跨域1.2.1.2 Spring Session共享 1.3 Token机制1.3.1 传统身份认证1.3.2 基于Token的身份认证 1.4 JWT机制1.4.1 JWT数据…

Redis集群部署详解

文章目录 集群环境集群搭建测试集群故障转移集群扩容集群缩容 集群环境 集群介绍 1.什么是集群 所谓的集群&#xff0c;就是通过增加服务器的数量&#xff0c;提供相同的服务&#xff0c;从而让服务器达到一个稳定、高效的状态。 2.使用redis集群的必要性 单个redis存在不稳定…

9.6 数组的指针和指向数组的指针变量 - 3

9.6 数组的指针和指向数组的指针变量 - 3 一.回顾二维数组和多维数组的概念二.指向多维数组的指针和指针变量探究1.a:二维数组名&#xff0c;也是整个二维数组的首地址。我们可以认为是第0行的首地址是10002.a1 , a2 分别代表第一行首地址和第二行首地址。3.这表示a[0],a[1],a[…

Mapbox-gl.js v2.13.0 扩展支持4326,4490坐标系

mapbox-gl.js新版本中&#xff0c;支持多种projection 显示效果也不错&#xff0c;根据tiles grid可以看到&#xff0c;还是web_mercator的格网&#xff0c;基于图片做了一定的拉伸形变&#xff0c;想要加载4326的切片格网&#xff0c;依然无法实现。 后来在网上搜索加载4326切…

【JavaWeb】后端(Maven+SpringBoot+HTTP+Tomcat)

目录 一、Maven1.什么是Maven?2.Maven的作用?3.介绍4.安装5.IDEA集成Maven6.IDEA创建Maven项目7.IDEA导入Maven项目8.依赖配置9.依赖传递10.依赖范围11.生命周期 二、SpringBoot1.Spring2.SpringBoot3.SpringBootWeb快速入门 二、HTTP1.HTTP-概述2.HTTP-请求协议3.HTTP-响应协…

【转行互联网】转行互联网必看答疑

课程 追忆寻梦-转行互联网必备知识 https://edu.csdn.net/course/detail/31180 2023年&#xff0c;迟来的编程私教服务 https://bbs.csdn.net/topics/613231237 优先 必读文章 初学者&#xff0c;打算改行学编程&#xff0c;怎么学习java&#xff1f;求指教。https://bb…

如何抓住IT行业最后的红利?网络安全为什么是风口行业?

前言 “没有网络安全就没有国家安全”。当前&#xff0c;网络安全已被提升到国家战略的高度&#xff0c;成为影响国家安全、社会稳定至关重要的因素之一。 网络安全行业特点 1、就业薪资非常高&#xff0c;涨薪快 2021年猎聘网发布网络安全行业就业薪资行业最高人均33.77万…

C语言指针及数组的运行原理

C语言指针及数组的运行原理 文章目录 C语言指针及数组的运行原理一. 指针&#xff08;汇编角度&#xff09;二. 数组&#xff08;汇编角度&#xff09;2.1 数组的定义2.2 指针与数组结合 三. 指令解释参考3.1 nop3.2 leave3.3 ret 这里涉及汇编&#xff0c;虚拟机这边采用的是6…

如何在 Google Cloud 上部署 EMQX 企业版

Google Cloud 的 IoT Core 产品将于 2023 年 8 月 16 日停止服务&#xff0c;随着这一日期的临近&#xff0c;许多用户正在为他们现有的物联网业务寻找新的解决方案&#xff0c;而 EMQX 企业版是实现这一目标的理想选择。 EMQX 企业版是一款大规模分布式 MQTT 消息服务平台&am…

【设计模式】深入浅出--外观模式

文章目录 前言一、外观模式介绍二、案例场景三、外观模式优缺点四、外观模式应用场景总结 前言 不知道大家有没有比较过自己泡茶和去茶馆喝茶的区别&#xff0c;如果是自己泡茶需要自行准备茶叶、茶具和开水&#xff0c;而去茶馆喝茶&#xff0c;最简单的方式就是跟茶馆服务员…

高效的配置文件读取工具支持properties和yaml

JefConfig 前言 日常工作中不知道到大家有没有遇到以下几种情况&#xff1a; 1、在程序启动时需要加载配置文件&#xff0c;但是发现程序只能从固定位置读取配置文件。 2、程序在集成了spring框架后&#xff0c;想从配置文件中获取某个配置&#xff0c;但是发现当前程序并未交…

并查集原理及代码实现

并查集 首先要明确的是并查集是森林。由多棵树组成。 并查集 &#xff08;英文&#xff1a;Disjoint-set data structure&#xff0c;直译为不交集数据结构&#xff09;&#xff0c;用于处理一些 不交集 &#xff08;Disjoint sets&#xff0c;一系列没有重复元素的集合&…

android framework-SystemServer进程

SystemServer进程信息 一、SystemServer整体时序图 涉及源码路径&#xff1a; android-10.0.0_r41\frameworks\base\core\java\com\android\internal\os\ZygoteInit.java android-10.0.0_r41\frameworks\base\core\java\com\android\internal\os\Zygote.java android-10.0.0_r4…

JAVAWeb07-WEB 开发通信协议-HTTP 协议-关联篇

1. 概述 1.1 官方文档及示例说明 1.1.1 请求头 1.1.2 响应头 1.1.3 HTTP 响应状态码 HTTP状态码 当浏览者访问一个网页时&#xff0c;浏览者的浏览器会向网页所在服务器发出请求。当浏览器接收并显示网页前&#xff0c;此网页所在的服务器会返回一个包含HTTP状态码的信息头&a…