PointNet 和 PointNet++ 作者讲座学习笔记

news2025/1/15 22:57:03

文章目录

  • 前人的工作
    • 三维数据的表达形式
    • 把点云转化为体素,再用3D CNN
  • PointNet
    • 两个挑战
    • 置换不变性
    • 旋转不变性
    • PointNet的分类网络
    • PointNet的分割网络
    • PointNet的限制
  • PointNet++
    • 多级点云特征学习
    • 分类
    • 分割
    • 小区域大小
  • 参考资料

前人的工作

三维数据的表达形式

  • 点云:深度传感器扫描得到
  • Mesh:由三角面片或四边形面片组成,适合建模、渲染
  • 体素:把空间划分为三维网格,每个小的正方体组成
  • 多角度的图片:用于可视化
    在这里插入图片描述
    点云数据是一种非常适合三维场景理解算法的数据格式:
  1. 点云非常接近于原始的传感器数据。激光雷达扫描到的数据直接就是点云。可以做一种端到端的深度学习,能尽可能挖掘原始数据中的模式(信息)。
  2. 点云的表达形式非常简单

在这里插入图片描述

把点云转化为体素,再用3D CNN

之前的工作
在这里插入图片描述
时空复杂度很高
在这里插入图片描述
在这里插入图片描述

PointNet

直接用点云
端到端的学习
在这里插入图片描述
在这里插入图片描述

两个挑战

  • 置换不变性
  • 旋转不变性
    在这里插入图片描述

置换不变性

输入是无序的,模型需要对 N ! N! N!个排列结果保持不变
在这里插入图片描述
解决置换不变性的方法:对称函数。
因为对称函数跟排列是没有关系的
在这里插入图片描述
在神经网络中如何应用对称函数
在这里插入图片描述
对每一维取最大值,但是这样丢失了很多特征。
可以先将数据升维,由于信息冗余,使得 m a x max max操作可以保留更多的点云数据。
在这里插入图片描述
一个原始的PointNet结构
在这里插入图片描述

理论证明,PointNet可以逼近任意连续函数
在这里插入图片描述

旋转不变性

在这里插入图片描述
使用Transformer Network对其输入
在这里插入图片描述

PointNet的分类网络

在这里插入图片描述

PointNet的分割网络

在这里插入图片描述
PointNet对数据丢失是鲁棒的
在这里插入图片描述
解释了为什么对点的丢失非常鲁棒,因为学习到了关键点
在这里插入图片描述

PointNet的限制

要么是对一个点做操作,要么是对全局的点做操作,它没有局部的操作。

在这里插入图片描述
因为没有局部特征的学习,所以在分割精细的点上存在问题,在平移不变性上也有所缺陷。
在这里插入图片描述

PointNet++

核心思想:在局部区域重复地迭代性地使用PointNet
在这里插入图片描述

  • 实现了多级的特征学习
  • 因为在区域中,可以用局部坐标系,可以实现平移不变性
  • 由于在小区域内使用PointNet,保证了置换不变性

多级点云特征学习

用一个具体例子来理解多级点云特征学习
在这里插入图片描述
假设找到红点周围的小区域
在这里插入图片描述
因为不想受整体平移的影响,先把小区域的点转化到局部坐标系
在这里插入图片描述
对小区域使用PointNet提取局部特征
在这里插入图片描述
提取完特征得到一个新的点
在这里插入图片描述
这个点不仅有X,Y坐标,还有代表小区域几何形状的特征向量

重复这个过程,得到一组新的点
在这里插入图片描述
这组点往往在数量上少于原先的点,但每个点代表了它周围几何区域的点。这组操作叫作点集提取。

分类

经过两层点集提取,再经过pooling,得到全局特征,然后做分类。
在这里插入图片描述

分割

将全局特征再传递给原来的点上就可以实现分割。
在这里插入图片描述

小区域大小

如何选择局部小区域的大小?
类比卷积神经网络,在CNN中,小的kernel比较流行。
在这里插入图片描述

点云中常见的问题是采样不均匀,近的点非常密,远的点非常疏。一个极端的情况,小区域中只有一个点,那么学习到的特征会非常不稳定。

在这里插入图片描述

在这里插入图片描述
通过对比实验,得到结论:在点云中,kernel太小的话会被采样率的不均匀所影响。

针对这个问题,提出MSG和MRG。
动机是,希望在密的地方相信这个特征;在疏的地方不相信这个特征,而是看更大的区域。
在这里插入图片描述

参考资料

斯坦福大学在读博士生祁芮中台:点云上的深度学习及其在三维场景理解中的应用

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/24226.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Adaptive AUTOSAR Technology Sharing

文章目录一、目录二、未来汽车基础设施需求三、整车架构四、CP vs AP五、AP架构1.Execution Management与State Management的关系2.Service-oriented communication2.Diagnostic Management3.Persistency4.Log and Trace5.安全支持6.安全方法7.信息安全8. AutoSar:T…

Selenium4之CDP

相较于以前的版本,Selenium4除了推出了relative Locators,还有一个比较重要的更新就是对于Chrome Dev Tools Protocol的支持。 Chrome Dev Tools Protocol帮助用户监测、检查、调试和模版化Chrome浏览器以及基于Chromium的其它浏览器(比如EDG…

Spring Boot 2.x系列【27】应用篇之代码混淆

有道无术,术尚可求,有术无道,止于术。 本系列Spring Boot版本2.7.0 文章目录概述代码混淆ProGuard使用Maven 插件直接使用工具混淆概述 代码混淆 代码混淆(Obfuscated code)亦称花指令,是将计算机程序的代码,转换成…

创建.NET MAUI程序

.NET MAUI,先说说读音,Maui,英 [ˈmaui], 美 [ˈmaʊi],直接读:毛伊,或者读大写字母MAUI。 .NET 多平台应用 UI (.NET MAUI) 是一个跨平台框架,用于使用 C# 和 XAML 创建本机移动和…

混合云和多云:差异和相似之处

一般来说,云计算是服务器的集合,您可以通过 Internet 访问其资源。要访问云服务/资源,您需要一个云服务提供商根据您的业务需求为您提供服务。混合云和多云是两种比较流行的云计算类型,下文主要对两者的差异和相似之处作出详解&am…

CD147单克隆抗体通过酰胺反应偶联到Dox-CMCh-BAPE聚合物胶束/CBZ-AAN-Dox的制备

小编在这里给大家分享了CD147单克隆抗体通过酰胺反应偶联到Dox-CMCh-BAPE聚合物胶束/CBZ-AAN-Dox的制备,和小编一起来看! 瑞禧分享-CBZ-AAN-Dox的研究: 通过计算机辅助药物设计和化学合成,我们获得并研究了前药N-苄氧基羰基Ala-…

力扣 146. LRU 缓存

题目 请你设计并实现一个满足 LRU (最近最少使用) 缓存 约束的数据结构。 实现 LRUCache 类: LRUCache(int capacity) 以 正整数 作为容量 capacity 初始化 LRU 缓存 int get(int key) 如果关键字 key 存在于缓存中,则返回关键字的值,否则返…

基于PHP+MySQL二手书交易系统

随着时代的变迁和人们的对知识的汲取,人们需要不断的购买一些新的图书来进行学习,但是这些图书在使用过一点时间之后其价值也会在拥有者手中变的没有那么高了,但是对于没有阅读和使用过这本书的人来说其还是具有更好的价值的,如果直接购买新书价格比较昂贵,对于拥有者来说如果将…

6个好用到爆的音频、配乐素材网站,BGM都在这里了

现在只要有一部手机,人人都能成为视频创作者。一个好的视频不能缺少的就是内容、配乐,越来越注重版权的当下,音效素材使用不当造成侵权的案例层出不穷。为了避免侵权,找素材让很多创作者很头疼。 今天我就整理了6个可以免费下载&a…

Hibernate多表的关联插入

一、一对多关系: “一”的一方为主表,“多”的一方为副表,主表关联副表,应该在主表中加入副表对象作为属性。 根据顾客ID查询顾客信息 (一) ,同时将顾客名下所有订单查出 (多&#…

公司建设网站的好处及优势

企业为什么要建网站?企业建站的好处和优势!在新的世纪里,互联网将进入一个全新的阶段,信息技术的发展将带动其他行业的发展,所有行业都将与之深度融合和渗透。 越来越多的企业开始从对互联网的认识阶段走向认同和行动…

在关系数据库中允许空值的一些缺点

早在 2020 年,我们就了解了关系数据库系统中的 NULL 值及其用途。正如那篇文章所述,NULL 值已成为一个特殊标记,表示不存在任何数值。你也可以说 NULL 值可能表示列可能有一个值,但是你还不知道该值是什么。在这种情况下&#xff…

Python: 打包发布到PyPi上

经常会碰到python包要打包成sdk放到PyPi上开源的情况。 下面的操作具体参考:https://packaging.python.org/en/latest/tutorials/packaging-projects/。 一、准备 1、pyproject.toml 我的具体如下 [build-system] requires ["setuptools>61.0"] bu…

atguigu8 集群

0. 集群介绍 (1)集群的目标 • 高可用(High Availability),是当一台服务器停止服务后,对于业务及用户毫无影 响。 停止服务的原因可能由于网卡、路由器、机房、CPU负载过高、内存溢出、自 然灾害等不可预…

基于Matlab使用线性FM波形对带状合成孔径雷达系统建模(附源码)

目录 一、合成孔径雷达成像 二、雷达配置 三、场景配置 四、SAR 信号模拟 五、总结 六、程序 此示例说明如何使用线性 FM (LFM) 波形对基于带状图的合成孔径雷达 (SAR) 系统进行建模。SAR是一种侧视机载雷达,与真实…

布隆过滤器原理,优缺点

介绍: 位图:int[10],每个int类型的整数是4*832个bit,则int[10]⼀共有320 bit,每个bit⾮0即1,初始化时都是0 添加数据时:将数据进⾏hash得到hash值,对应到bit位,将该bit改…

Koa.js搭建简单服务器,连接数据库

Koa.js搭建简单服务器,连接数据库1. 环境node v7.6版本以上2. 创建服务安装依赖3. 根目录新建index.js,新建router.js,controller文件夹4. 浏览器访问5. 连接mysql6. 查询测试7、其它1. 环境node v7.6版本以上 2. 创建服务安装依赖 新建文件…

Origin绘制折线图

Origin常用功能见: Origin常用功能_Dezeming的博客-CSDN博客Origin支持各种各样的2D/3D图形。Origin中的数据分析功能包括统计,​信号处理,曲线拟合以及峰值分析。Origin中的曲线拟合是采用基于Levernberg-Marquardt算法(LMA&…

软件设计模式复习

一、统一建模语言 1.统一建模语言知识点 二、面向对象设计原则 史上最全设计模式导学目录(完整版) 三、设计模式概述 1.定义:设计模式是一套被反复使用的、多数人知晓的、经过分类编目的、代码设计经验的总结。使用设计模式是为了重用代…

Go 语言报错 StackGuardMultiplier redeclared in this block

前言 最近在 GitHub 刷到了 GitHub - golang-china/gopl-zh: Go语言圣经中文版, 然后又是周末,就起了玩心。搞一个 Go 玩玩,去 The Go Programming Language下载了 Go 语言安装包,一路默认安装。然后打开 VS Code 安装 Extensio…