3D点云的深度学习网络分类(按照作用分类)

news2025/3/29 17:29:52

1. 3D目标检测(Object Detection)

用于在点云中识别和定位目标,输出3D边界框(Bounding Box)

🔹 方法类别:

  • 单阶段(Single-stage):直接预测3D目标位置,速度快但精度较低。
  • 双阶段(Two-stage):先生成候选区域,再进行精细分类,精度高但计算量大。

🔹 代表模型:

  • VoxelNet (2018):将点云转换为体素,使用3D CNN进行检测。
  • PointRCNN (2019):基于PointNet++,使用Region Proposal生成3D候选框。
  • PV-RCNN (2020):结合体素和点特征,改进目标定位精度。
  • VoteNet (2019):基于Hough Voting,将点投票给目标中心。
  • CenterPoint (2021):基于BEV(鸟瞰图)的方法,适用于自动驾驶。

适用场景

  • 自动驾驶(识别车辆、行人、障碍物)
  • 机器人导航(目标检测)
  • 农业(检测果实、树木)

2. 3D语义分割(Semantic Segmentation)

用于为每个点分配类别标签,适用于场景理解。

🔹 方法类别:

  • 体素化(Voxel-based):如 MinkowskiNet、SparseConvNet。
  • 基于点(Point-based):如 PointNet++、Point Transformer。
  • 基于图(Graph-based):如 GCN、DGCNN。

🔹 代表模型:

  • PointNet (2017):直接处理点云,适用于简单结构。
  • PointNet++ (2017):引入局部邻域聚合,提高细节捕捉能力。
  • RandLA-Net (2020):使用随机点采样,提高计算效率。
  • KPConv (2019):使用可变形卷积处理点云,提高表达能力。
  • Point Transformer (2021):基于Transformer,提高长距离依赖建模能力。

适用场景

  • 室内场景理解(如 S3DIS 数据集)
  • 地形和城市建模(如 Semantic3D)
  • 果树、植物点云分割(如苹果树枝、叶片、果实)

3. 3D实例分割(Instance Segmentation)

用于区分不同个体的点云,即同类别不同实例要区分开,例如不同的树枝或不同的果实。

🔹 代表模型:

  • SGPN (2018):基于PointNet的端到端实例分割方法。
  • 3D-MPA (2020):结合多尺度特征学习进行实例分割。
  • PointGroup (2020):利用点的聚合特性,提高实例分割精度。
  • DyCo3D (2021):动态卷积提升实例分割能力。

适用场景

  • 自动驾驶(分割不同车辆/行人)
  • 工业检测(区分不同零件)
  • 果树点云(区分不同树枝或果实)

4. 3D关键点检测(Keypoint Detection)

用于检测点云中的重要特征点,例如物体的边缘、拐角、接触点等。

🔹 代表模型:

  • Harris3D (1999):经典的3D关键点检测算法。
  • ISS Keypoint (2009):基于点密度稳定性检测关键点。
  • KPConv (2019):结合可变形卷积进行关键点检测。
  • SuperPoint3D (2021):基于深度学习的端到端关键点检测方法。

适用场景

  • 3D物体识别(如机器人抓取)
  • 3D配准(点云拼接)
  • 果树修剪(检测关键生长点)

5. 3D配准(Registration)

用于对齐不同视角或不同时间采集的点云数据,适用于3D重建和变化检测。

🔹 方法类别:

  • 基于ICP(迭代最近点):如 ICP、Go-ICP。
  • 基于特征匹配:如 FPFH、SHOT。
  • 基于深度学习:如 DCP、PRNet。

🔹 代表模型:

  • ICP (1992):最经典的点云配准方法,计算最近邻并迭代优化。
  • Go-ICP (2014):改进ICP,提高配准精度。
  • DCP (Deep Closest Point, 2019):使用深度学习进行点云配准。
  • FMR (Feature Matching Registration, 2020):基于特征匹配进行3D点云对齐。

适用场景

  • 多视角点云合并(如无人机+地面激光扫描融合)
  • 变化检测(如修剪前后点云对比)
  • 医学图像配准

6. 3D重建(Reconstruction)

用于从点云中生成完整的3D模型,适用于缺失数据补全。

🔹 代表模型:

  • Poisson Surface Reconstruction (PSR, 2006):基于泊松方程的曲面重建方法。
  • AtlasNet (2018):基于深度学习的3D形状重建。
  • DeepSDF (2019):使用隐式表面表示重建3D结构。
  • NeRF (2020):基于神经辐射场的3D重建方法。

适用场景

  • 文化遗产保护(3D扫描文物重建)
  • 医学建模(如骨骼3D重建)
  • 农业(完整果树结构重建)

总结:作用分类与代表模型

任务类别用途代表模型
目标检测检测目标,输出3D框PointRCNN, PV-RCNN, VoteNet
语义分割给每个点分类PointNet++, KPConv, Point Transformer
实例分割区分不同实例SGPN, 3D-MPA, PointGroup
关键点检测检测重要特征点ISS Keypoint, KPConv, SuperPoint3D
点云配准3D点云对齐ICP, DCP, FMR
3D重建生成完整3D模型Poisson, DeepSDF, NeRF

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2322133.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【Linux网络-NAT、代理服务、内网穿透】

一、NAT技术 1.NAT技术背景 之前我们讨论了,IPV4协议中,IP地址数量不充足的问题 NAT技术当前解决IP地址不够用的主要手段,是路由器的一个重要功能 NAT(网络地址转换,Network Address Translation)是一种…

新手村:逻辑回归-理解02:逻辑回归中的伯努利分布

新手村:逻辑回归-理解02:逻辑回归中的伯努利分布 伯努利分布在逻辑回归中的潜在含义及其与后续推导的因果关系 1. 伯努利分布作为逻辑回归的理论基础 ⭐️ 逻辑回归的核心目标是: 建模二分类问题中 目标变量 y y y 的概率分布。 伯努利分布&#xff08…

golang Error的一些坑

golang Error的一些坑 golang error的设计可能是被人吐槽最多的golang设计了。 最经典的err!nil只影响代码风格设计,而有一些坑会导致我们的程序发生一些与我们预期不符的问题,开发过程中需要注意。 ​​ errors.Is​判断error是否Wrap不符合预期 ​…

【STM32】知识点介绍二:GPIO引脚介绍

文章目录 一、概述二、GPIO的工作模式三、寄存器编程 一、概述 GPIO(英语:General-purpose input/output),即通用I/O(输入/输出)端口,是STM32可控制的引脚。STM32芯片的GPIO引脚与外部设备连接起来,可实现与外部通讯、…

【AI】NLP

不定期更新,建议关注收藏点赞。 目录 transformer大语言模型Google Gemma疫情网民情绪识别 整体框架 baseline构建 模型调参、模型优化、其他模型 数据trick、指标优化、magic feature 数据增强、伪标签、迁移学习 模型融合sklearn中TFIDF参数详解 频率阈值可以去掉…

Go 代理爬虫

现在注册,还送15美金注册奖励金 --- 亮数据-网络IP代理及全网数据一站式服务商 使用代理服务器,通过 Colly、Goquery、Selenium 进行网络爬虫的基础示例程序 本仓库包含两个分支: basic 分支包含供 Go Proxy Servers 这篇文章改动的基础代码…

【NLP 43、大模型技术发展】

目录 一、ELMo 2018 训练目标 二、GPT-1 2018 训练目标 三、BERT 2018 训练目标 四、Ernie —— baidu 2019 五、Ernie —— Tsinghua 2019 六、GPT-2 2019 七、UNILM 2019 八、Transformer - XL & XLNet 2019 1.模型结构 Ⅰ、循环机制 Recurrence Mechanism Ⅱ、相对位置…

在普通用户下修改root用户密码

1 从普通用户切换到root用户 sudo -s 再输入密码。 2 输入passwd ,会提醒你输入当前用户密码,验证后会提醒你输入root用户密码。 3 切换到root用户,使用修改过的密码登陆。 4 成功进入root用户。

SPPAS安装及问题汇总

SPPAS下载地址 文件找不到,可能是MAC的自动化操作问题,解决方案有二: 方案一: 直接查看SPPAS中的readme,运行sppas.command 方案二: 在自动化脚本中添加 export PATH/usr/local/bin:$PATH

LINUX基础 [三] - 进程创建

目录 前言 进程创建的初次了解(创建进程的原理) 什么是fork函数? 初识fork函数 写时拷贝 fork函数存在的意义 fork调用失败的原因 进程终止 运行完毕结果不正确 main函数返回 库函数函数exit 系统调用接口_exit 进程异常终止 进…

【day1】数据结构刷题 链表

一 反转链表 206. 反转链表 给你单链表的头节点 head ,请你反转链表,并返回反转后的链表。 示例 1: 输入:head [1,2,3,4,5] 输出:[5,4,3,2,1]示例 2: 输入:head [1,2] 输出:[2,1]…

鼠标在客户区内按下左键和双击右键

书籍:《Visual C 2017从入门到精通》的2.6鼠标 环境:visual studio 2022 内容:【例2.44】鼠标在客户区内按下左键和双击右键 1.创建一个单文档程序 一个简单的单文档程序-CSDN博客https://blog.csdn.net/qq_20725221/article/details/1463…

c++ map和vector模板类

在这一章中C语法之模板函数和模板类-CSDN博客 我们学习了怎样写模板函数和模板类,接下来我们来学习系统给我们写好的两个模板类:map和vector。 我相信有了上文的基础,能帮助我们更好的理解这些模板类。 map和vector 是C STL(标准模板库) 中的一部分&a…

hn航空app hnairSign unidbg 整合Springboot

声明: 本文章中所有内容仅供学习交流使用,不用于其他任何目的,抓包内容、敏感网址、数据接口等均已做脱敏处理,严禁用于商业用途和非法用途,否则由此产生的一切后果均与作者无关! 逆向分析 学习unidbg补环境。先弄一个…

Arm Linux ceres库编译

由于工作需要,需在国产化系统上编译ceres库,手上有一块树莓派,就在树莓派上面进行测试编译ceres库,总体来说比较顺利。只出现了一点小问题 参考链接: Ceres中文教程-安装 Ceres官方网站(英文) …

矩阵补充,最近邻查找

矩阵补充,最近邻查找 矩阵补充是向量召回最简单的一种方法,现在不常用,学习矩阵补充是为了更好的理解后面学到的双塔模型 下图,输入用户ID和物品ID后从Eebedding层拿到对应的向量做内积,内积的结果就是矩阵补充 模型…

gradio调用多个CSS的HTML页

很多博客介绍的gradio读取html和css比较简单,如果要做很细致的前端页面优化,比如丰富的响应式的cssjs,至少要有html多个css,是暂不能实现的。bootstrap、font-awesome、jquery等 方案一当然是直接更换htmlcss为主的部署方式&#…

NVIDIA NeMo 全面教程:从入门到精通

NVIDIA NeMo 全面教程:从入门到精通 文章目录 NVIDIA NeMo 全面教程:从入门到精通目录框架介绍NeMo的核心特点NeMo的架构NeMo与其他框架的比较NeMo的模型集合NeMo的工作流程NeMo 2.0的新特性 安装指南系统要求使用Docker容器安装步骤1:安装Do…

Thales靶机攻略

1.下载导入VBox,并启动靶机 靶机地址:https://download.vulnhub.com/thales/Thales.zip 解压后,在VBox中导入虚拟电脑。包含所有网卡的MAC地址。 导入完成,设置网卡模式为仅主机网络。开启靶机。 kali网卡更改为桥接模式。点击工…

尝试使用Tauri2+Django+React项目(2)

前言 尝试使用tauri2DjangoReact的项目-CSDN博客https://blog.csdn.net/qq_63401240/article/details/146403103在前面笔者不知道怎么做,搞了半天 笔者看到官网,原来可以使用二进制文件,好好好 嵌入外部二进制文件 | Taurihttps://v2.taur…