CVPR 2023 | Attention-Based Point Cloud Edge Sampling

news2024/10/5 13:31:51

注1:本文系“计算机视觉/三维重建论文速递”系列之一,致力于简洁清晰完整地介绍、解读计算机视觉,特别是三维重建领域最新的顶会/顶刊论文(包括但不限于 CVPR, ICCV, ECCV, NeurIPS等)。本次介绍的论文是:
CVPR 2023 | Attention-Based Point Cloud Edge Sampling

CVPR 2023 | Attention-Based Point Cloud Edge Sampling

在这里插入图片描述

一、背景介绍

点云作为一种重要的数据表示,广泛应用于自动驾驶、增强现实和机器人技术等领域。由于点云数据量通常很大,对其进行采样以获得一个具有代表性的点集子集是三维计算机视觉中的一个基础和重要的任务。

除了随机采样和最远点采样之外,大多数传统的点云采样方法都是基于数学统计的,例如均匀采样、网格采样和几何采样等。最近,一些基于神经网络的方法开始通过端到端的任务驱动学习方式进行更好的任务定向采样,例如S-Net、SampleNet、DA-Net等。但是这些方法大多是基于生成模型的,而不是直接选择点。

本文提出了一种结合神经网络学习和数学统计直接点选择的点云边缘采样方法APES。它借鉴了Canny边缘检测算法的思想,使用注意力机制计算点之间的相关性,并采样相关性更高的边缘点。

二、研究现状

点云采样的研究可以分为基于数学统计的传统方法和基于深度学习的方法:

(1)传统采样方法:

  • 随机采样(RS):简单高效,但无法控制采样点分布。

  • 最远点采样(FPS):迭代选择点云中最远点,目前最广泛使用。

  • 均匀采样:选择点云中均匀分布的点。

  • 网格采样:使用规则网格采样点,无法精确控制点数。

  • 几何采样:基于局部几何信息采样,例如曲率。

  • 逆密度采样(IDIS):采样距离和值较小的点。

在这里插入图片描述

(2)深度学习采样方法:

  • S-Net:直接从全局特征生成新点坐标。

  • SampleNet:在S-Net基础上引入软投影操作。

  • DA-Net:考虑点云密度进行自适应采样。

  • MOPS-Net:学习采样变换矩阵与原点云相乘生成新点云。

  • PST-NET:使用self-attention层替代S-Net中的MLP层。

但是现有的深度学习采样方法大多基于生成模型,不能直接选择点;也没有考虑形状边缘作为特殊特征。

三、开展研究的动机

  • 现有采样方法存在的问题:

    1)传统方法无法进行任务驱动的采样;

    2)深度学习采样方法多基于生成模型;

    3)没有将形状轮廓作为特殊特征。

  • 可以借鉴图像Canny边缘检测的思想,检测点云的轮廓边缘点。

  • 注意力机制可以用来计算点之间的关联性。

  • 因此,有必要开展一种结合深度学习和数学统计的点云边缘采样方法。

四、方法介绍

在这里插入图片描述

1. Canny边缘检测算法

关键思路是计算每个像素与邻域内像素的梯度关系,梯度大的判断为边缘像素。

具体步骤:

(1)高斯滤波平滑图像

(2)计算梯度幅值和方向

(3)非极大值抑制

(4)双阈值检测潜在边缘

(5)连接边缘

核心思想是计算每个像素的梯度强度。我们可以更通用地考虑:

  • 定义像素 i i i与邻域像素 j j j之间的特征相关性 h ( p i , p j ) h(p_i, p_j) h(pi,pj);

  • 计算归一化的相关性图 m i = 1 k ∑ j ∈ S i h ( p i , p j ) m_i=\frac{1}{k}\sum_{j\in S_i} h(p_i, p_j) mi=k1jSih(pi,pj), S i S_i Si是像素 i i i的邻域;

  • 计算 m i m_i mi的标准差 σ i \sigma_i σi, σ i \sigma_i σi大的点选为边缘点。

这样相当于用标准差替代了梯度计算。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-RR81icYF-1691562376798)(图片1链接)]

图1. Canny边缘检测算法关键思路

2. 基于局部的边缘采样

对点云,我们可以用 k k k近邻定义每个点的局部邻域 S i S_i Si,然后应用上述Canny边缘检测算法的思路:

  • 定义点 i i i与邻点 j j j的特征相关性 h l ( p i , p j ) h_l(p_i,p_j) hl(pi,pj);

  • 计算归一化图 m i l = 1 k ∑ j ∈ S i h l ( p i , p j ) m_i^l=\frac{1}{k}\sum_{j\in S_i} h_l(p_i,p_j) mil=k1jSihl(pi,pj);

  • 计算标准差 σ i \sigma_i σi, σ i \sigma_i σi大的点为边缘点。

这里, h l ( ⋅ ) h_l(·) hl()采用注意力机制计算:

h l ( p i , p j ) = Q ( p i ) T K ( p j − p i ) h_l(p_i, p_j)=Q(p_i)^TK(p_j-p_i) hl(pi,pj)=Q(pi)TK(pjpi)

Q Q Q K K K是点特征的线性映射。我们称之为邻域-点(N2P)注意力,它捕获局部信息。

采样结果如图2所示。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-qzs1LLQJ-1691562376799)(图片2链接)]

图2. 基于局部的边缘点采样

3. 基于全局的边缘采样

全局信息对采样也很重要。令 k = N k=N k=N,即考虑全部点,那么N2P注意力化简为全注意力:

h g ( p i , p j ) = Q ( p i ) T K ( p j ) h_g(p_i,p_j)=Q(p_i)^TK(p_j) hg(pi,pj)=Q(pi)TK(pj)

称为点-点(P2P)注意力

得到全相关性图 M g M_g Mg,我们改为按列(而不是行)计算和,得到 u j = ∑ i m i j u_j=\sum_i m_{ij} uj=imij u j u_j uj较大的点作为边缘点采样。

这是因为,如果点 j j j邻近边缘点 i i i,那么 m i j m_{ij} mij应较大,如果 j j j M g M_g Mg中对应列元素的值经常较大,则 j j j也可能是边缘点。

4. 网络框架

基于上述方法,我们构建了分类网络和分割网络,结构如图3所示:

在这里插入图片描述

主要组成部分:

  • 编码层:提取点云特征。

  • 采样层:应用提出的基于局部或全局的边缘点采样方法进行下采样。

  • 解码层:使用注意力机制进行上采样。

5. 算法伪代码

基于局部的边缘采样伪代码:

输入:
    原始点云P,包含N个点
    采样大小M
    邻域大小k
输出:
    采样后的点云Q,包含M个点
    
P' = FPS(P, 2M) // 先用FPS采样2M点
for i = 1 to N:
    Si = KNN(P', i, k) // 找到第i个点的k近邻
    mi = Attention(P'[i], P'[Si]) // 注意力计算局部归一化相关性图
    σi = Std(mi) // 计算标准差 
I = 按σi从大到小排序 // 按标准差排序
Q = P'[I[0:M]] // 取前M个点作为采样结果

基于全局的采样类似,区别在于直接计算全局归一化相关性图,并按列和排序。

五、实验结果

在ModelNet40分类任务和ShapeNetPart分割任务上进行评估。

在这里插入图片描述

1. 定量结果

  • 分类精度与SOTA方法处于同水平。

  • 分割精度略低于SOTA,但对下采样点云的中间结果非常好。

    这是因为边缘采样改变了点云分布,上采样时无法很好重构。

2. 定性结果

如下图所示,边缘采样明显捕捉了形状轮廓。

在这里插入图片描述

基于局部的更严格地聚焦边缘点;基于全局的也采样了一些边缘附近的关键点。

在这里插入图片描述

3. 对比实验

与其它采样方法比较,边缘采样整体效果较好,尤其是采样率较高时。如图5所示,边缘采样明显聚焦轮廓。

在这里插入图片描述

六、讨论与未来展望

1. 优点

  • 直接选择点进行采样,过程可视化。

  • 可以采样任意数量的点。

  • 效果好,尤其是采样率高时。

2. 不足

  • 分割精度略低,上采样时无法很好重构。

  • 只考虑了边缘特征,没有利用其它几何特征。

3. 未来展望

  • 设计上采样方法以处理边缘采样的分布改变。

  • 加入其它辅助损失进行训练。

  • 结合更多几何特征进行采样。

总结

本文提出了一种结合深度学习和数学统计的点云边缘采样方法APES。它使用注意力机制计算点之间的相关性,采样相关性高的边缘点。定量和定性结果都验证了其有效性。未来可以考虑引入更多几何特征、设计更好的上采样方法等。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/857851.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Vue2嵌入HTML页面空白、互相传参、延迟加载等问题解决方案

一、需求分析 最近做的一个用H5加原生开发的html项目,现需要集成到Vue2.0项目里面来。遇到的相关问题做个记录和总结,以便能帮到大家避免踩坑。 二、问题记录 1、页面空白问题 将html页面通过iframe的方式嵌入进来之后,发现页面是空白的&am…

Why Test?

Why Test? 可测试性(testability)是一种设计的属性,衡量了全面测试制造设计的正确性的难易程度。原始的设计和测试过程是分开的,只有在设计周期的结尾考虑测试。而DFT将测试和设计融合在一起。 来自foundary的device…

Java面向对象++

面向对象编程(高级部分) 类变量和类方法 类变量 类变量也叫静态变量/静态属性,是该类的所有对象共享的变量,任何一个该类的对象去访问它时,取到的都是相同的值,同样任何一个该类的对象去修改它时,修改的也是同一个变量。 定义语法: 访问修饰符static数据类型变量…

加速招标流程:校对软件优化文件处理效率

校对软件在优化招标流程中可以提高文件处理效率,从而加速整个招标过程。以下是校对软件如何实现这一目标的方式: 1.自动化化校对:校对软件可以自动进行拼写、语法和格式等基本校对,减少人工校对的时间和工作量。这样可以快速检查和…

高忆管理:股票高开能不能买入?风险有哪些?

股票高开往往意味着股票的涨势较好,但也或许是短线资金炒作。那么股票高开能不能买入?危险有哪些?高忆管理也为我们准备了相关内容,以供参阅。 股票高开能不能买入? 股票高开是指当日开盘价高于前一日收盘价的状况&am…

操作系统----信号量

前言: 为了人格的全面发展,大一下时间比较充裕,时间非常紧,很多时候每天只睡4-6小时,除了有我自己惊人的毅力和令人难以置信的“空闲时间外”,还有信念和初心坚守着,社团,活动&#…

冠达管理:大跳水!美国又要下黑手!3300亿巨头突然死亡,疯抢锂矿

美国又要下“黑手”。 据环球网征引路透社音讯,美国政府高级官员泄漏,白宫当地时间9日将具体阐明约束美国在华出资灵敏技能的方案,并要求将其他有关出资奉告政府。 美股商场上演了一场大败局。当地时间8月9日美股盘中,全球同享工…

优化理论 | Time-Sharing Condition

版权声明 原创作品,整理不易,转载请标明出处。本篇推送更详细的内容介绍,可参见本人微信公众号“优化与博弈的数学原理”,公众号二维码参见文末。 编者按 OFDM系统中的功率分配问题是通信领域中的研究热点。本文重点考虑了面向…

网络的管理

一、查看网卡信息 先在虚拟机里看有几个网卡 二、nmcli 1、网卡的物理接口名称 2、网卡的配置信息 三、nmtui 四、下载网站上的文件

BUUCTF题目Web部分wp(持续更新)

[极客大挑战 2019]EasySQL1 靶机启动后,填写username和password,登录的地址为http://url.to.target/check.php?usernameadmin&passwordpassword,注意post过去空格变成了加号。 http://url.to.target/ http://url.to.target/check.php?…

last_hidden_state vs pooler_output的区别

一、问题来源: from transformers import AutoTokenizer, AutoModel import torch # Load model from HuggingFace Hub MODEL_NAME_PATH xxxx/model/bge-large-zh tokenizer AutoTokenizer.from_pretrained(MODEL_NAME_PATH) model AutoModel.from_pretrained(M…

MongoDB 备份与恢复

1.1 MongoDB的常用命令 mongoexport / mongoimport mongodump / mongorestore 有以上两组命令在备份与恢复中进行使用。 1.1.1 导出工具mongoexport Mongodb中的mongoexport工具可以把一个collection导出成JSON格式或CSV格式的文件。可以通过参数指定导出的数据项&#xff0c…

公检系统升级:校对软件提升司法办案水平

公检系统升级中引入校对软件可以显著提升司法办案水平,为司法工作提供更高效和准确的支持。以下是校对软件在提升司法办案水平方面的作用: 1.提高文书准确性:校对软件可以自动检测和修正法律文书中的语法、拼写和标点等错误。它可以捕捉到人眼…

nginx自定义负载均衡及根据cpu运行自定义负载均衡

1.nginx如何自定义负载均衡 在Nginx中,可以通过配置文件自定义负载均衡策略。具体步骤如下: 首先,在Nginx配置文件中定义一个upstream模块,并设置负载均衡策略和后端服务器列表,例如: upstream myapp {ser…

数字孪生轨道交通,地铁视频孪生三维可视化管控平台

为促进数字孪生城市领域高质量发展,延续《数字孪生城市应用案例汇编(2022年)》已有研究成果,宣传推广一批创新性强、具有示范效应的优秀案例,为各部委及地方政府推动数字孪生城市建设提供有力支撑,中国信息…

使用 Visual Studio Code 调试 CMake 脚本

之前被引入到 Visual Studio 中的 CMake 调试器,现已在 Visual Studio Code 中可用。 也就是说,现在你可以通过在 VS Code 中安装 CMake 工具扩展,来调试你的 CMakeLists.txt 脚本了。是不是很棒? 背景知识 Visual C 开发团队和 CMake 的维…

【数据库】P0 创建数据库环境 MySQL + DataGrip

创建数据库环境 下载安装 MySQL下载安装 DataGrip 下载安装 MySQL Windows版本_MySQL 下载地址: https://dev.mysql.com/downloads/mysql/ 下载后依照默认顺序安装即可,本博文将讲述简约安装步骤; 如需详细安装步骤可见:https:/…

SharePoint 管理

SharePoint平台使您能够以在线方式和本地方式轻松地管理和协调业务数据。因为其灵活性和易使用性,公司可以快速采用SharePoint来管理其业务数据。但是,SharePoint管理员在管理及审核SharePoint服务器时,内容的高级别协作和动态性质会导致问题…

Is a directory: ‘outs//.ipynb_checkpoints‘

提示out/文件夹的.ipynp_chechpoints是一个文件夹,但是打开文件夹却没有看到,可以得知他是一个隐藏文件夹,进入outs/文件夹,使用 ls -a可以看到所有文件 果然出现这个文件夹,但是我们这个outs/文件夹存放的是图片&am…

Django实现音乐网站 ⑼

使用Python Django框架制作一个音乐网站, 本篇主要是后台对专辑、首页轮播图原有功能的基础上进行部分功能实现和显示优化。 目录 专辑功能优化 新增编辑 专辑语种改为下拉选项 添加单曲优化显示 新增单曲多选 更新歌手专辑数、专辑单曲数 获取歌手专辑数 保…