【点云语义分割】自适应一致性正则化的弱监督点云分割

news2025/1/16 16:18:52

Reliability-Adaptive Consistency Regularization for Weakly-Supervised Point Cloud Segmentation

摘要:

        本文探讨了将弱监督学习中常用的一致性正则化应用于具有多种特定数据增强功能的点云学习中,而对这一问题的研究还不够深入。我们发现,将一致性约束直接应用于弱监督点云分割的方法有两大局限性:传统的基于置信度的选择会导致伪标签产生噪声而舍弃不可靠的伪标签又会导致一致性约束不足。因此,我们提出了一种新颖的可靠性自适应一致性网络(RAC-Net),利用预测信度和模型不确定性来衡量伪标签的可靠性,并对所有未标记点进行一致性训练,同时根据相应伪标签的可靠性对不同点采用不同的一致性约束。在 S3DIS 和 ScanNet-v2 基准数据集上的实验结果表明,我们的模型在弱监督点云分割中取得了优异的性能。

在传统的基于置信度的选择中,伪标签不完善的示例。我们使用 0.7 的概率阈值来选择高置信度的伪标签进行模型训练,但它们的噪声非常大(b 与 c 的对比),而且许多被丢弃的伪标签(d)在训练过程中没有被利用。 

介绍:

        为了利用未标记点,现有方法主要基于一致性假设,即鼓励模型在各种扰动下保持一致,以实现局部分布平稳性(LDS)。例如,Sohn 等人利用弱增强数据的预测来指导强增强版本的学习,他们根据预测置信度选择可靠的预测作为伪标签,并利用它们来强制执行一致性约束,从而对模型训练进行正则化。对于弱监督点云分割,这种基于一致性的正则化还没有得到很好的研究。例如,最近的 1T1C模型也是利用置信度分数来选择可靠的预测结果作为伪标签,并利用它们来迭代训练模型,但这并不是多样化扰动下的一致性约束。

        根据可信度选择可靠的预测结果并不理想。图 1b 和 c 中的示例说明,该方案可能会生成高置信度但不正确的伪标签,这将导致更多的噪声监督并混淆模型训练。其次,对于被认为不可靠的大量未标记点(见图 1d),它们在训练过程中被丢弃而未被利用,从而导致性能不达标。

        因此,弱监督点云分割的关键问题是:如何选择可靠的伪标签,以及如何利用大量不可靠的伪标签?

        这项工作中的主要想法是通过同时考虑预测置信度和模型不确定性来选择更可靠的伪标签并将可靠的预测作为硬伪标签使用而将模糊的预测作为软伪标签使用,而不是将其丢弃。具体来说,我们提出了一种简单而有效的可靠性自适应一致性网络(RAC-Net),它可以根据伪标签的可靠性自适应地对所有未标记数据执行一致性约束。为了衡量可靠性,我们联合使用预测置信度和不确定性,将未标记数据的初始预测分为模糊集和可靠集,其中不确定性通过计算不同增强预测之间的统计方差来衡量。考虑到模糊预测是不可靠的,我们将其视为软伪标签,并应用一致性损失(KL Divergence)来鼓励增强点云的不变结果。考虑到可靠预测是准确的,我们将其转换为单热伪标签,然后应用一致性损失(交叉熵损失)来指导不同增强数据的学习。此外,为了进一步利用可靠数据集,我们还通过在多个现成的基础增强数据之间进行逐点插值来生成混合增强点云?,然后使用单点伪标签来促进模型训练。?(不好懂,不过下文有回答)

相关工作:

        弱监督点云分割:略 

        一致性正则化:略

        噪声学习:对于点云分割任务,Ye 等人(2021 年)提出了一种混合学习方案,包括样本选择和损失校正,以学习具有噪声标签的鲁棒模型。与以往只考虑预测置信度来选择标签的方法不同,我们进一步考虑了模型的不确定性来选择可靠的伪标签,这些伪标签可视为模型训练的硬伪标签。此外,我们还利用模糊预测作为软伪标签,而不是将其丢弃,以进一步提高性能

        不确定性估计:略

方法:

        如图 2 所示,我们的 RAC-Net 由三部分组成,用于弱监督点云分割:(1) 分割模块用于利用有限的稀疏注释训练模型。(2) 分离和一致性模块考虑了预测置信度和不确定性,将未标注点分成两组:可靠点和模糊点。然后,在可靠和模糊集合上分别使用一热标签和软伪标签进行一致性约束。(3) 混合增强模块通过混合增强技术进一步强化可靠点的一致性约束,以充分利用这些高质量的伪标签。 

Segmentation Module:

        输入集表示为 X =[L, F]∈R N×(3+D f),其中包括 N 个点,包含点位置 L∈R N×3 和相应的特征 F∈R N×D f。我们用 Y∈R M×1 表示有限的人工标签,其中只有 M 个点有相应的真实标签(M <<N)。有了分割模型 f (θ ) 后,它对第 i 个点 xi 的预测值表示为 p( ˆ yi |xi ; θ) ∈ P, i∈{1, ..., N }。在训练过程中,我们应用交叉熵(CE)损失 Lseg,在有限标签 Y 的指导下监督我们的模型。

Separation and Consistency Module:

        为了利用未标记点,我们首先将其分为可靠和模糊两组。以往,可靠性是通过预测的置信分来衡量的,如果置信分超过阈值,样本就被视为可靠。然而,这种策略往往会导致错误的伪标签。具体来说,模型可能会生成高置信度但错误的预测,从而混淆模型训练。为解决这一问题,我们建议进一步将不确定性纳入可靠性测量中,以准确划分伪标签。与传统的不确定性测量方法不同,在点云分割任务中,变换下的不变性对于模型捕捉三维物体的特征非常重要。因此,我们建议使用不同增强体之间的预测差异来测量模型的不确定性。

        具体来说,如图 2 所示,我们首先使用多种现成的增强方法(如 PointWolf)生成原始点云 X 的 K 个增强点云 X aug 1 ...X aug k。然后,我们为它们生成预测结果(标记为 P aug 1 , ..., P aug k ),并获得包含 K 个预测结果和原始预测结果 P 的预测集 ˆ P。之后,我们将统计方差计算为不确定性 σ( ˆ P)并将 K + 1 个预测结果的平均值作为置信度,记为 ̄ P。

        我们利用置信度和不确定性将伪标签 P 分成可靠集 Pr 和模糊集 Pa。

 

        其中,τ 和 κ 分别是与置信度或不确定性相对应的两个预定义阈值,C 表示类别数,1 是指示函数。从本质上讲,如果预测值在一个类别中的置信度在不同的增强过程中一直很高,那么二进制掩码 R 就会将这些预测值选入可靠集 Pr。反之,其余在不同增强版本中具有低置信度或高不确定性的预测则被视为模糊预测 Pa 。

        对于可靠预测 Pr,考虑到其准确性,我们首先通过 argmax 运算将其转换为单次伪标签 ̃ Y。然后,我们通过对各种增强预测应用交叉熵损失来执行另一个一致性约束:

        模糊预测 Pa 具有高不确定性或低置信度,我们将其视为软伪标签,仅对增强数据应用一致性约束来促进模型训练。具体来说,我们使用软伪标签 Pa 与所有增强版本预测之间KL Divergence 

 Mix-Augmentation Module:

        如图 2 所示,我们还进一步生成了混合增强点云,并将单次可靠的伪标签用于模型训练。在这里,我们的插值策略可以通过应用局部和全局空间变换产生强增强样本。这样,可靠的伪标签就能充分发挥作用,指导典型的弱-强学习方案中的训练。具体来说,我们首先从 K 个增强点云中随机选择两个基础增强点云 X aug m 和 X aug n。然后,我们通过点式插值操作将它们组合起来,生成混合增强数据 X mix,即

        其中,α∈ R N×1 是均匀分布的抽样概率。需要注意的是,当 K = 1 时,通过对原始点云及其增强版本进行逐点插值操作,生成混合增强点云 X mix。然后,我们得到 X mix 的预测值 Pmix。最后,我们采用 CE 损失,用可靠的伪标签对 Pmix 进行监督 

        为了在效果和效率之间取得平衡,我们将 K 设为 2,并采用了两种流行的点云增强方法,即 PointWolf 和 Affine Transformations。最后,我们的 RAC-Net 的总损失是 Lseg、Lr、La 和 Lmix 的加权和:

 

实验: 

总结讨论: 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1608678.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

大数据操作第二天

文章目录 大数据命令的方式现在有三个命令的方式 启动一个计算圆周率的jar包方式什么是文件系统数据元数据传统的存储方式分布式存储方式元数据记录文件位置信息副本机制的方式 hafs 存储方式shell 操作大数据的方式创建目录查看文件目录下的方式上传文件的方式 大数据命令的方…

【若依】代码生成详细教程(单表、主从表、树形表增删改查)

若依代码生成开发接口 修改代码生成配置一、单表实现增删改查1. 新建数据库表结构2. 新建模块&#xff0c;解决项目依赖3. 启动项目&#xff0c;新建菜单4. 导入数据表&#xff0c;自动生成代码5. 将生成代码粘贴到对应的模块&#xff0c;执行生成的sql&#xff08;用于生成菜单…

【情侣博客网站】

效果图 PC端 建塔教程 第一步&#xff1a;下载网站源码&#xff08;在文章下方有下载链接&#xff09; 第二步&#xff1a;上传到服务器或虚拟主机&#xff0c;解压。 第三步&#xff1a;这一步很关键&#xff0c;数据库进行连接&#xff0c;看图 admin/connect.php就是这…

【学习笔记】Vue3源码解析:第五部分 - 实现渲染(2)

课程地址&#xff1a;【已完结】全网最详细Vue3源码解析&#xff01;&#xff08;一行行带你手写Vue3源码&#xff09; 第五部分-&#xff1a;&#xff08;对应课程的第33 - 35节&#xff09; 第33节&#xff1a;《讲解组件渲染流程》 1、在 render 函数中拿到虚拟dom vnode后…

WordPress 主题选择与自定义配置

最近我在使用wordpress网站进行建站。 我是使用的hostease的主机产品进行wordpress建站&#xff0c;在选择wordpress主题时颇为头疼。后来咨询了hostease的客服人员&#xff0c;他们家的技术人员提供了诸多帮助。在WordPress网站建设时&#xff0c;主题选择对于建立各类网站至关…

档案数字化能为企业带来什么帮助

档案数字化为企业带来以下帮助&#xff1a; 1. 空间节省&#xff1a;数字化档案可以减少实体档案的存储空间需求&#xff0c;不再需要大量的文件柜和文件存储空间&#xff0c;从而帮助企业节约办公场地。 2. 检索便捷&#xff1a;数字化档案可以通过关键词搜索、标签分类等方式…

fcrackzip工具的使用教程

下载fcrackzip软件包 查看版本 创建一个1.txt文本文件&#xff0c;然后把1.txt解压成1.zip&#xff0c;密码为007lyt fcackzip有两种使用方法 1、暴力破解 用法示例 fcrackzip -b -c 1a -l 1-10 -u 1.zip -b使用暴力破解 -c 指定掩码类型 a表示a-z&#xff0c;A表示A-Z&am…

与上级意见不合时如何恰当地表达自己的观点?

在工作中与上级意见不合时&#xff0c;恰当表达自己的观点并寻求共识是一个需要谨慎处理的问题。以下是一些建议&#xff1a; 1. **尊重与礼貌**&#xff1a;在任何情况下&#xff0c;都应保持对上级的尊重和礼貌。即使在意见不合时&#xff0c;也要避免情绪化&#xff0c;保持…

nodejs工具脚本json转excel

json转excel 主要使用 sheetjs 库 vim convertJsonToExcel.js 封装转换方法 import fs from fs; import XLSX from xlsx;/*** 扁平化嵌套json对象* param {Object} jsonObj* param {String} prefix* returns*/ export function flattenKeys(jsonObj, prefix ) {const resul…

运筹学基础(七):拉格朗日松弛(Lagrangian relaxation)

文章目录 基本概念原问题松弛问题、拉格朗日乘子、对偶函数对偶问题三个问题之间的关系 为什么要用拉格朗日松弛法算法流程核心问题松弛哪个约束松弛后分解的子问题的求解拉格朗日乘子怎么定 参考资料 基本概念 原问题 考虑如下的整数规划问题&#xff1a; m i n c T x s . …

简谈 BlueNRG-LP 和-LPS 的代码空间优化

1.引言 客户在使用 BlueNRG-LP/LPS 芯片时&#xff0c;增加 OTA 服务后常常反馈说&#xff0c;编译代码区域超空间了&#xff0c;需要帮忙优化一下。后文主要通过下列步骤进行分析和优化 BlueNRG-LP/LPS 的代码空间&#xff1a; a. 通过分析 BlueNRG-LP/LPS 的 OTA 方式&…

【Canvas与数学】动态生成圆形中运动的包络线

【题设】 F为圆内任一一点&#xff0c;A为圆周上一点&#xff0c;AF连线的中垂线交圆周与CD两点&#xff0c;求CD围成的图形形状。 【关键点】 使用解析几何方法求出FA中垂线与圆的交点&#xff0c;应用中学数学知识就可做到。 注意中间变量及时求出来比较好&#xff0c;在…

【C++程序员的自我修炼】友元

心之所向 素履以往 目录 友元函数 cout 如何输出自定义类型 cin 如何输入自定义类型 总结 友元类 日期类Date 如何访问 时间类Time 内部类 概念&#xff1a; 总结&#xff1a; 契子✨ 我们之前已经把类与对象的基础知识已经学完了&#xff0c;这些是只针对一个类的操作 那么…

endnote21从安装到使用!文献引用!Mac版

视频学习和资源获取 新建库 选择上方导航栏处的File下的New 软件 软件界面可以分成四个部分 2是个人图书馆 3是对某一分类中文献的展示 最右侧是对具体一篇文献的摘要、编辑以及PDF 有回形针标志意味着这篇有全文&#xff0c;也就是有pdf 如果没有回形针代表它只有引文信…

【电力工程】电力大数据和云架构智能AI服务平台研发建设项目可行性研究报告范例

1、项目概况 本项目拟进行基于电力大数据和云架构的智能 AI 服务平台的研究,具体包括电力多元大数据中心、技术中台、数据中台和智能 AI 中台,基于电力大数据云平台基础构建 BI 可视化开发平台和智能 AI 服务平台。 该项目的实施旨在引领公司在大数据领域发展的新趋势,从功…

【第三版 系统集成项目管理工程师】 十五至尊图

持续更新。。。。。。。。。。。。。。。 【第三版】十五至尊图 十五至尊图【必会】1.整合&#xff08;7&#xff09;2.范围 &#xff08;6&#xff09;3.进度 &#xff08;6&#xff09;4.成本 &#xff08;4&#xff09;5.质量&#xff08;3&#xff09;6.资源&#xff08;6&…

el-table使用show-summary合计,但只需要合并某一列

el-table使用show-summary合计&#xff0c;但只需要合并某一列 这里有两种方法&#xff0c;一种是网上的&#xff0c;我会引用他的链接给你们看。 一种是我自己看源码发现的 方法一 这个就是方法一的链接 点击我跳转方法一 方法二 不需要计算的列 去掉prop 然后用插槽显示即可…

利用动态规划在有向图上实现高效语音识别算法

在现代语音识别系统中&#xff0c;动态规划是一种非常关键的技术。它能够帮助我们将复杂的语音信号转换为可理解的文字信息。在本文中&#xff0c;我们将探讨如何使用动态规划方法在有向图上实现语音识别。我们将首先介绍问题的背景和基本概念&#xff0c;然后提供一个高效的算…

【路径规划】局部路径规划算法——DWA算法(动态窗口法)|(含python实现 | c++实现)

文章目录 参考资料1. DWA算法原理1.1 简介1.2 算法原理1. 速度采样2. 轨迹预测&#xff08;轨迹推算&#xff09;3. 轨迹评价 2. Python实现2.1 参数配置2.2 机器人运动学模型2.3 DWA算法类实现2.4 画图2.5 主函数 3. c实现4. 总结 参考资料 The Dynamic Window Approach to C…

如何在Windows 10中启用和使用上帝模式,这里有详细步骤

序言 上帝模式&#xff08;God Mode&#xff09;是一个特殊的文件夹&#xff0c;只在一个窗口中显示所有可用的操作设置。它可以节省搜索命令的时间&#xff0c;而无需知道通过“开始”菜单或“控制面板”查找命令的步骤。上帝模式默认情况下是隐藏的&#xff0c;所以我们需要…