3D点云广义零样本分类的递归循环对比生成网络笔记

news2024/12/23 8:36:13

1 Title

        Contrastive Generative Network with Recursive-Loop for 3D point cloud generalized zero-shot classification(Yun Hao, Yukun Su, Guosheng Lin, Hanjing Su, Qingyao Wu)【Pattern Recognition】

2 Conclusion

        This work aims to facilitate research on 3D point cloud generalized zero-shot learning. Different from previous works, we focus on synthesizing the more high-level discriminative point cloud features. To this end, we design a representation enhancement strategy to generate the features. which can be leveraged to enlarge the inter-class distances and narrow the intra-class gaps. By applying the contrastive representations to the generative model in a recursive-loop form, it can provide the self-guidance for the generator recurrently, which can help yield more discriminative features and train a better classifier

3 Good Sentences 

        1、However, collecting such training data labels is laborious and time-costly. Besides, we are living in a dynamic world that the new class objects are incremental. Therefore, the aforementioned approaches that can only predict on a set of pre-defined categories will inevitably hinder their real-world applications.(The movitation of Zero-Shot Learning)
        2、It simply trains the network by utilizing a bilinear function to associate with semantic attributes and is not designed specifically for 3D point cloud data and thus, yielding unsatisfactory results.(The shortcomings of related works and how this method to improve )
        3、Different from it, our method can better distinguish the inter-class and intra-class distances based on the proposed contrastive recursive-loop learning features within a batch. Moreover, the contrastive learning features of the same batch samples are self-provided to the generator recurrently for the next iteration to yield more discriminative features.(The creativity of this mothed)


         广义零样本学习(GZSL)旨在通过传递语义知识并仅利用可见类数据进行训练来识别可见和不可见类别中的对象。然而,人们对其在 3D 点云零样本学习中的有用性知之甚少。这项工作旨在促进 3D 点云广义零样本学习的研究。本文专注于合成更高级别的判别性点云特征,进而设计了一种表示增强策略来生成特征。具体来说,提出了一种带有递归循环的对比生成网络,称为 CGRL,它可以用来扩大类间距离并缩小类内差距。通过以递归循环形式将对比表示应用于生成模型,它可以循环地为生成器提供自我指导,这有助于产生更多判别性特征并训练更好的分类器。

        介绍:为了解决传统分类中的缺点,零样本学习(ZSL)被提出来转移未见类的语义知识,仅利用已见类数据进行训练,测试集仅包含未见类。而在最近提出的广义零样本学习(GZSL)中,测试集由来自可见类和未见类的测试样本组成。
        最近,2D图像领域的一些开创性工作致力于使用生成对抗网络(GAN)来解决 GZSL 中的问题,其目的是合成假的未见类别实例,并将它们与已见类别中的真实特征实例一起使用在完全监督的环境中训练零样本分类器。
        然而,3D点云数据缺乏大规模且高质量的预训练数据集。因此,2D 特征可以很好地单独聚类,而 3D 点云特征则很紧凑。基于这些较差的聚类 3D 特征,之前的工作没有考虑 2D 图像域中的特征距离,不适合 3D 点云广义零样本学习。
        因此,本文设计了一种循环形式的表示增强策略来生成点云特征。具体来说,我们提出了一种带有递归循环的对比生成网络,称为 CGRL,它可以用来扩大类间距离并缩小类内差距。具体来说,对于真实输入的3D点云特征,构建正对(即随机选择的正例 p 与查询 q 具有相同的类标签)和负对(即反例的类标签n与q类标签不同),使正例更接近,同时负例更远离,从而逐点增强提取的特征编码器(PointNet)。对于合成的特征,使其尽可能接近其对应的真实特征,同时远离其他类。然后,以递归循环形式将自引导对比学习表示注入生成器中,以细化合成特征。这样,生成特征就可以更具辨别力。如下图所示。

        相关工作: 
                1、图像零样本学习(ZSL)
                2、对比学习(Contrastive learning)
                3、3D点云零样本学习(3D point cloud zero-shot learning)

        所提方法
                1、问题定义:在广义零样本学习中,把训练集的源类M(可见类)定义为y^s,目标类N(不可见类)定义为y^u,M和N不相交,即y^s\cap y^u=\phi,把源类对象记作X^S=\left \{ \left ( x_i^s,y_i^s \right ),y_i^s\in Y^S \right \}^M_i,其中x_i是对象的视觉样本,y_i是标签,对于不可见类,没有标签。可见类和不可见类的语义属性信息都可以表示为A^S:\left ( a_i^s \right )^M_{i=1}A^U:\left ( a_i^u \right )^M_{i=1}a_i^s,a_i^u\in R^Q, 在GZSL设置下,目标是学习更通用的模型f_{GZSL}:X\rightarrow y^U\cup y^S,本文关注归纳学习,其中只有可见类才能用于训练。
                2、生成框架
        本文所提出的递归循环对比生成网络 (CGRL) 基于GAN,由一个生成器G和一个判别器D组成。D旨在从生成的对象中精确识别真实对象,G试图通过生成容易被误认为真实的对象来欺骗鉴别器。
        该网络首先将3D点云对象训练数据输入点编码器,它将视觉样本x映射到嵌入空间中,对象的属性和噪声z相结合,由生成器G进行建模,生成虚假特征\hat{x}。判别器D来识别生成的虚假特征和真实的视觉特征,本文进一步引入了对比学习编码器E,E的作用是扩大类间距离,同时缩小类内差距。对于每个批量操作,将对比嵌入表示集成到递归循环中的特征生成模型中,以增强合成特征。以下是CGRL的一些细节内容:
        给定可见类的训练数据,特征生成方法 学习 条件生成器G 以生成 以高斯噪声z~N(0,I)和语义属性a为条件的样本\hat{x}=G(z,a^s)。判别器D与生成器G同时训练,以区别真实样本x和生成的样本\hat{x}。G的目标是合成接近嵌入空间中真实特征的特征。一旦生成器G学会生成真实对象的CNN特征,那G也可

以生成不可见类的\hat{x}
        可以通过优化以下对抗目标来学习特征生成器网络和鉴别器网络:其中,判别器D是一个多层感知器,D的最后一层的函数时sigmoid。
        为了进一步保证GAN训练的稳定性,以缓解坍缩模式,增强目标特征的真实性或虚假程度,本文将GAN损失扩展为其中,λ是惩罚系数,\bar{x}是从x\hat{x}的连线上随机采样的,β~(0,1)。上式中的权重惩罚保证判别器D的梯度沿真假对之间的直线具有单位范数。
        3、对比递归循环特征
               传统的实例嵌入方法的目标是,如果嵌入空间中的特征相似,则将它们拉近,否则将它们推远。为了实现这一目标,对比学习通过最大化 相似对 相对于 不同对 的相似性来学习获得表示。给定查询q,相应的正样本k^+,以及其他K个负样本\left \{ k^- \right \}_i^K,InfoNCE将对比损失定义为如下所示:其中,其中\tau是温度超参数,用于缩放距离分布,并余弦相似度作为度量来计算正对或负对之间的距离:
        具体来说,在本文中,给定一批输入训练数据,考虑三种构建正负对的方法。


        1、交叉对(C-P):生成器G学习语义属性以生成 合成特征(假特征),尽管判别器D使得合成特征与真实特征相似,本文还尝试对合成特征与其他类别的真实样本之间的关系进行建模。因此,提出了对比学习编码器E_{ctr}来进一步将特征映射到嵌入空间。具体来说,给定一个查询合成特征q_{(fake)},希望他能接近其对应的真实样本特征k^+_{real},同时远离其他真实的K类样本\left \{ k^- _{(real)}\right \}^K_i,可以通过最小化以下函数来实现此目标:

        2、合成对(S-P):除了上述内容,还考虑了合成特征本身之间的距离,以限制它们在训练过程中更具辨别力。具体来说,给定一个查询合成特征q_{(fake)},其正样本可以是k^+_{fake},负样本可以是k^-_{fake}

        3、实数对(R-P):真实的样本特征并没有很好地聚类。为此,本文还尝试对真实样本特征本身之间的关系进行建模
        递归循环特征嵌入:通过优化对比学习特征,认为对比学习编码器E_{ctr} 能够将真实样本特征和合成特征嵌入到判别空间中。假设E_{ctr}^{L}G^L表示表示同一批样本的第L个循环综合特征和对比学习表示,则给出递归循环特征注入范式如:其中,\eta控制特征调制。
        下面的算法总结了整个过程:

        该方法可以根据批次内提出的对比递归循环学习特征更好地区分类间和类内距离。此外,同一批样本的对比学习特征会循环地自我提供给生成器,以供下一次迭代产生更具区分性的特征。
        最后,使用具有对比细化嵌入的生成框架以端到端的方式训练模型 其中,\gamma _1,\gamma _2是控制权重的参数。

广义零样本分类(Generalized zero-shot classification)
        一旦模型被训练为能够为可见类生成视觉特征,则首先由特征生成器G在嵌入空间中生成不可见类特征特征\hat{x}^u=G(z,a^u)代表不可见的类。然后,将广义零样本学习转化为监督学习问题,具体来说,可以训练一个softmax分类器,并对生成的不可见类\hat{x}和真实的可见类x进行分类,可以表示为其中,θ是训练参数,n_b是当前训练批次中的样本数。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1313475.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

报错“找不到mfc100u.dll,程序无法继续执行”的解决方法,完美解决

在软件操作过程中,部分用户可能遇到"计算机缺失mfc140u.dll导致无法启动程序"的困扰。这种情况常常发生在启动某特定应用,特别是需要VC Redistributable支持的软件时。以下为详尽解决策略,让用户轻松应对这类技术难题,重…

【AI】如何准备mac开发vue项目的环境

为了在Mac上开发Vue项目,你需要准备一些工具和环境。以下是主要的步骤: 安装Node.js和npm: Vue.js是一个基于JavaScript的框架,因此你需要Node.js环境。访问Node.js官网下载并安装Node.js,这也会自动安装npm&#xff0…

若依框架springboot——修改前端图片上传样式

简述 使用过若依框架的,一定知道若依前端框架上传图片的样式,是一个正方形加号图片,但是如果你要使用自定义样式呢。 比如将下面这个图进行修改呢 修改后的样式 你可以直接找到element-ui 修改上传图片的组件,也可以加入新的组…

JS的箭头函数this:

箭头函数不会创建自己的this,它只会从自己的作用域链的上一层沿用this。 具体看实例: //以前:谁调用的这个函数 this就指向谁// console.log(this);//window// function fn(){// console.log(this);//window 因为这个函数也是window调用…

机器学习入门笔记

文章目录 背景具体步骤1.环境搭建2.写个demo1.数据处理2.分割数据集3.用模型训练数据,并得到预测结果4.绘制结果5.评估 背景 最近学习了一些关于机器学习的内容,做个笔记。 具体步骤 1.环境搭建 需要用到的工具:pycharm,anaco…

Python求小于m的最大10个素数

为了找到小于m的最大10个素数&#xff0c;我们首先需要确定m的值。然后&#xff0c;我们可以使用一个简单的算法来检查每一个小于m的数字是否是素数。 下面是一个Python代码示例&#xff0c;可以找到小于m的最大10个素数&#xff1a; def is_prime(n): if n < 1: …

数据分析为何要学统计学(11)——如何进行时间序列分析

时间序列是由随时间变化的值构成&#xff0c;如产品销量、气温数据等等&#xff0c;该数据集合是个有序序列&#xff0c;除了数值&#xff0c;没有其他因素。通过对时间序列展开分析&#xff0c;能够回答如下问题&#xff1a; &#xff08;1&#xff09;被研究对象的活动特征是…

VRRP协议详解

目录 一、基础概念 1、概念 2、VRRP的基本结构 状态机 二、VRRP主备备份工作过程 1、备份工作过程 2、VRRP的负载分担工作 三、实验 一、基础概念 1、概念 VRRP能够在不改变组网的情况下&#xff0c;将多台路由器虚拟成一个虚拟路由器&#xff0c;通过配置虚拟路由器的I…

常用函数之js复制图片至剪切板

背景 最近在工作中遇到了一个需求&#xff0c;点击按钮将Echart图复制到剪切板&#xff0c;然后按Ctrl&#xff08;command&#xff09;V可以直接复制到聊天软件&文档编辑器中。本以为这是一个比较简单的需求&#xff0c;好像找了一圈资料&#xff0c;发现事情并不简单&am…

Vue 组件传参 emit

emit 属性&#xff1a;用于创建自定义事件&#xff0c;接收子组件传递过来的数据。 注意&#xff1a;如果自定义事件的名称&#xff0c;和原生事件的名称一样&#xff0c;那么只会触发自定义事件。 setup 语法糖写法请见&#xff1a;《Vue3 子传父 组件传参 defineEmits》 语…

『番外篇二』Swift “黑魔法”之动态获取类实例隐藏属性的值

概览 在 Swift 代码的调试中,我们时常惊叹调试器的无所不能:对于大部分“黑盒”类实例的内容,调试器也都能探查的一清二楚。 想要自己在运行时也能轻松找到 Thread 实例“私有”属性的值吗(比如 seqNum)? 在本篇博文中您将学到如下内容: 概览1. 借我,借我,一双慧眼吧…

MFC画折线图,基于x64系统

由于项目的需要&#xff0c;需要画一个折线图。 传统的Teechart、MSChart、HighSpeedChart一般是只能配置在x86系统下&#xff0c;等到使用x64系统下运行就是会报出不知名的错误&#xff0c;这个地方让人很苦恼。 我在进行配置的过程之中&#xff0c;使用Teechart将x86配置好…

让测试效率起飞的8款浏览器兼容性测试工具,你get了吗?

浏览器的兼容性问题&#xff0c;是指不同浏览器使用内核及所支持的 HTML 等网页语言标准不同&#xff0c;用户客户端的环境不同造成的显示效果不能达到理想效果。 对于用户而言&#xff0c;无论使用哪款浏览器&#xff0c;期望看到的效果是正常的统一的。市面上发布的浏览器版…

CentOS 防火墙管理及使用的redis基本常用命令

文章目录 防火墙管理使用systemctl管理防火墙启动、关闭使用firewalld-cmd配置访问防火墙策略firewalld配置文件修改限制来源IP docker使用 redis 防火墙管理 需要关闭防火墙或者开启对应端口 使用systemctl管理防火墙启动、关闭 启动防火墙&#xff1a; systemctl start fi…

微服务实战系列之ZooKeeper(上)

前言 历经1个多月的创作和总结&#xff0c;纵观博主微服务系列博文&#xff0c;大致脉络覆盖了以下几个方面&#xff1a; 数据方面&#xff08;缓存&安全&#xff09; 比如Redis、MemCache、Ehcache、J2cache&#xff08;两级缓存框架&#xff09;、RSA加密、Sign签名…传…

【LSM tree 】Log-structured merge-tree 一种分层、有序、面向磁盘的数据结构

文章目录 前言基本原理读写流程写流程读流程 写放大、读放大和空间放大优化 前言 LSM Tree 全称是Log-structured merge-tree, 是一种分层&#xff0c;有序&#xff0c;面向磁盘的数据结构。其核心原理是磁盘批量顺序写比随机写性能高很多&#xff0c;可以通过围绕这一原理进行…

Redis 的常见使用场景

01 缓存 作为 Key-Value 形态的内存数据库&#xff0c;Redis 最先会被想到的应用场景便是作为数据缓存。而使用 Redis 缓存数据非常简单&#xff0c;只需要通过 string 类型将序列化后的对象存起来即可&#xff0c;不过也有一些需要注意的地方&#xff1a; 必须保证不同对象的…

面对.mkp病毒:专业咨询,文件恢复,帮您应对.mkp病毒

引言&#xff1a; 近期&#xff0c;网络上出现了一种新型的勒索病毒&#xff0c;被称为.halo。这种威胁采用高度复杂的加密算法&#xff0c;将用户的数据文件锁定&#xff0c;并要求支付赎金以解锁。本文将介绍.halo勒索病毒的特征、应对方法&#xff0c;以及如何预防此类攻击…

RabbitMQ插件详解:rabbitmq_web_stomp【RabbitMQ 六】

欢迎来到我的博客&#xff0c;代码的世界里&#xff0c;每一行都是一个故事 《RabbitMQ Web STOMP&#xff1a;打破界限的消息传递之舞》 前言STOMP协议简介STOMP&#xff08;Simple Text Oriented Messaging Protocol&#xff09;协议简介STOMP与WebSocket的关系 WebSocket和R…

云原生之深入解析Kubernetes中服务的性能

一、Pyroscope 简介 ① 什么是 Pyroscope&#xff1f; 开发人员通常需要查看生产应用程序中的性能瓶颈以确定问题的原因&#xff0c;为此通常需要可以通过日志和代码工具收集的信息。不幸的是&#xff0c;这种方法通常很耗时&#xff0c;并且不能提供有关潜在问题的足够详细信…