Open-World Class Discovery with Kernel Networks (ICDM 2020)

news2025/1/23 4:02:10

Open-World Class Discovery with Kernel Networks (ICDM 2020)

摘要

我们研究了一个开放世界类发现问题,在这个问题中,训练样本是来自旧类有标签的样本,而我们从没有标记的测试样本中发现新的类。解决这一范式有两个关键的挑战:(a)将知识从旧类转移到新类,(b)将从新类学到的知识整合到原始模型中。我们提出了一种深度学习框架——类发现扩展核网络(CD-KNet-Exp),该框架利用Hilbert Schmidt独立性准则将有监督信息和无监督信息系统地连接在一起,从而适当地提取旧类中的知识以发现新类。与竞争方法相比,CD-KNet-Exp在三个公开可用的基准数据集和具有挑战性的真实世界无线电频率指纹数据集上显示优越的性能。

希尔伯特施-密特独立性准则

希尔伯特-施密特独立准则(Hilbert schimidt Independence Criterion, HSIC)是一种两个随机变量之间的统计依赖性度量方式。就像互信息一样(Mutual Information, MI),能够捕捉到两个随机变量之间的非线性依赖。和互信息相比,该独立性判断经上验计算简单,避免了联合概率分布的显式估计。考虑到这一点,它被广泛应用到不同领域,例如特征选择、维度约减、选择聚类以及深度聚类。
考虑到独立同分布的样本元组 { ( p i , q i ) } i = 1 N \{(p_i,q_i)\}^N_{i=1} {(pi,qi)}i=1N,让每一行元素分布对应相应的样本,构建矩阵 P ∈ R N × d P \in \mathbb{R}^{N \times d} PRN×d Q ∈ R N × c Q \in \mathbb{R}^{N \times c} QRN×c,并令 k p : R d × R d → R k_p : \mathbb{R}^{d} \times \mathbb{R}^d \to\mathbb{R} kp:Rd×RdR k q : R c × R c → R k_q : \mathbb{R}^{c} \times \mathbb{R}^c \to\mathbb{R} kq:Rc×RcR分别作为 p i , q i p_i, q_i pi,qi的核函数。比如说高斯核以及线性核:
在这里插入图片描述
在这里插入图片描述
进一步定义 K P , K Q K_P, K_Q KP,KQ作为 P , Q P, Q P,Q的核矩阵,其中 K P = { k P ( p i , p j ) } i , j } ∈ R N × N K_P=\{k_P(p_i,p_j)\}_{i,j}\} \in \mathbb{R}^{N \times N} KP={kP(pi,pj)}i,j}RN×N K Q = { k Q ( q i , q j ) } i , j } ∈ R N × N K_Q=\{k_Q(q_i,q_j)\}_{i,j}\} \in \mathbb{R}^{N \times N} KQ={kQ(qi,qj)}i,j}RN×N
P , Q P, Q P,Q之间的HSIC在核函数 k P , k Q k_P,k_Q kP,kQ的作用下一般可以定义为以下形式:
在这里插入图片描述

监督学习设置

假设数据矩阵KaTeX parse error: Expected 'EOF', got '}' at position 16: X \in \mathbb(R}̲_{N \times d_0}包含 N N N个每行 d 0 d_0 d0维的样本,并且标签矩阵 Y ∈ { 0 , 1 } N × m Y \in \{0,1\}_{N \times m} Y{0,1}N×m表示 m m m个标签的one hot编码形式。我们可以通过HSIC以监督学习的设置进行维度缩减。我们可以通过最大化输入数据的非线性特征映射和标签之间的依赖程度来实现上述目的。将 K X K_X KX设置为高斯核, K Y K_Y KY设置维线性核,则该优化问题如下形式:
在这里插入图片描述
通过最大化两者之间的依赖,直觉上,这会迫使特征提取器最大化依赖标签。同时也缩减了维度,因此一个浅层分类器可以被用来从低维表征中学习标签。

无监督学习设置

在无监督的情况下,我们可以利用HSIC最大化输入数据的非线性映射和一个可学习的潜在簇嵌入 U U U(可以先简单理解为一种聚类方法给出的伪标签)之间的依赖来进行无监督学习,输入数据的采用一个归一化的高斯核函数:
在这里插入图片描述
对于 U U U也采用线性核,按照以下优化问题优化:
在这里插入图片描述
联系之前通过监督训练得到的特征提取器,上述优化问题可以改写成以下形式:
在这里插入图片描述

类别发现的核网络方法

该部分,我们提供了我们所提方法的概述,称为Class Discovery Kernel Network(CD-KNet),用于解决开放世界中新类发现的问题。并展示了一个神经网络的拓展策略来引入发现的新类中的信息反馈。

CD-KNet with Expansion概述

该方法将开放世界新类发现问题分成三个阶段:
在这里插入图片描述
第一阶段:在有标签数据集上训练一个特征提取器,将输入数据映射为 d d d维的表征向量,再加一个softmax分类器,通过标准损失函数训练(平方误差,交叉熵等)

第二阶段:通过第一阶段,学习得到一个特征提取器。第二阶段的目的就是发现新的类别。但是从标注数据学到的特征嵌入空间可能存在较大的偏差,从而导致不能很好的泛化到无标签数据上。
在我们的工作中,我们没有直接使用从第一阶段获得的特征提取器,而是对它进行了更新,迫使它同时适应有监督的旧类和无监督的新类。
在这里插入图片描述
直观地说,第一项鼓励所有类别分离(旧的和新的),两者都应该是“可聚类”的,就像对低秩正交矩阵u的高度依赖所捕获的那样。第二项引入监督信息,确保潜在嵌入保持旧类之间的分离,因为旧类与其标签保持对齐。
作为第二阶段的最后一步,我们取新数据集的潜在嵌入,并对其进行聚类。更详细地说,在收敛性的基础上,特征提取器被细化到一定程度,融合了有标记的旧类和无标记的新类的信息,形成了一个能够很好地分离新旧类的特征空间。然后,我们可以执行任何聚类方法,例如K-means,以得到簇分配。注意,这些簇构成了我们的新类。我们将所得到的聚类标签称为伪标签。

第三阶段:DNN可以看作是一个特征提取器和一个softmax层的组合,例如,最后的稠密层采用softmax激活。扩展网络的一个简单的启发式方法是,通过添加与我们发现的新类数量相同的节点来扩展softmax层。这一策略在以往的一些研究中已经在不同的语境下被采用,如迁移学习。
然而,我们还需要考虑特征提取器的表示能力。当旧类和新类合并时,特征提取器自然需要更大的容量,即更多的参数,以表示更复杂的数据集。Zeiler等人认为,DNN中较浅层通常提取不同任务之间共同的一般性、抽象特征,而较深层则捕获与任务/数据集密切相关的特定特征。因此我们决定只扩展特征提取器的最后一层,即整个DNN的倒数第二层,其余的特征提取器保持不变。在实践中,我们发现扩展浅层并不会对最终性能产生太大的影响,因为在浅层很容易发生过拟合。
为了达到这个目的,在第三阶段,我们在最后一层加入等同于新类的数目的输出节点,在倒数第二层加入25%的神经元来扩展网络。然后通过标注数据和伪标注数据对扩展模型进行微调。特别是,该模型在未标注数据上进行了微调,用伪标签监督加入了新的类。此外,我们还加入了部分p%的旧类数据,以加强之前从旧类上看到的知识。
在这里插入图片描述
在这里插入图片描述

emmmm

不知道去掉HSIC这块会怎样,如果修改第二阶段变成:通过聚类方法得到伪标签,然后直接和标注数据一起训练模型,然后动态修改无标注数据的聚类标签,如果改成这样不知道会怎样。我想通过HSIC提高有标签数据中输入和类别之间的依赖,以及无标签输入和伪标签之间的依赖,为什么不直接映射过去,让两者相等呢?

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/703441.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【ESP-IDF】在squareline studio上设计GUI并移植到esp-box上

因为squareline studio软件中适配了ESP-BOX,所以作者本想直接使用该软件创建的工程,但是会出现花屏的现象,也不知道是不是没有做好esp-box-lite的适配。 因此只能先用squareline studio设计好GUI,然后再导出其代码,在其…

实时数仓详解

前言 本文隶属于专栏《大数据理论体系》,该专栏为笔者原创,引用请注明来源,不足和错误之处请在评论区帮忙指出,谢谢! 本专栏目录结构和参考文献请见大数据理论体系 背景 伴随着社会的发展,用户对数据仓库…

ChatGPT中 top_p 和 temperature 的作用机制

1. temperature 的作用机制 GPT 中的 temperature 参数调整模型输出的随机性。随机性大可以理解为多次询问的回答多样性、回答更有创意、回答更有可能没有事实依据。随机性小可以理解为多次询问更有可能遇到重复的回答、回答更接近事实(更接近训练数据)…

pycharm快捷键

目录 1、代码编辑快捷键 2、搜索/替换快捷键 3、代码运行快捷键 4、代码调试快捷键 5、应用搜索快捷键 6、代码重构快捷键 7、动态模块快捷键 8、导航快捷键 9、通用快捷键 🎁更多干货 完整版文档下载方式: 1、代码编辑快捷键 CTRL ALT SP…

Vue-Element-Admin项目学习笔记(9)表单组件封装,父子组件双向通信

前情回顾: vue-element-admin项目学习笔记(1)安装、配置、启动项目 vue-element-admin项目学习笔记(2)main.js 文件分析 vue-element-admin项目学习笔记(3)路由分析一:静态路由 vue-element-adm…

TOWARDS A UNIFIED VIEW OF PARAMETER-EFFICIENT TRANSFER LEARNING

本文也是属于LLM系列的文章,针对《TOWARDS A UNIFIED VIEW OF PARAMETER-EFFICIENT TRANSFER LEARNING》的翻译。 关于参数有效迁移学习的统一观点 摘要1 引言2 前言2.1 Transformer结构综述2.2 之前的参数高效调优方法综述 3 弥合差距-统一的视角3.1 仔细观察Pref…

火山引擎A/B测试推出智能流量调优实验,助力汽车行业破局营销困境

更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群 2023年是汽车行业挑战加剧的一年,在这样一个变革时期,多家车企都在进行创新技术和战略调整,实现灵活的科学决策,在发…

03 Web全栈 浏览器内置对象/事件/ajax

浏览器是一个JS的运行时环境,它基于JS解析器的同时,增加了许多环境相关的内容,用一张图表示各个运行环境和JS解析器的关系如下: 我们把常见的,能够用JS这门语言控制的内容称为一个JS的运行环境,常见的运行环…

PDF怎么在线编辑?PDF编辑软件推荐!​

PDF怎么在线编辑?PDF是一种常见的文档格式,用于存储和共享各种类型的文档,如电子书、报告、表格、合同和演示文稿等。然而,PDF文档通常是只读的,无法直接进行编辑。在过去,要编辑PDF文档通常需要购买专业的…

JVM 常量池、即时编译与解析器、逃逸分析

一、常量池 1.1、常量池使用 的数据结构 常量池底层使用HashTable key 是字符串和长度生成的hashValue,然后再hash生成index, 改index就是key;Value是一个HashTableEntry; 1、key hashValue hash string(name, len) i…

高级DBA手把手教你解决clickhouse数据库宕机生产事故实战全网唯一

高级DBA手把手教你解决clickhouse数据库宕机生产事故实战演练 一、事故描述 生产环境clickhouse宕机,重启之后,反复重启,重启几秒钟又死了。甲方客户叫天,大老板火冒三丈,天下大乱。老板电话打过来,要求半…

webrtc源码阅读之examples/peerconnection

阅读webrtc源码,从examples中的peerconnection开始。版本m98。 一、 基本流程 server端只是做了一个http server,来转发client端的消息。也就是起到了信令服务器的作用,本篇文章不在研究,感兴趣的可以学习一下用cpp搭建http serv…

Mysql架构篇--Mysql(M-M) 主从同步

文章目录 前言一、M-M 介绍:二、M-M 搭建:1.Master1:1.1 my.cnf 参数配置:1.2 创建主从同步用户:1.3 开启复制: 2.Master2:2.1 my.cnf 参数配置:2.2 创建主从同步用户:2.…

飞桨携手登临解读软硬一体技术优势,共推AI产业应用落地

众所周知,AI应用落地面临着场景碎片化、开发成本高、算力成本高等诸多难题,这对AI框架与AI芯片都提出了非常高的要求,即既要满足端、边、云多场景的部署需求,还需要支持自动化压缩与高性能推理引擎深度联动。因此充分发挥软硬一体…

通过一个简单的例子理解 Python 中的多线程

关于进程和线程的概念可以看这篇文章: https://blog.csdn.net/ThinkWon/article/details/102021274 什么时候需要多线程编程?简单来说就是一个程序里面有比较耗时间的操作,你希望先让它单独跑着,直接开始进行下一步的操作(Python默…

centos中部署调用matlab程序

环境: Java8 MATLAB2018b centos7 在本机环境上运行成功后的代码打包部署到服务器上运行会报错,需要在服务器上安装MATLAB的运行环境。 首先下载跟本机MATLAB环境一样的mcr文件。 打开网址 http://cn.mathworks.com/products/compiler/mcr/ 下载对…

Python调用百度地图API实现路径规划提取真实距离、时间

1.注册百度地图开放平台账号 网址:百度地图开放平台 | 百度地图API SDK | 地图开发 2.打开控制台,创建应用、获取AK 如下图所示 桥重点、敲重点、瞧重点 在使用python调用API端口时,我们需要申请的为服务端应用类别,别申请错了…

JS实现简单拼图游戏

JS实现简单拼图游戏 点击“打乱”按钮开始游戏&#xff1b;按下鼠标左键拖动一块到另一块上松开鼠标左键互换。游戏资源为一张图片 我这里名称为 2.jpg&#xff0c;将其与下面的网页文件放在同一目录中即可。 网页文件源码如下&#xff1a; <!DOCTYPE html> <html&…

Chapter 1: Introduction - Why Program? | Python for Everybody 讲义_Cn

文章目录 Python for Everybody课程简介适合所有人的 Python (Why Program?)为什么要学习写程序&#xff1f;创造力和动力计算机硬件架构了解编程单词和句子与 Python 对话术语&#xff1a;解释器和编译器Writing a program什么是程序&#xff1f;The building blocks of prog…

移远通信联合中国移动研究院等伙伴发布5G RedCap和车载模组白皮书

6月28日&#xff0c;在“2023年上海世界移动通信大会(MWC)”上&#xff0c;中国移动研究院联合移远通信等产业合作伙伴&#xff0c;共同发布了《5G RedCap轻量化通用模组技术要求白皮书》以及《车载模组技术发展白皮书》。 白皮书的发布为5G RedCap和车载领域技术和产业的进一步…