Multi-class classification without multi-class labels (ICLR 2019)

news2024/9/27 15:20:11

Multi-class classification without multi-class labels (ICLR 2019)

摘要

这项工作提出了针对多分类的新策略,不需要具体的类别标签,取而代之是利用样本之间的两两相似度,这是一种弱化的标注方式。所提方法称作元分类学习,为两两相似度预测优化一个二分类器,并通过该过程学习一个多分类器作为子模块。我们阐述了这种方法,并给出了它的概率图形模型,以及推导出一个极其简单的损失函数指导基于神经网络的模型训练。接着。我们展示了相同的框架可以泛化到监督学习、无监督学习、跨任务学习以及半监督学习的设置上。我们在三种学习设置上和最先进的方法进行比较。展现出极具优越性的准确率,为没有多类别标签情况下进行多分类任务是一种可行的学习选择提供了证据。
在这里插入图片描述

元分类学习

在这里插入图片描述

用观察到的和未观察到的信息分析问题的一种自然方法是通过概率图形模型。如上图所示,用图形模型展示该问题。当两两相似度 S S S被观察到时,具体的类别标签 Y Y Y就是潜在的了。具体来说,我们定义 X = { X 1 , ⋯   , X n } , Y = { Y 1 , ⋯   , Y n } \boldsymbol{X}=\{\textit{X}_1, \cdots, \textit{X}_n\}, Y=\{\textit{Y}_1, \cdots, \textit{Y}_n\} X={X1,,Xn},Y={Y1,,Yn}以及 S = { S ij } 1 ≤ i , j ≤ n S=\{\textit{S}_\textit{ij}\}_{1\le \textit{i}, \textit{j} \le n} S={Sij}1i,jn来分别表示样本集合,类别标签和两两相似度。并且有 P ( S ij = 1 ∣ Y i , Y j ) = 1 P(\textit{S}_\textit{ij}=1|\textit{Y}_\textit{i}, \textit{Y}_\textit{j})=1 P(Sij=1∣Yi,Yj)=1当两个样本标签一致时,否则为0;相似的, P ( S ij = 0 ∣ Y i , Y j ) = 1 P(\textit{S}_\textit{ij}=0|\textit{Y}_\textit{i}, \textit{Y}_\textit{j})=1 P(Sij=0∣Yi,Yj)=1当两个样本不一致时。参数为 θ \theta θ具备判别能力的分类器的输出是 f ( x i ; θ ) = P ( Y i ∣ x i ; θ ) \textit{f}(\textit{x}_\textit{i}; \theta)=P(\textit{Y}_\textit{i}|\textit{x}_\textit{i}; \theta) f(xi;θ)=P(Yixi;θ),其中 f ( x i ; θ ) \textit{f}(\textit{x}_\textit{i}; \theta) f(xi;θ)输出一个类别分布。现在我们描述模型解释观察到的标签的似然(likeihood)(用类标签或两两标签)。
在这里插入图片描述
其中 S \boldsymbol{S} S是完全已知的,而 Y \boldsymbol{Y} Y是未知的。计算该似然需要通过计算 ∑ Y P ( S ∣ Y ) P ( Y ∣ X ; θ ) \sum_{\boldsymbol{Y}}P(\boldsymbol{S}|\boldsymbol{Y})P(\boldsymbol{Y}|\boldsymbol{X}; \theta) YP(SY)P(YX;θ) Y \boldsymbol{Y} Y边缘化,但这一步难以做到,其中成对项 P ( S ∣ Y ) = ∏ i , j = P ( S i , j ∣ Y i , Y j ) P(\boldsymbol{S}|\boldsymbol{Y})=\prod_{\textit{i}, \textit{j}}=P(\textit{S}_{\textit{i}, \textit{j}}|\textit{Y}_{\textit{i}}, \textit{Y}_{\textit{j}}) P(SY)=i,j=P(Si,jYi,Yj)使得 Y Y Y相互依赖,无法有效分解因式。计算似然如下:
在这里插入图片描述
在这里插入图片描述
接着定义函数 g g g表示具有相同类别标签的概率:
在这里插入图片描述
改写损失函数:
在这里插入图片描述
在此, f \textit{f} f代表多分类器,而 g \textit{g} g代表二分类器。换言之,通过以上简单的推导,就将多分分类器用二分类器包装。因为在 g \textit{g} g中没有可学习的参数,因此元指标指导的优化都是在 f \textit{f} f中进行。为了最小化所提损失,当两个样本类别一致时,模型输出一种峰值只出现在同一输出节点上的急剧峰值分布;不一致时,两个分布之间要尽可能的减少重叠部分。在后一种情景下,两个样本被推向不同的类别。 f \textit{f} f输出分布的这两个性质都是使用类标签和多类交叉熵学习的分类器的典型特征。这些属性也直观地说明了为什么最小化 L m e t a \textit{L}_{meta} Lmeta可以帮助学习类似于多类分类器的输出。
以上所提损失称为元分类似然(Meta Classification Likelihood, MLC)

学习模式

MCL中使用的监督是两两标签 S \textit{S} S。由于它的形式比类标签弱,我们可以灵活地在监督学习、跨任务迁移学习或半监督学习的设置中收集该标签。收集方法同时也决定了学习范式。在前两种学习模式中,其他方法也使用了类似的成对约束;我们的新颖性是我们推导出新的学习目标MCL,它可以取代其他的学习目标。在半监督学习场景中,提出一种新的学习方法Pseudo-MCL。详细说明如下。
在这里插入图片描述

监督学习

监督学习的两两标签可以直接从类别标签转化得到。

无监督学习

两两标记可以来自几个自然线索,如空间和时间的接近。例如,一幅图像中的图像块由于空间上的紧密性可以是相似的,而视频在短时间内的帧通常具有相似的内容。此外,有用的两两信息可以在社交网络的边缘或学术引用网络中找到。以上都是本工作的潜在应用。
另一个在目标领域无监督的策略是通过迁移学习收集成对的标签。Hsu等人(2018)提出了一种方法,其中相似性预测网络(SPN)可以从标记的辅助数据集学习。然后对未标记的目标数据集应用SPN预测 S \textit{S} S(属于同一类的概率)。在最后一步中,预测的 S \textit{S} S被送入一个网络(在这种情况下,通过基于Kullback-Leibler散度的对比损失进行优化),以发现未标记目标数据集中的类别。图3b说明了上面的过程。请注意,辅助数据集和目标数据集之间的类可能有重叠(跨域转移)或没有重叠(跨任务转移)(Hsu等人,2018)。在这两种情况下,预测的两两相似度是有噪声的(特别是在后一种情况下);因此,迁移学习策略为学习分类器创造了一个具有挑战性的场景。它的难度使得它成为一个很好的基准来评估我们的方法的鲁棒性,并在我们的实验中被使用。

半监督学习

在半监督学习中,我们提出了一种新的获取 S \textit{S} S的策略。该方法在典型的半监督学习设置下,这需要一个公共数据集 D \textit{D} D用于监督学习和丢弃大部分数据集的标签。 D \textit{D} D中标注和未标注的部分分别用 D L = ( X L , Y L ) , D U L = X U L \textit{D}_L=(\textit{X}_L,\textit{Y}_L), \textit{D}_{UL}=\textit{X}_{UL} DL=(XL,YL),DUL=XUL表示。主要想法就是制造一个伪相似度 S L + U L \textit{S}_{L+UL} SL+UL来进行元分类以0.5的概率对预测的 S ^ L + U L \hat{\textit{S}}_{L+UL} S^L+UL进行二进制,我们称这个方法为Pseudo-MCL,我们注意到,有趣的是,这里 g g g不是静态的,因为它会随着 f f f的改进而迭代改进。以不同方式增强的图像自然属于同一类,从而提供了ground-truth相似性。通过对两个二值化相似点进行逻辑或操作,可以很容易地将这两种方法的相似性组合为 S L + U L \textit{S}_{L+UL} SL+UL。学习目标是多类交叉熵和Pseudo-MCLl的总和,因此输出节点和类之间的映射由学习的监督部分自动决定。

emmmmm

这篇论文的idea和原作者之前的两篇论文有多大区别啊,一个两两相似度反复用。监督学习下的元分类器和16年将多标签弱化为两两相似度进行聚类都没啥区别,不就是之前是用KL散度衡量两个输出分布之间的距离,来逼近所给的pairwise labels;这边直接在输出向量上计算内积,同样逼近所给的pairwise labels。
原作者是不是想用两两相似度在所有领域都用一遍,每次换个名称,换个度量方式(JS散度,MSE,EMD等)然后开始套不同方式的设置。18年是用在了跨域迁移和跨任务迁移,19年这篇用在了监督学习,无监督学习,半监督学习。这篇中的无监督学习还是明晃晃的引用自己的16年的跨任务迁移的解决方法。
这个也能发ICLR啊,还是三篇!!!!!!!!!!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/688580.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

ModaHub魔搭社区:向量数据库Milvus使用 MySQL 管理元数据教程

目录 使用 MySQL 管理元数据 常见问题 数据管理相关博客 使用 MySQL 管理元数据 Milvus 默认使用 SQLite 作为元数据后台管理服务,SQLite 内嵌于 Milvus 进程中,无需启动额外服务。但是在生产环境中,基于可靠性的考虑,我们强烈…

【数据库管理】十分钟了解啥是三级封锁协议、X锁和S锁

一.为什么要用锁 在多用户共享系统中,许多事务可能同时对同一数据进行操作,称为“并发操作”,此时数据库管理系统的并发控制子系统负责协调并发事务的执行,保证数据库的完整性不受破坏,同时避免用户得到不正确的数据。…

Spring框架概括

spring是什么? Spring是2003年兴起的,它是一个轻量级的,非侵入式的IOC和AOP的一站式框架,为简化企业级应用开发。 它的特点: 轻量级:指的是核心jar包比较小的。 非侵入式的:框架代码不会侵入…

Java——《面试题——MQ篇》

前文 java——《面试题——基础篇》 Java——《面试题——JVM篇》 Java——《面试题——多线程&并发篇》 Java——《面试题——Spring篇》 Java——《面试题——SpringBoot篇》 Java——《面试题——MySQL篇》​​​​​​ Java——《面试题——SpringCloud》 Java…

KingFusion3.6是什么?

哈喽,大家好,我是雷工! 今天继续学习KingFusion3.6,以下为学习笔记。 一、KingFusion3.6简介 1、管控一体化全组态平台KingFusion3.6是一款面向工业企业执行层的生产信息化管理系统。 2、KingFusion3.6基于“全组态”技术&#…

使用ROS功能包camera_calibration进行单目相机和双目相机的内参和外参标定

1.概述 本文总结使用ROS标定单目和双目相机的过程,同时提供生成棋盘格文件的方法。 参考链接: [1]使用ros标定相机的内参和外参 [2]ROS下采用camera_calibration进行双目相机标定 2.生成棋盘格文件 棋盘格可以自己买一个,或者打印一个粘在…

日本团队推出 AI 恋爱游戏:主角穿什么,玩家说了算

女主穿什么,还能由玩家决定?! IT之家6月25日消息,来自日本的一个两人团队近期发布了一段视频,展示了一款正在开发中的基于 AI 的恋爱游戏。 在游戏初期,女主角会以黑色剪影的形式出现,针对女主…

紫云谷游记

先说重点,TLNR 1.早点去,方便找地方停车,坐渡船不用排队太久。 2.景区里的饭没外面的好吃。 3.溯溪回来再在游泳池游泳,溯溪凉快,游泳太晒。 4.溯溪真的好爽。 导航: 紫云谷乘船码头停车场 景区介绍就不多说…

常见电池容量概念

嵌入式软件做产品一定要考虑功耗问题 功耗是多少,装上电池能用多久。 1、毫安时和毫瓦时 毫安时(mAh)和毫瓦时(mWh)是两个不同的物理量,它们分别表示电量和能量的度量单位。下面图片搜18650得到不同结果&…

Elasticsearch介绍与应用

Elasticsearch介绍与应用 Elasticsearch的官方文档。 Elasticsearch官网参考文档:https://www.elastic.co/guide/index.html Elasticsearch官方下载地址:https://www.elastic.co/cn/downloads/elasticsearch mvnrepository依赖库地址:http…

你对工作队列了解多少?Linux中断处理中的workqueue介绍

Linux中断处理中的workqueue介绍 一、workqueue的作用及在Linux中断处理中的应用1.1、workqueue的概述1.2、workqueue在Linux中断处理中的作用 二、workqueue的实现原理2.1、工作队列和工作者线程的关系2.2、工作队列的创建和销毁2.3、工作者线程的创建和销毁2.4、扩展知识&…

2023年的今天,谨慎进入网络安全行业

前言 2023年的今天,慎重进入网安行业吧,目前来说信息安全方向的就业对于学历的容忍度比软件开发要大得多,还有很多高中被挖过来的大佬。 理由很简单,目前来说,信息安全的圈子人少,985、211院校很多都才建…

低代码没前途?那是你“盲盒”没拆好

创新本质是什么?一是让昂贵的东西变得便宜,老百姓能用;二是高门槛东西变得低门槛,普通人可用。琢磨着,这不就是说低代码吗? 低代码:让人找不到工作? 低代码无疑成为开发业务的一种…

基于java springboot博客管理系统设计和实现

基于java springboot博客管理系统设计和实现 博主介绍:5年java开发经验,专注Java开发、定制、远程、指导等,csdn特邀作者、专注于Java技术领域 作者主页 超级帅帅吴 Java项目精品实战案例《500套》 欢迎点赞 收藏 ⭐留言 文末获取源码联系方式 文章目录 …

前端技术到底是深度重要,还是广度重要?

前言 前几天跟朋友讨论“技术广度和技术深度哪个重要”,再想想自己像过山车一般的前端历程,有感而发,想给小兄弟们一些建议~ 为什么会有这个疑问? 还记得两年前,甚至是一年前,当时想要找到一份好工作&am…

API 网关 vs 负载均衡:选择适合你的网络流量管理组件

由于互联网技术的发展,网络数据的请求数节节攀升,这使得服务器承受的压力越来越大。在早期的系统架构中,通常使用负载均衡来将网络流量平摊到多个服务器中,以此减轻单台服务器的压力。但是现如今,后端服务的种类在不断…

STM32-ADC模拟数字转换器

ADC 1、简介1.2、逐次逼近型ADC1.3 ADC基本结构转换模式触发控制数据对齐转换时间(针对高转换速率)校准硬件电路 2、软件编写初始化 1、简介 1、ADC(Analog-Digital Converter)模拟-数字转换器 2、ADC可以将引脚上连续变化的模拟…

【MySQL学习笔记】(一)MySQL数据库基础

MySQL数据库基础 1 MySQL 连接服务器指令2 mysql 和mysqld的区别3 数据库存储 VS 文件存储4 初次使用数据库 理解数据库是什么4.1 使用数据库4.2 小总结 5 主流数据库6 SQL分类7 存储引擎 1 MySQL 连接服务器指令 mysql -h 127.0.0.1 -P 3306 -u root -p-h 指明登录部署了mysq…

Vue3 简介

Vue3简介 01 Vue vue 是一个前端的框架,主要负责帮助我们构建用户的界面MVVM:Model - View - View Modelvue 负责 vm 的工作(视图模型),通过 vue 可以将视图和模型相关联。 当模型发生变化时,视图会自动更…

Quartus 实例应用(1)——EDA技术概述

EDA 技术概述 一、EDA技术及其发展二、Top-down 设计与 IP 核复用2.1 Top-down 设计2.2 Bottom-up 设计2.3 IP 复用技术与 SoC 三、数字设计的流程3.1 设计输入3.2 综合3.3 布局布线3.4 仿真3.5 编程配置 我们已经进入数字化和信息化的时代,其特点是各种数字产品的广…