极限多标签学习综述(Extreme Multi-label Learning)

news2024/12/22 20:21:47

A Survey on Extreme Multi-label Learning

先给地址: https://arxiv.org/abs/2210.03968

博主曾整理过Multi-Label Image Classification(多标签图像分类),但这类任务中所用的数据集往往较小,分类数量并不多。但在更广泛的场景中,标签类别数目可能以百万量级出现,如推荐系统、搜索引擎中等等。如在社交平台上,为用户推荐tag,以自然文本形式出现的tag标签往往是语义广泛的,因此可以被视为是一个多标签学习任务。

任务定义
给定数据X和标签Y,该任务尝试学习一个函数f以映射输入x到y。y的种类通常特别大,通过按照标签y出现的频率进行排序,可以设定阈值 τ \tau τ将标签分为头部标签和尾部标签。

任务挑战
标签数量的众多将导致很多棘手的问题,主要有以下三种

    1. Volume。标签数据的增长使输入特征空间和输出标签空间都很大,从而导致可伸缩性问题和存储开销。应对该问题的三个最常见的假设分别是标签独立假设、洛沃兰克假设和层次结构假设(也分别对应着以下三种解决方案)。
    1. Quantity。数量是指标签的频率,分布通常是长尾的,即标签的频率分布高度不平衡,这些很少出现的标签却是数据集中的大多数。下图是维基百科和亚马逊的数据集分布,大量的标签呈现出明显的长尾分布。
      在这里插入图片描述
      对尾部标签的泛化是极限多标签学习的核心问题之一。
    1. Quality。质量是指注释标签的质量问题。由于标签集和样本量较大,注释每个实例是非常昂贵的,甚至在很多场景中这一部分都是缺失的。

解决方案
应对这三类挑战,也有一些典型的方法被陆续提出,如下图所示。

    1. Volume。Model Assumption 可以分为:二值关联方法、基于嵌入的方法和基于树的方法。
    1. Quantity。Tail-label Learning 可以分为:鲁棒损失函数、数据增强、知识转移。
    1. Quality。Weak Supervision可 以分为:零样本学习、缺失样本学习、多实例学习。

在这里插入图片描述

Model Assumption
应对特征空间和输出标签空间大的 Volume问题,Model Assumption 可以分为三个分支:二值关联方法、基于嵌入的方法和基于树的方法。

  • 二进制相关性方法(binary relevance),假设标签是相互独立的,然后为每个标签分别学习一个二进制分类器。实现简单,但二进制相关性的时间和内存复杂性与标签的数量呈线性关系,因此存在较高的计算开销。当然,在这种方法前置一个标签滤波器是一个减少开销的方法。
  • 基于嵌入的方法(embedding-based),利用标签本身的语义性,它们通常假设标签矩阵是低秩的。通常有两种嵌入方法,即线性或非线性投影。线性嵌入以将特征空间和标签空间一起嵌入到某个联合低维空间,通过在该空间计算相似度得到标签预测。在非线性嵌入中,利用图神经网络学习标签之间的非线性关系较为流行。这类将标签也视为特征的做法,也可以缓解尾标签样本数量不足,减少模型的参数数量和训练成本。此类方法最大的缺点在于嵌入过程中信息的丢失。
  • 基于树的方法(tree-based),一般以层次的形式挖掘标签语义,可以大大减少推理时间。通常有两种类型的构树策略:实例树(instance tree-based)和标签树(label tree-based),这取决于在树节点中树分类是按实例或标签进行划分。在实例树中,每个节点由一组训练示例组成,然后逐层分配给子节点,这一点的直觉来源于特征空间的每个区域只包含少量的活动标签。在标签树中,每个节点由一组标签组成,然后将这些标签分配给子节点,一般通过递归的聚类方法来确定分类,直到达到构树的停止条件。基于树的方法的缺点在于,它可能会出现级联效应的影响,即预测误差从顶部传到底部。

在这里插入图片描述

Tail-label Learning
标签的长尾问题是一个重要的统计特征,除了头部特征外,尾部标签在许多现实应用中也十分重要,可以使信息更丰富和有益,如个性化推荐。但是不经常出现的标签(称为尾部标签)比经常出现的标签(称为头部标签)更难预测,特别是传统的方法采取所有标签重要性同等,很容易模型训练在头部标签上表现更好,而对尾部标签的预测性能更差。

为了应对标签长尾的问题,Tail-label Learning 可以分为以下分支:

  • 鲁棒损失函数(Robust Loss Function)。主要通过设计一些损失函数引导模型增加对尾部标签的优先级,从而提高了尾部标签的泛化性能。
  • 数据增强(Data Manipulation)。提高尾部标签性能的另一个简单想法是生成更多的数据,分为扩充数据或增强标签。
  • 知识转移(Knowledge Transfer)。主要通过将知识从一些标签转移到另一些标签,如ECC为每个标签依次训练一个二进制分类器,然后给定每个标签,它使用原始特征和前一个标签分类器的预测来训练分类器。或者DeepXML同时在头部标签和尾部标签上训练两个深度模型,然后将头部标签的语义表示转移到尾部标签模型中。

Weak Supervision
为了解决标注昂贵问题,Weak Supervision被使用最多,主要讨论如何解决缺失标签甚至完全没有标签。缺失标签可以通过观察到的标签进行训练模型并处理缺失的标签。完全没有标签的zero-shot状态可以分为几种形式:

  • eXtreme Multilabel Learning(XML)。
  • Generalized Zero-shot Extreme Multi-label Learning (GZXML)。
  • Few-Shot eXtreme Multi-label Learning(FSXML)。
  • Extreme Zero-shot eXtreme Multi-label Learning(EZXML)。

未来方向
模型结构:

  • 基于树的结构如何优化切分方式,基于聚类是否是最优?
  • 基于嵌入如何控制过拟合?

长尾问题:

  • 如何划分头部和尾部?目前的划分方法主要通过,设定特定部分为尾部或根据标签频率卡阈值,并没有一个原则的方法。
  • 如何平衡头部和尾部准确率?很多工作展示了两类指标难以同时优化,因此有需要根据特定的XML任务进行权衡。
  • 如何设计尾部标签的损失函数?
  • 如何评估有尾部标签的模型?目前无法清楚地看到头部标签和尾部标签对指标的贡献。

弱监督学习

  • 极端的多实例多标签学习(Extreme multi-instance multi-label learning)。例如,在视频分类中,标签是以视频级别进行标记的,人们可能希望预测视频的每一帧的相关标签。
  • 开放域的极端多标签学习(Open-set extreme multi-label learning)。在许多真实世界的应用程序中,如何应用出现得特别快的新标签,即开放域标签,其除了对已知标签进行分类外,还需要学习开放域标签。
  • 极端的多标签学习与流媒体标签(Extreme multi-label learning with streaming labels)。处理流媒体标签需要对经过训练的模型进行在线更新,目前还没发做的很好。
  • 极端的多标签学习与缺失的标签(Extreme multi-label learning with missing labels)。由于标签空间大,缺少标签的现象很普遍,同时应对尾部标签和看不见的标签非常具挑战性。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/115917.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

JavaScript的原型链

JavaScript的原型链 JavaScript的继承主要是通过原型链实现的,所以理解原型链是掌握JavaScript继承的关键一环。原型链的继承的基本思想是通过原型链继承多个引用类型的属性和方法。 理解原型链 关于原型链的定义与理解: 每个构造函数都有一个原型对…

Python实现将位图描摹为彩色矢量 svg 图片的源代码,Python实现位图转彩色矢量代码

Color Trace 这是一个将位图描摹为彩色矢量 svg 图片的程序,是一个命令行工具,使用 Python 脚本实现,运行环境 Python3.8。 ✨ 效果 以一个字帖图片为例,这是 png 格式的位图(370KB): 这是颜…

多智能体强化学习环境【星际争霸II】SMAC环境配置

多智能体强化学习这个领域中,很多Paper都使用的一个环境是——星际争多智能体挑战(StarCraft Multi-Agent Challenge, SMAC)。最近也配置了这个环境,把中间一些步骤记录下来。2022.12.26 文章目录1 环境介绍1.1 相关论文1.2 项目代码地址2 安装过程3 相关…

2023年pmp的考试时间是什么时候?(含pmp资料)

不出意外,按照原计划,就是3、6、9、12月,22年11月延期考试地区的考生或者退考的估计会在3月或者6月考。具体就及时关注官网消息。 ​新版中文报名网站:中国国际人才交流基金会 这里说一下PMP的基本考试情况: 【考试注…

模型实战(2)之YOLOv5 实时实例分割+训练自己数据集

模型实战(2)之YOLOv5 实时实例分割训练自己数据集 本文将详解YOLOv5实例分割模型的使用及从头训练自己的数据集得到最优权重,可以直接替换数据集进行训练的训练模型可通过我的gitcode进行下载:https://gitcode.net/openmodel/yolo…

使用matplotlib画图 + python色彩大全

目录画线画点散点画点的形状、线的形状画点线在特定位置写文字plt.legend()中图例的位置方法一 plt.legend(loc4)方法二 plt.legend(bbox_to_anchor(num1, num2))方法三 bbox_to_anchor(1.05, 1), loc2, borderaxespad0保存图片指定图片大小网格线根据自己的需求做了一个画图的…

图的最短路径

文章目录单源最短路径-Dijkstra算法单源最短路径--Bellman-Ford算法多源最短路径--Floyd-Warshall算法单源最短路径-Dijkstra算法 针对一个带权有向图G,将所有结点分为两组S和Q,S是已经确定最短路径的结点集合,在初始时为空(初始…

如何使用监控诊断工具Arthas(阿尔萨斯)

Arthas 是一款线上监控诊断产品,通过全局视角实时查看应用 load、内存、gc、线程的状态信息,并能在不修改应用代码的情况下,对业务问题进行诊断,包括查看方法调用的出入参、异常,监测方法执行耗时,类加载信…

【python】实现精美圣诞树-拿下女神不是梦

🍁博主简介: 🏅云计算领域优质创作者 🏅2022年CSDN新星计划python赛道第一名 🏅2022年CSDN原力计划优质作者 🏅阿里云ACE认证高级工程师 🏅阿里云开发者社区专…

Java Web基础面试题

✅作者简介:热爱国学的Java后端开发者,修心和技术同步精进。 🍎个人主页:Java Fans的博客 🍊个人信条:不迁怒,不贰过。小知识,大智慧。 💞当前专栏:Java面试题…

【K3s】第4篇 一篇文章带你了解使用Kompose

目录 1、Kompose介绍 2、安装Kompose 3、docker-compose文件转换为k8s文件 1、Kompose介绍 kompose是一个帮助熟悉 Kubernetes 的用户迁移到k8s的工具。 获取 Docker Compose 文件并将其转换为 Kubernetes 资源。 kompose是一个方便的工具,可以从本地 Docker …

Ffuf爆破神器(超详细)

目录为什么是Ffuf基本使用最基本的使用多个字典同时使用带cookie扫描(-b)静默模式(-s)递归扫描(-recursion)指定扩展名(-e)POST请求爆破方式1:指明请求地址和请求体【不推…

iOS 自动化测试踩坑(一): 技术方案、环境配置与落地实践

移动端的自动化测试,最常见的是 Android 自动化测试,我个人觉得 Android 的测试优先级会更高,也更开放,更容易测试;而 iOS 相较于 Android 要安全稳定的多,但也是一个必须测试的方向,这个系列文…

Android实现雪花特效自定义view

一、前言 这个冬天,老家一直没有下雨, 正好圣诞节,就想着制作一个下雪的特效。 圣诞祝福:平安夜,舞翩阡。雪花飘,飞满天。心与心,永相伴。 圣诞节是传统的宗教节日,对于基 督徒&…

前端自学你还在浪费时间吗?

其实最主要不是学的过程,而是学完后,你有没有把今天的练习题自己在重新敲个2,3遍,这样印象就会更加深刻,以后自己写代码的时候也会更加的得心应手。 手抄笔记让我打好了HTML基础和良好的CSS能力,当然这不一…

Cesium打包入门(gulp与esbuild)

本文针对Cesium源码包的打包工具gulp和esbuild进行了初步探讨,属于入门篇。 首先简要介绍采用gulpesbuild如何为多个源代码文件打包成一个单独文件,然后介绍了下Cesium中的源码包的结构,并简要分析了其打包的相关函数。 本文编译环境IDE使用…

【并发编程学习】一、线程的基本认识

一、线程的基本认识 1.1线程的基本介绍 线程是什么? 线程是操作系统能够进行运算调度的最小单位。它被包含在进程之中,是进程中的实际运行单位。 为什么会有多线程? ①因为其是CPU的最小调度单位,所以在多核CPU中&#xff0c…

圣诞节,深圳街头有点冷清了~

正文大家好,我是bug菌~今天是圣诞节,这也是我新冠康复的第二周了吧,还有点小咳嗽,伴随有点鼻炎,不过这周已经上了三天班了,整体感觉还算好吧,毕竟我嘴巴不硬,也比较低调不嚣张&#…

底层硬件创新夯实算力、应用创新贴近业务:英特尔至强助力下的VR医疗培训系统

早在1935年,科幻小说家斯坦利温鲍姆的小说《皮格马利翁的眼镜》中,就构想了一款实现虚拟现实(VR)的眼镜。近年来,除游戏、娱乐等大众熟知的应用场景外,VR逐渐涉足医疗、教育、生产制造等各种领域。 以医疗…

LeetCode-1759-统计同构子字符串的数目

1、数学 我们可以使用数学进行分析:每当出现连续的nnn个字符时,我们最终将其合在一起进行计算个数。显然我们可以获得的同构子字符串的个数应为n(n1)2\frac{n \times (n1)}{2}2n(n1)​。因此我们只需要遍历整个字符串,分别统计连续出现的字符…