【顶刊TPAMI 2025】多头编码(MHE)之Part 6:极限分类无需预处理

news2025/1/7 9:10:36

目录

  • 1 标签分解方法的消融研究
  • 2 标签分解对泛化的影响
  • 3 讨论
  • 4 结论

论文:Multi-Head Encoding for Extreme Label Classification
作者:Daojun Liang, Haixia Zhang, Dongfeng Yuan and Minggao Zhang
单位:山东大学
代码:https://github.com/Anoise/MHE

论文地址:Online,ArXiv,GItHub

背景动机参见 【顶刊TPAMI 2025】多头编码(MHE)之极限分类 Part 1
基础知识参见 【顶刊TPAMI 2025】多头编码(MHE)之极限分类 Part 2
算法实现参见 【顶刊TPAMI 2025】多头编码(MHE)之极限分类 Part 3
表示能力参见 【顶刊TPAMI 2025】多头编码(MHE)之极限分类 Part 4
实验结果参见 【顶刊TPAMI 2025】多头编码(MHE)之极限分类 Part 5
无需预处理见 【顶刊TPAMI 2025】多头编码(MHE)之极限分类 Part 6

请各位同学给我点赞,激励我创作更好、更多、更优质的内容!^_^

关注微信公众号,获取更多资讯
在这里插入图片描述

1 标签分解方法的消融研究

为了进一步验证定理3中隐含的结论,即当模型泛化与数据过度拟合时,模型泛化变得与标签的语义无关,本文对模型泛化进行标签分解的消融研究。众所周知,预处理技术的核心是对极端标签进行语义聚类,将其划分为多个易于处理的局部标签。因此,本文将使用标签聚类(LC)的模型与使用标签随机重排和任意分解(LRD)的模型的性能进行比较。
在这里插入图片描述

图8:XLC中标签分解预处理(a)与未预处理(b)的比较。 F F F是从模型中提取的特征。 C i C_i Ci i i i-个簇, C i ′ C'_i Ci i i i-个随机标签集。在每个阶段,都有一个将特征映射到特定集合或类别的分类器。

如图8所示,标签分解可以被概念化为多阶段分类过程,即,给定特征最初被分配给簇,随后识别该簇内的特定类别。 如图8-a所示,预处理技术可以促进分类的初始阶段,例如区分运输的两个类别(狗可以被认为是填充类别) 而动物由于其巨大的差异而被证明是容易的。 然而,在第二阶段,基于粗特征对精细子类别进行分类变得困难,例如,从动物簇中区分蚂蚁、鸟类和蜜蜂变得更加困难( C 2 C_2 C2 )而不是从混合簇( C 2 C_2 C2),如图8-b所示,其中没有使用预处理技术。这表明,在没有标签预处理的情况下,LRD 的初始阶段相对困难,而第二阶段则相对于 LC 简单。 更多真实数据集的实验结果请参见附录F.4 。

2 标签分解对泛化的影响

此外,本文还比较了三种不同复杂度的模型,以评估它们在使用精心设计的 LC 和随机 LRD 方法进行配置时的泛化能力。如图9所示,当低复杂度模型对数据拟合不足时,LRD 和 LC 之间存在明显的性能差距:小模型(图9-a )中约为 4%,中模型(图 9-a)中约为 2%(图9-b )。这是因为层次分类器在后续阶段的性能依赖于早期阶段的决策结果,特别是当低复杂度模型提取的特征表现出可区分性降低时。这解释了为什么在涉及低复杂度的情况下,LRD 模型落后于 LC 模型。然而,随着模型复杂性的增加,这种性能差距逐渐缩小。最终,当模型过度拟合数据时,如图9-c所示,LRD 和 LC 之间的差距消失。值得注意的是,尽管这里使用的高复杂度模型(ResNet-18)很小,但该模型的过度参数化在实践中很容易实现。此外,本文的实验,包括附录F.4中的实验,支持LC和LRD的泛化性能是一致的。
在这里插入图片描述

图 9 :消融研究,调查标签分解模式对模型泛化的影响。 'LC’表示标签聚类,'LRD’表示标签随机重排然后任意分解。 SimpleConv-4(小)表示欠拟合,ResNet-10(中)表示欠拟合,ResNet-18(大)表示过拟合。

总之,本文发现当簇的数量保持不变并且其中样本的分布近似均匀时,LRD 不会损害超参数化模型的泛化能力。这有力地支持了定理3中隐含的主张。

3 讨论

在这里,本文通过阐明 MHE 与其他采用多个分类器的方法之间的区别来讨论 MHE 的创新性。

最近的几种方法[ 59 , 60 ]利用多个分类器来解决长尾分布问题。具体来说, [ 59 , 60 ]中的作者将数据集分成平衡的子集,并在每个子集上训练专家模型。然后,将多个专家模型(一个子集上的一个模型)聚合以获得最终模型,如图10a所示。长尾方法不适用于解决CCOP,因为聚合模型中分类器的参数没有减少。与上述不同形式的方法不同,如图10 (eg)所示,所提出的基于MHE的算法可以通过将难以解决的极端标签分解为多个易于解决的局部标签并组合局部标签来很好地解决CCOP通过简单的计算得到极端的标签。

有许多基于树的方法[ 2,11,12 ]使用多个分类器来执行 XLC 任务。这些方法通过分层分支来划分标签空间。例如,Hierarchical softmax [ 2 , 22 ]采用霍夫曼树对短分支的高频词进行编码,如图10a所示。然而,巨大的标签空间极大地增加了树的深度和大小,需要遍历低频样本的深层路径,使其不适合 XMLC 任务。受此推动,一些基于HLT的方法[ 11 , 12 ]被提出,但它们涉及节点分裂时的复杂优化,使得难以获得廉价且可扩展的树结构[ 26 ] 。相反,基于 MHE 的算法没有预处理步骤。因此,只要标签空间完全映射,分类器的长度可以任意划分。
在这里插入图片描述

图10:使用多个分类器的算法之间的比较。符号“ ⨄ \biguplus ”表示聚合运算,“ ⨂ \bigotimes ”表示克罗内克积运算。

一些多标签学习算法也采用多分类器来处理标签功率集过大的关键挑战。具体而言,如图10-c所示,二值相关算法将多标签学习问题分解为 ∣ Y ∣ |\bm{Y}| Y个独立的二值分类问题。在图10-d中,分类器链算法将多标签学习问题转化为二元分类问题链,其中链中的后续二元分类器建立在前一个分类器的预测之上。但是,这些算法中分类器的数量等于标签的数量,不适合XLC任务。与这些算法不同的是,提出了基于mhe的算法,通过组合多头分类器来解决CCOP问题。因此,基于mhes的算法的计算复杂度大大降低,使其更加灵活,更适合XLC任务。

4 结论

在本文中,本文提出了一种多头编码(MHE)机制来应对 XLC 任务中存在的 CCOP 挑战。 MHE将极端标签分解为多个短局部标签的乘积,每个头在这些局部标签上进行训练和测试,从而几何上减少了计算量。针对XLC任务,例如XSLC、XMLC和模型预训练,设计了三种基于MHE的算法,包括多头乘积(MHP)、多头级联(MHC)和多头采样(MHS)。实验结果表明,三种基于MHE的算法在其应用的任务中均实现了SOTA性能,并且可以大大加快模型训练和推理的速度。此外,本文对MHE的表征能力进行了理论分析。事实证明,OHE 和 MHE 之间的性能差距相当小,并且不需要标签预处理技术。

本文认为XLC是传统分类任务的自然延伸,它使本文能够处理极端标签,并且更适合真实世界的样本和实际应用。反过来,为 XLC 设计的基于 MHE 的算法可以为许多传统任务带来更多新颖的解决方案。例如,本文可以将回归任务转化为XLC任务,并使用基于MHE的算法来解决它。在强化学习中,当将其视为 XLC 任务时,基于 MHE 的算法可以为极端状态空间提供准确的预测。

背景动机参见 【顶刊TPAMI 2025】多头编码(MHE)之极限分类 Part 1
基础知识参见 【顶刊TPAMI 2025】多头编码(MHE)之极限分类 Part 2
算法实现参见 【顶刊TPAMI 2025】多头编码(MHE)之极限分类 Part 3
表示能力参见 【顶刊TPAMI 2025】多头编码(MHE)之极限分类 Part 4
实验结果参见 【顶刊TPAMI 2025】多头编码(MHE)之极限分类 Part 5
无需预处理见 【顶刊TPAMI 2025】多头编码(MHE)之极限分类 Part 6

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2271529.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

vue视频录制 限制大小,限制时长

<template><div style"height: 100vh;background: #000;"><span style"color: #fff;font-size: 18px;">切换数量&#xff1a;{{ devices.length }}</span><video ref"video" autoplay muted playsinline></vid…

毕业项目推荐:基于yolov8/yolov5的行人摔倒检测识别系统(python+卷积神经网络)

文章目录 概要一、整体资源介绍技术要点功能展示&#xff1a;功能1 支持单张图片识别功能2 支持遍历文件夹识别功能3 支持识别视频文件功能4 支持摄像头识别功能5 支持结果文件导出&#xff08;xls格式&#xff09;功能6 支持切换检测到的目标查看 二、数据集三、算法介绍1. YO…

高等数学学习笔记 ☞ 无穷小比较与等价无穷小替换

1. 无穷小比较 1. 本质&#xff1a;就是函数的极限趋于0时的速度&#xff0c;谁快谁慢的问题。 2. 定义&#xff1a;若是在同一自变量的变化过程中的无穷小&#xff0c;且&#xff0c;则&#xff1a; ①&#xff1a;若&#xff0c;则称是比的高阶无穷小&#xff0c;记作&…

基于Spring Boot的智能笔记的开发与应用

一、项目背景与意义 智能笔记系统旨在为用户提供便捷、高效的笔记记录与管理服务。通过智能化的功能&#xff0c;如自动分类、标签管理、全文搜索等&#xff0c;用户可以更加轻松地管理和查找自己的笔记。同时&#xff0c;基于Spring Boot的开发使得系统具有高度的可扩展性和可…

word中插入zotero引用

1、参考文献末尾没有文献&#xff1f; 在文献条目要显示的地方点击“refresh” 2、参考文献条目没有悬挂缩进&#xff1f; 把“书目”添加到样式库中&#xff0c;修改样式为悬挂缩进1.5字符 3、交叉引用&#xff1f; 宏 新建一个宏 粘贴下面代码 Public Sub ZoteroLinkCita…

简历_专业技能_熟悉Redis常用数据结构及其操作命令

系列博客目录 文章目录 系列博客目录1.Redis通用命令2.String类型3.Hash类型4.List类型5.Set类型6.Sorted类型7.StringRedisTemplate 1.Redis通用命令 通用指令是部分数据类型的&#xff0c;都可以使用的指令&#xff0c;常见的有&#xff1a; KEYS&#xff1a;查看符合模板的…

快速将索尼手机联系人导出为 HTML 文件

我想将 Sony Xperia 手机上的联系人导出到计算机上进行备份&#xff0c;并在需要时进行编辑。这可以做到吗&#xff1f;如何做到&#xff1f;作为助手我需要下载什么工具吗&#xff1f; 当您的 Android 手机上存储了如此多的重要联系人&#xff0c;而您又不想丢失它们时&#…

爬虫案例-爬取某度文档

文章目录 1、第三方库的安装和pytesseract安装2、爬取某度文档的代码3、效果图 1、第三方库的安装和pytesseract安装 #以下是安装http请求的第三方库 pip install requests #以下是安装处理文档的第三方库 pip install python-docx #以下是安装处理图片的第三方库 pip install…

《塑战核心》V1.0.0.9952官方中文版

体验打击感满分的近距离战斗。击败蜂拥而至的敌人&#xff0c;每次击杀都会让你变得更强。 《塑战核心》官方中文版https://pan.xunlei.com/s/VODW7effpagQN1JU0UpBQQ5uA1?pwdmr8g#

电子邮件对网络安全的需求

&#xff08; 1&#xff09;机密性&#xff1a;传输过程中不被第三方阅读到邮件内容&#xff0c;只有真正的接收方才可以阅读邮件。&#xff08; 1.5 分&#xff09; &#xff08; 2&#xff09;完整性&#xff1a;支持在邮件传输过程中不被篡改&#xff0c;若发生篡改&#…

【嵌入式硬件】直流电机驱动相关

项目场景&#xff1a; 驱动履带车&#xff08;双直流电机&#xff09;前进、后退、转弯 问题描述 电机驱动MOS管烧毁 电机驱动采用IR2104STRH1R403NL的H桥方案&#xff08;这是修改之后的图&#xff09; 原因分析&#xff1a; 1.主要原因是4路PWM没有限幅&#xff0c;修改…

用户注册模块(芒果头条项目进度4)

1 创建⽤户模块⼦应⽤ 1.1 在项⽬包⽬录下 创建apps的python包。 1.2 在apps包下 创建应⽤userapp $ cd 项⽬包⽬录/apps $ python ../../manage.py startapp userapp 1.3 配置导包路径 默认情况下导包路径指向项⽬根⽬录 # 通过下⾯语句可以打印当前导包路径 print(sys.pa…

element输入框及表单元素自定义前缀

如图所示&#xff1a; <el-input class"custom-input" placeholder"请输入" prefix-icon"prefix" v-model"form.name" clearable></el-input> :deep(.custom-input) {.el-input__icon {display: inline-block;width: 40…

使用MPTCP+BBR进行数据传输,让网络又快又稳

1.前言 在前文《链路聚合技术——多路径传输Multipath TCP(MPTCP)快速实践》中我们使用mptcpize run命令实现了两个节点间通信使用MPTCP协议进行传输&#xff0c;并实现了传输速率的聚合。 实际应用中更推荐原生支持mptcp的应用&#xff0c;在MPTCP官网中可以看到如TCPDump、…

电商Google广告:2025年提升转化率的5种策略

展望 2025 年&#xff0c;Google 广告领域将迎来一系列显著变化&#xff0c;这些趋势对于提升广告转化率至关重要&#xff0c;值得我们提前关注与布局。 智能化程度持续加深&#xff0c;用户搜索习惯愈发精细&#xff0c;广告格式推陈出新&#xff0c;视频广告势头正猛...那么…

基于Java的敬老院管理系统的设计和实现【源码+文档+部署讲解】

基于Java的敬老院管理系统设计和实现 摘 要 新世纪以来,互联网与计算机技术的快速发展,我国也迈进网络化、集成化的信息大数据时代。对于大众而言,单机应用早已成为过去&#xff0c;传统模式早已满足不了当下办公生活等多种领域的需求,在一台电脑上不联网的软件少之又少&#x…

如何使用OpenCV进行抓图-多线程

前言 需求&#xff1a; 1、如何使用OpenCV捕抓Windows电脑上USB摄像头的流、 2、采用多线程 3、获知当前摄像头的帧率。 这个需求&#xff0c;之前就有做了&#xff0c;但是由于出现了一个问题&#xff0c;人家摄像头的帧率目前都可以达到60帧/s 了&#xff0c;而我的程序…

Unity 中计算射线和平面相交距离的原理

有此方法 能够计算射线和平面是否相交以及射线起点到平面交点的距离 代码分析 var dot Vector3.Dot(ray.direction, plane.normal);计算射线和平面法线的点积&#xff0c;如果大于等于0&#xff0c;则说明射线和平面没有相交&#xff0c;否则&#xff0c;说明射线和平面相交…

C 语言的整型提升问题

目录 引言 一、什么是整型提升 二、为什么会有整型提升 三、整型提升的规则 四、整型提升的影响 五、如何避免整型提升带来的问题 六、总结 引言 在 C 语言中&#xff0c;整型提升&#xff08;Integer Promotion&#xff09;是一个常常被忽视但却非常重要的概念。理解整…

LangChain4j 框架探索

LangChain4j 框架探索 Get Started核心概念1 - Message核心概念2 - Model核心概念3 - Ai Services核心概念4 - Structured Output核心概念5 - Chat Memory核心概念6 - Tool (Function Calling)核心概念7 - RAG(Retrieval-Augmented Generation)核心 RAG APIs使用示例 总结 Get …