【半监督学习】Match系列.1

news2025/1/15 8:07:01

半监督学习(SSL)

半监督学习(SSL). 让学习器不依赖外界交互、自动地利用未标记样本来提升学习性能. 即在少量样本标签的引导下, 能够充分利用大量无标签样本提高学习性能, 避免了数据资源的浪费, 同时解决了有标签样本较少时监督学习方法泛化能力不强和缺少样本标签引导时无监督学习方法不准确的问题.

具体介绍可见相关综述与博客:

【综述】半监督语义分割_m0_61899108的博客-CSDN博客

长文总结半监督学习(Semi-Supervised Learning) - 知乎 (zhihu.com)

半监督学习 - 知乎 (zhihu.com)

基本假设

  • The Smoothness Assumption平滑假设:近朱者赤近墨者黑,两个样本在高密度空间特征相近,则label应该一致。优化方案如Mixup,一致性正则和对抗学习。
  • The Cluster Assumption聚类假设:高维特征空间中,同一个簇的样本应该有相同的label,这个强假设其实是Smoothness的特例。
  • Low-density Separation低密度分离假设:分类边界应该处于样本空间的低密度区。这个假设更多是以上假设的必要条件,如果决策边界处于高密度区,则无法保证簇的完整和边缘平滑。优化方案如MinEntropy。

近来半监督图像分类任务有两大核心方法:一致性正则(Consistency Regularization)和打伪标签法(Pseudo-Label)。

本文简单介绍半监督算法中的Match系列方法:MixMatch(NIPS 2019),ReMixMatch(ICLR 2020),FixMatch(NIPS 2020),FeatMatch(ECCV 2020),FlexMatch(NlPS 2021)。

代码:https://github.com/TorchSSL/TorchSSL

MixMatch: A Holistic Approach to Semi-Supervised Learning, NeurIPS 2019

解读:超强半监督学习 MixMatch - 知乎 (zhihu.com)

MixMatch论文阅读 - 知乎 (zhihu.com)

半监督学习:MixMatch和ReMixMatch - 咖啡陪你 - 博客园 (cnblogs.com)

论文:https://arxiv.org/abs/1905.02249

代码:GitHub - YU1ut/MixMatch-pytorch: Code for "MixMatch - A Holistic Approach to Semi-Supervised Learning"

MixMatch,该算法为数据增强后产生的无标签示例猜测低熵标签,并使用MixUp混合有标签和无标签数据。许多半监督学习方法,通过在无标签数据上加一个损失项来使模型具有更好的泛化能力。损失项通常包含以下三种:1. 熵最小化(entropy minimization),鼓励模型在无标签数据上输出高置信度的预测结果;2. 一致性约束(consistency regularization),鼓励模型在数据有扰动之后输出相同的概率分布,3. 通用正则化(generic regularization),鼓励更好泛化和降低过拟合。MixMatch通过将现有方法融合到一个损失里面,取得好的效果.

ReMixMatch: Semi-Supervised Learning with Distribution Alignment and Augmentation Anchoring, ICLR 2020

解读:ReMixMatch论文阅读 - 知乎 (zhihu.com)

【ICLR2020】ReMixMatch - 知乎 (zhihu.com)

论文:https://arxiv.org/abs/1911.09785

代码:GitHub - google-research/remixmatch

 使用两种方式改进“MixMatch”算法:分布对齐(distribution alignment)和增强锚定(augmentation anchoring)。分布对齐鼓励对未标记数据的预测的边缘分布接近真实标签的边缘分布。增强锚定将input data的多个强增强版本输入到模型,并促使每个输出接近相同输入的弱增强版本的预测。

FixMatch: Simplifying Semi-Supervised Learning with Consistency and Confidence, NeurIPS 2020

解读:论文笔记---“FixMatch” - 知乎 (zhihu.com) 

FixMatch代码解析 - 知乎 (zhihu.com)

论文:https://arxiv.org/abs/2001.07685

代码:GitHub - google-research/fixmatch: A simple method to perform semi-supervised learning with limited data.

FixMatch,简单有效,主要创新在于一致性正则化和伪标签的组合,以及使用弱增强unlabel图像的预测生成伪标签,当作强增强unlabel图像的监督信号。 

 

FeatMatch: Feature-Based Augmentation for Semi-Supervised Learning, ECCV2020

解读:[半监督学习] FeatMatch: Feature-Based Augmentation for Semi-Supervised Learning_码侯烧酒的博客-CSDN博客

论文:https://arxiv.org/abs/2007.08505

123630460.pdf (ecva.net)

代码:GitHub - GT-RIPL/FeatMatch: PyTorch code for the paper: "FeatMatch: Feature-Based Augmentation for Semi-Supervised Learning"

FeatMatch 中提出: 通过从其他图像的特征中提取的代表性原型的 soft-attention 来学习细化和增强输入图像特征.

传统的基于图像的数据增强与基于特征的数据增强对比如下: 

传统的基于图像的增强存在以下两个限制:

  1. 在图像空间中操作, 限制了图像内对纹理或几何的可能转换.
  2. 在单个实例中操作, 无法使用其他实例的知识, 无论是在同一类别的内部还是外部.

一些使用 Mixup 的算法仅部分解决了第二个限制, 因为 mixup 仅在两个实例之间运行, 如 ICT MixMatch, ReMixMatch. 另一方面, Manifold Mixup 通过在特征空间中执行 Mixup 来接近第一个限制, 但仅限于两个样本的简单凸组合.

为了同时解决这两个限制, 本文提出一种新方法FeatMatch, 可以在抽象特征空间而不是图像空间中细化和增强图像特征. 为了有效地利用其他类的知识, 通过在特征空间中执行聚类来将每个类的信息浓缩成一个原型集合. 然后通过从所有类的原型传播的信息来细化和增强图像特征.

原型选择(Prototype Selection):K-Means 在每个 epoch 都进行原型提取, 特征细化和增强模块在训练循环中使用新提取的原型更新现有的原型.  

 特征增强(Feature Augmentation):选择出的新的原型集合后, 通过 soft-attention 对原型集进行特征细化和增强.

 

FlexMatch: Boosting Semi-Supervised Learning with Curriculum Pseudo Labeling, NeurIPS 2021

解读:FlexMatch论文阅读 - 知乎 (zhihu.com)

NeurIPS 2021 | 助力半监督学习:课程伪标签方法FlexMatch和统一开源库TorchSSL - 知乎 (zhihu.com)

论文:[2110.08263] FlexMatch: Boosting Semi-Supervised Learning with Curriculum Pseudo Labeling (arxiv.org)

代码:GitHub - TorchSSL/TorchSSL: A PyTorch-based library for semi-supervised learning (NeurIPS'21)

FixMatch对所有类使用预定义好的常量阈值来选择对训练有用的未标记数据,没有考虑到不同的学习状态和不同类别在判断上的困难。为了解决这个问题,本文提出课程伪标签(Curriculum Pseudo Labeling, CPL),一种根据模型的学习状态利用未标记数据的课程学习方法。CPL的核心是在每个时间步对不同的类灵活调整阈值,让有信息的无标签数据及其伪标签通过。CPL不引入额外的参数或计算(向前或向后传播)。将CPL应用于FixMatch,并命名改进的算法为FlexMatch。阈值会随着网络的训练逐步提升,不同的类别有不同的阈值。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/494670.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

YoloV8涨点神器:CFPNet-ECVBlock的小目标检测,即插即用,助力检测涨点

1.Centralized Feature Pyramid for Object Detection 论文地址: https://arxiv.org/abs/2210.02093 1.摘要: CFPNet简介 CFPNet即插即用,助力检测涨点,YOLOX/YOLOv5/YOLOV7均有效 1.3 Centralized Feature Pyramid (CFP) 如图2所示,CFP主要由以下部分组成:输入图像、…

<IBM AIX><ERRPT><No.001>《出现E86653C3、49183216、8003764C告警的处理 20230506》

《出现E86653C3、49183216、8003764C告警的处理 20230506》 1 现象2 分析3 结论4 引申 1 现象 服务器出现errpt告警,告警为E86653C3、49183216、8003764C。 2 分析 1、hdisk1对应的VG,为rootvg。 lspv |grep hdisk12、查看VG状态 lsvg rootvg说明…

聊聊压电材料高温介电温谱仪所知道的那些事(GWJDN-600A)

GWJDN-600A型压电材料高温介电温谱仪 关键词:单通道,双通道,四通道,高低温 GWJDN-600A压电材料高温介电温谱仪本高频介电温谱系统主要用于绝缘材料在不同温度不同频率下的电学性能测试,系统包含高温炉膛,阻…

【云原生】k8s集群部署Rook+Ceph云原生存储

文章目录 一、Rook介绍二、Ceph介绍三、部署Rook和Ceph3.1 前置准备3.2 部署Rook3.3 部署Ceph集群3.4 部署ceph dashboard 四、部署Rook工具箱五、部署RBD StorageClass 一、Rook介绍 Rook 官网地址:https://rook.io 是一个自管理的分布式存储编排系统,…

c++基础学习Num04

目录 基于for循环 一维数组 二维数组理解 c语言的null和c的null 基于for循环 for(ELEMTYPE val:array){}ELEMTYPE:是范围变量的类型。通常使用auto自动转换范围变量类型 val:范围变量的名称。通过迭代依次接收数组中的元素值 array:容器,注意这里的array必须是…

ctfshow 每周大挑战 RCE极限挑战 2

目录 题目解题步骤1.跑一下正则2.变量自增3.最终解题payload 一点多余的思考 题目 解题步骤 1.跑一下正则 本着能懒就懒的原则,就不写Python了(提一下这个主要是我一开始想的是写Python呜呜呜),直接写php,还能复制粘…

C生万物 | 指针入门到进阶就看这篇了【十万字吐血整理,收藏学习】

文章篇幅较长,可前往电脑端进行学习💻 之前很多粉丝私信我说C语言指针怎么这么难,看了很多视频都学不懂,于是我写了一篇有关指针从入门到进阶的教学,帮助那些对指针很困扰的同学有一个好的学习途径,下面是本…

基于JavaWeb实现的学生宿舍管理系统

【简介】 本系统是基于Java实现的学生宿舍管理系统,前端:Vue;后端:SpringBoot Mybatis Redis Mysql;系统环境:jdk1.8 | mysql | redis | nodejs14。有包含登录在内的十大功能模块,三个访问角…

详解事务模式和 Lua 脚本,带你吃透 Redis 事务

先说结论: Redis 的事务模式具备如下特点: 保证隔离性;无法保证持久性;具备了一定的原子性,但不支持回滚;一致性的概念有分歧,假设在一致性的核心是约束的语意下,Redis 的事务可以…

Vuex从了解到实际运用(一)彻底搞懂什么是Vuex

vuex从了解到实际运用——彻底搞懂什么是vuex 知识回调(不懂就看这儿!)场景复现核心干货什么是vuex全局状态管理使用状态管理工具后的好处vuex的实现原理vuex的组件通信1.多级组件通信2.同级组件通信使用vuex进行组件通信 关于vuex的小结 知识…

总结842

学习目标: 5月(张宇强化18讲,背诵25篇短文,熟词僻义300词基础词) 每日必复习(5分钟) 学习内容: 暴力英语:背200个基础词阅读理解前两段语法 高等数学:强化课第一讲 小…

Baumer工业相机堡盟工业相机如何联合BGAPISDK和Halcon实现图像的Pow伽马变换算法增强(C#)

Baumer工业相机堡盟工业相机如何联合BGAPISDK和Halcon实现图像的Pow伽马变换算法增强(C#) Baumer工业相机Baumer工业相机使用图像算法增加图像的技术背景Baumer工业相机通过BGAPI SDK联合Halcon使用Pow伽马变换增强算法1.引用合适的类文件2.BGAPI SDK在图…

gtest之断言

目录 普通断言EXPECT_THAT 布尔条件断言EXPECT_TRUEEXPECT_FALSE 二进制断言EXPECT_EQEXPECT_NEEXPECT_LTEXPECT_LEEXPECT_GTEXPECT_GE 字符串比较EXPECT_STREQEXPECT_STRNEEXPECT_STRCASEEQEXPECT_STRCASENE 浮点型比较EXPECT_FLOAT_EQEXPECT_DOUBLE_EQEXPECT_NEAR 显式成功与…

k8s基础4——deployment控制器、应用部署、升级、回滚、水平扩容缩容

文章目录 一、基本介绍二、应用程序生命周期2.1 部署应用2.2 应用升级2.2.1 修改YAML文件升级(交互式)2.2.2 命令指定镜像版本升级(免交互式)2.2.3 调用vim升级 2.3 滚动升级2.3.1 升级流程 2.4 应用回滚2.4.1 查看历史发布版本2.…

yolov5配置错误记录

这里是直接没有找到数据集,说明是路径错误。经过设置yaml后, # Train/val/test sets as 1) dir: path/to/imgs, 2) file: path/to/imgs.txt, or 3) list: [path/to/imgs1, path/to/imgs2, ..] path: ../autodl-tmp/datasets/neu # dataset root dir tr…

闲鱼/支付宝 自动收货诈骗套路分析

闲鱼/支付宝 自动收货套路分析 他人闲鱼被骗经历 最近发现闲鱼有一种“自动收货”的套路,就是在闲鱼下单后,卖家发一个二维码,称让你支付运费,该二维码以闲鱼之类的logo为诱惑,让你相信是真的运费支付二维码 正如上文知…

Self-Attention结构细节及计算过程

一、结构 上面那个图其实不是那么重要,只要知道将输入的x矩阵转换成三个矩阵进行计算即可。自注意力结构的输入为 输入矩阵的三个变形 Q(query矩阵)、K(key矩阵)、V(value矩阵)构成,…

Java企业级信息系统02—利用组件注解符精简spring配置文件

文章目录 一、学习目标二、打开01的项目三、利用组件注解符精简spring配置文件(一)创建新包,复制四个类(二)修改杀龙任务类(三)修改救美任务类(四)修改勇敢骑士类&#x…

Mac安装docker

一、docker是什么? 1、Docker的三个基本概念: Image(镜像)Container(容器)Repository(仓库) Docker的思想来自于集装箱,集装箱解决了什么问题? 在一艘大船上,可以把货物规整的摆放起来。并且各种各样的货物被集装箱标准化了&a…

你还不知道啊,iPhone手机恢复出厂设置的那些事!

案例:手机恢复出厂设置 【友友们,苹果手机想要挂闲鱼,里面有很多隐私。想要恢复出厂设置来清除手机数据,该怎么进行?有什么需要注意的吗?】 iPhone手机想要进行二次销售,我们一般都会采取方法来…