【论文速递】ECCV2022 - ConMatch:置信度引导的半监督学习

news2025/4/17 5:36:12

【论文速递】ECCV2022 - ConMatch:置信度引导的半监督学习

【论文原文】:ConMatch: Semi-Supervised Learning with Confidence-Guided Consistency Regularization

获取地址:https://arxiv.org/abs/2208.08631

博主关键词: 半监督学习,对比学习,一致性正则化

摘要:

​ 我们提出了一种新的半监督学习框架,智能地利用模型预测之间的一致性正则化,从图像的两个强增强视图,由伪标签置信度加权,称为ConMatch。虽然最新的半监督学习方法使用图像的弱增强视图和强增强视图来定义方向一致性损失,但如何为两个强增强视图之间的一致性正则化定义这种方向仍未探索。为了解释这一点,我们提出了新的伪标签置信度测量方法,通过弱增强视图作为非参数和参数方法的锚。特别是在参数化方法中,我们首次提出了在网络中学习伪标签置信度的方法,这是通过骨干网模型端到端学习的。此外,我们还提出了分阶段训练,以促进训练的收敛。当将ConMatch整合到现有的半监督学习器中时,它能不断提高性能。我们通过实验来证明ConMatch比最新方法的有效性,并提供广泛的消融研究。代码已在https://github.com/JiwonCocoder/ConMatch上公开提供。

简介:

​ 半监督学习已经成为一种有吸引力的解决方案,以减轻对大量标记数据的依赖,这些数据通常很难获得,并智能地利用大量未标记数据,以至于被部署在许多计算机视觉应用程序中,特别是图像分类[40,53,55]。该任务一般采用伪标记[1,19,30,40,46,51,61]或一致性正则化[17,24,29,36,48,53]。一些方法[4,5,42,47,52,54,58]提出将这两种方法整合在一个统一的框架中,这通常被称为整体方法。FixMatch[47]是一项开创性的工作,它首先根据模型对弱增强实例的预测生成一个伪标签,然后鼓励来自强增强实例的预测遵循伪标签。他们的成功激发了许多变体,例如,curriculum learning[54,58]。

在这里插入图片描述

图1.利用无标注数据的现有方法的概念说明:(a)半监督学习-模型使用模型的预测本身为无标签数据产生伪标签[4,5,17,29,30,36,44,47,48,50,52],(b)自监督表示学习-模型被学习为无标签数据的两个增强视图生成相同的特征嵌入[3,6,8,10,20,20,22],(c)半监督学习与自监督表示学习——模型在学习所有网络的同时,学习一个带有自监督表示损失的特征表示[25,33,34]。

​ 另一方面,在争夺更好的半监督学习方法的同时[47,54,58],自监督表示学习取得了实质性进展,特别是**对比学习[3,6,8,10,20,22],旨在学习一种不需要任何监督的任务不确定特征表示,可以很好地转移到下游任务中**。形式上,它们鼓励从两张不同增强图像中提取的特征相互拉取,这为模型注入了一些不变性或鲁棒性。毫不奇怪,半监督学习框架肯定可以从自监督表示学习中受益[25,33,34],因为来自特征编码器的良好表示可以通过半监督学习产生更好的性能,因此,一些方法[25,33]试图结合上述两种范式,通过实现更好的特征编码器来提高性能。

​ 扩展现有的自监督表示学习[3,6,8,10,20,22]中提出的技术,只关注学习特征编码器,进一步考虑模型的预测本身,这将是有效结合两种范式的有效解决方案,这不仅可以增强特征编码器,还可以增强分类器。但是,相对于特征表示学习[3,6,8,10,20,22],应该通过考虑哪个方向在图像分类中既能达到不变性又能达到较高的准确率来定义模型两种不同增强预测的一致性。如果没有这一点,像[3,6,8,10,20,22]中那样简单地提取模型的预测可能会阻碍分类器的输出,从而降低准确性。

在这里插入图片描述

图2.ConMatch的网络结构。半监督学习框架建立在一致性损失和一个额外的强分支之上,以利用两个强分支之间的信心损失。在参数化方法中,置信度估计块以拼接的异构特征为输入,生成伪标签的估计置信度。

​ 在本文中,我们提出了一种新的半监督学习框架,称为ConMatch,它智能地利用了来自两个强增强图像的模型预测之间的置信度引导一致性正则化。基于传统框架[47,58],我们考虑两张强增强图像和一张弱增强图像,并定义来自两张强增强图像的模型预测之间的一致性,同时仍然使用来自其中一张强增强图像和弱增强图像的模型预测之间的无监督损失,如[47,58]中所做的那样。由于定义两个强增强图像之间一致性正则化的方向是最重要的,而不是以确定性的方式进行选择,我们提出了一种概率技术,通过测量来自每个强增强图像的伪标签的置信度,并用这个置信度加权一致性损失。为了测量伪标签的置信度,我们提出了两种方法,包括非参数方法和参数方法。通过这种信心引导的一致性正则化,我们的框架极大地提高了现有半监督学习器的性能[47,58]。此外,我们还提出了分阶段的训练方案,以促进训练的收敛。我们的框架是一个即插即用的模块,因此各种半监督学习模型[4,25,33,34,47,52,54,58]可以从我们的框架中受益。我们在表1中简要地总结了我们的方法与半监督学习中其他高度相关的工作。实验结果和消融研究表明,所提出的框架不仅提高了收敛性,而且在大多数标准基准上都达到了最先进的性能[12,28,37]。

表1.我们的ConMatch与其他具有一致性正则化形式并结合伪标记的相关工作的比较[5,25,33,34,47,54,58]

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/156715.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

P8630 [蓝桥杯 2015 国 B] 密文搜索

题目描述 福尔摩斯从 X 星收到一份资料,全部是小写字母组成。 他的助手提供了另一份资料:许多长度为 88 的密码列表。 福尔摩斯发现,这些密码是被打乱后隐藏在先前那份资料中的。 请你编写一个程序,从第一份资料中搜索可能隐藏密码…

八大排序算法(C语言实现)

文章目录:1.排序的概念2.常见八大排序算法3.插入排序3.1直接插入排序3.2希尔排序4.选择排序4.1直接选择排序4.2.堆排序5.交换排序5.1冒泡排序5.2快速排序5.2.1快排递归实现5.2.1.1Hoare法(霍尔法)5.2.1.2挖坑法5.2.1.3双指针法5.2.2快排迭代实…

最火的聊天回复神器

客服高效回复容易收获用户的好感,也更容易将客户转化成功,借助聊天回复神器,可以助力客服高效快捷地回复。 前言 经常网购的用户,一定会发现在联系客服咨询产品相关问题时,刚把问题发出去,马上就可以收到客…

three.js入门-一些基础理论|大帅老猿threejs特训

前言 参加了threejs直播课。 本篇文章为入门理论部分笔记。 可以学到什么: 一、软能力 1. 系统全流程理解web3D 应用/数字孪生/元宇宙,程序开发与3D美术资源制作 2. 建立与3D美术团队良好沟通协作能力 3. 良好把控3D画面效果和性能平衡 4. 培养程…

数据分析师:星图Stagraph 2.1 Crack

Stagraph 是一个用于数据导入 - 数据整理 - 数据可视化的复杂软件工具。面向数据工程师、数据分析师、数据科学家、统计学家和其他“数据专业人员”的专业软件。在简单易用的可视化界面中提供最新数据科学工具的强大功能。采集 by Ω578867473 降低 降低处理数据的复杂性。使用…

作业帮:探索多云架构下的数据库集群解决方案

导语:面对业务多元、数据海量、数据库种类多样、多云架构复杂等痛点,该如何制定既能解决问题又能降本增效的数据库升级方案?作业帮作为实践者,从四方面分享其数据库选型过程与思考。以下为作业帮DBA刘强在DTCC大会中的讲述。 嘉宾…

移动端自动化python使用appium包登录qq

听标题挺高大上的,其实内容还是脚本小子的高度。。。 为了写个月报一下午抓紧学点东西,好凑点字数,汗。。。 为啥学这个内容,因为找内容的时候翻csdn翻到一个自动抢红包的,就是用的这个技术,前面实验挺好&a…

React Native 三端同构在雪球的实践

随着移动互联网的迅猛发展,目前市面上「端」的形态多种多样,iOS、Android 、H5、微信小程序等各种端大行其道,同一个业务需求往往又需要在多端上去实现,针对不同端去编写多套代码的成本显然非常高。雪球大前端团队将今年在跨端能力…

提取DC综合report_constrain all violator中big neg slack

问题描述 在综合前几版中&#xff0c;通过report_constrain -all_violator命令到得到的违反数量非常多&#xff0c;但暂时只关注比较大的setup/hold违例。 &#xff08;1&#xff09;我们希望提取 < -1.0的违例 &#xff08;2&#xff09;需要把多行合并到一行。 &#xf…

学习python,我使用代码悄悄集齐了五福~哎嘿嘿

啊哈哈哈哈&#xff0c;我又又又来啦 这不是快春节了吗&#xff0c;支付宝等一些集五福活动又又又又一次的到来 今天呢&#xff0c;写一个啥呀我也不晓得&#xff0c;啊哈哈哈哈哈 今天写一个%90会出敬业福哦&#xff0c;啊哈哈哈哈 1.制作文字福 这个其实挺“简单”的&…

如何计算单元测试的覆盖率

一、概念 单元测试的覆盖率有&#xff1a;语句覆盖率&#xff08;即行覆盖率&#xff09;、分支覆盖率、条件覆盖率、分支条件覆盖率、路径覆盖率等。 语句覆盖率 所谓语句就是那些非分支、非判断的语句。 计算公式&#xff1a;程序执行到的语句总数 / 全部语句的总数 分支覆…

C语言程序设计易混、易错知识点(中篇)

注&#xff1a;个别题目未给ABCD&#xff0c;只需要了解知识点即可&#xff1b;另外排版可能有点乱&#xff0c;望知悉 在printf中的%作为转义符&#xff0c;两个%才相当于1个% free掉一个指针后&#xff0c;指针的值是不会自动置为NULL的&#xff0c;当然其指向的内存已经被释…

C语言从入门到放弃——字符串和内存操作函数

字符串&#xff0c;是一种由双引号引起的一整串字符&#xff0c;在C语言中&#xff0c;字符串是没有类型的&#xff0c;通常我们将字符串放在字符数组当中&#xff0c;同时&#xff0c;我们对于字符串的操作是很频繁的&#xff0c;因为对于字符串的操作频繁&#xff0c;所以C语…

为什么需要预选器?

无论是采用模拟IF处理的传统频谱仪&#xff0c;还是采用数字IF处理的现代频谱仪&#xff0c;都是扫频式架构&#xff0c;通过第一级本振(LO)的调谐实现射频的扫频测试。熟悉频谱仪架构的朋友都了解&#xff0c;在第一级混频器之前都会存在一个预选器&#xff0c;如图1所示&…

点成分享|器官芯片——小白鼠的拯救者?

在新药研发的漫长过程中&#xff0c;实验动物模型是药物从临床前试验阶段进入到临床试验阶段的金标准。实验动物模型有助于人们了解疾病的起源、病理生理特征、疾病机制、识别药物靶标、评估新药物的疗效和人体毒性以及进行药代动力学评价等。常用的实验动物模型包括小鼠、大鼠…

黑马学ElasticSearch(七)

目录&#xff1a; &#xff08;1&#xff09;RestClient查询文档-快速入门 &#xff08;2&#xff09;RestClient查询文档-match、term、range、bool查询 &#xff08;3&#xff09;RestClient查询文档-排序和分页 &#xff08;4&#xff09;RestClient查询文档-高亮显示 &…

git版本回退(git reset、git revert、git stash)

文章目录回退的两种情况1.已 commit&#xff0c;未push到远程仓库。git reset --soft &#xff08;撤销commit&#xff09;git commit --amend&#xff08;修改commit 提交的内容&#xff09;git reset --mixed&#xff08;撤销 commit 和 add 两个动作&#xff09;2.已 commit…

联合证券|左手消费,右手TMT!超270只股票新年获“买入”“推荐”

2023年开年A股商场交投继续火热&#xff0c;出资组织在活跃呼吁出资者布局的一起&#xff0c;自己又更加看好哪些标的和赛道&#xff1f; Wind数据显现&#xff0c;2023年头&#xff0c;券商关于大消费、TMT等方向装备价值更为喜爱&#xff0c;到1月10日&#xff0c;给予“买入…

LOAM、LEGO-LOAM与LIO-SAM的知识总结

文章目录LOAM、LEGO-LOAM与LIO-SAM的知识总结1.概要2.传感器信息读取3.数据的预处理4.激光雷达里程计4.1特征点提取4.2特征点关联匹配4.2.1 标签匹配4.2.2 两步LM优化4.2.3 LIO-SAM优化4.2.3.1 IMU预积分4.2.3.2 关键帧的引入4.2.3.3 因子图4.2.3.4 GPS因子4.2.3.5 回环因子5. …

代码随想录算法训练营第十五天字符串 java : 层序遍历 226.翻转二叉树 101. 对称二叉树

文章目录前言Leetcode 102 二叉树的层序遍历题目讲解Leetcode 226.翻转二叉树题目讲解Leetcode 101. 对称二叉树题目讲解递归法总结前言 递归三定律 确定参数和返回值确认终止条件确认单层递归的逻辑 Leetcode 102 二叉树的层序遍历 题目讲解 /*** Definition for a binar…