Confidence Regularized Self-Training 阅读笔记

news2025/7/15 9:59:21

Confidence Regularized Self-Training

领域自适应研究的最新进展表明，深度自训练是实现无监督领域自适应的有效手段。这些方法通常涉及到一个迭代过程，即在目标域上进行预测，然后将自信的预测作为伪标签进行再训练。然而，由于伪标签可能是嘈杂的，自我训练可能会将过度自信的标签信念放在错误的类中，从而导致带有传播错误的偏离解决方案。为了解决这个问题，我们提出了一个自信正则化自我训练(CRST)框架，它被表述为正则化自我训练。我们的方法将伪标签视为通过交替优化共同优化的连续潜在变量。我们提出了两种置信度正则化:标签正则化(LR)和模型正则化(MR)。CRST-LR生成软伪标签，而CRST-MR促进网络输出的平滑性。大量的图像分类和语义分割实验表明，crst以最先进的性能优于非正则化的crst。这项工作的代码和模型可在https://github.com/yzou2/CRST上获得。

在这里插入图片描述
简单来说就是相比于传统自训练中引入了两种正则化的方法。

0、传统自训练的步骤

主要有两步，第一步是获得伪标签，第二步是训练模型，两步交替进行。

在这里插入图片描述

1、label侧的正则化

传统获得伪标签的方式如下：
在这里插入图片描述
白话来说就是如果模型预测类别为c的概率最大，且这个概率大于我们设置的阈值（比如0.6），那么我们就选择这个样本的伪标签为c

但是这样存在的问题是，模型可能过度自信的选择了错误的选项，这种过度自信的选择会影响后续的学习，造成和真实分布情况的偏差。

因此作者考虑使用一种标签正则化的方式做个软化。

在这里插入图片描述
只要计算的一个损失函数比类别0（未识别/识别置信度太低）的下，就选择这个标签，标签也并未是01离散值，而是对应预测的概率值。

这个损失函数计算如下
在这里插入图片描述
同时，我们也需要调整一下我们在训练伪标签时的损失函数

在这里插入图片描述

2、mdel正则化

第一步获得伪标签和之前完全一样，在第二步训练模型的时候在loss中增加正则项。
在这里插入图片描述
对于 $r_c(p)$ 的定义，可见下表，作者将label正则称作LRENT，将model正则称作MRKLD

在这里插入图片描述

3、实现

作者在github上公布了他们的代码，后续补充

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/741552.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

泛微打造国资委国企双端的监管平台，数据互联，动态管理

泛微打造国资委国企双端的监管平台，数据互联，动态管理

数字政府和数字监管成为趋势。数字化方式能够助力完善国有资产管理体制，促进国有资产保值增值，推动国有资本做强做优做大，有效防止国有资产流失。国资监管过程中存在着诸多挑战监管企业众多，需要建立不同的管理模式。既要发挥…

阅读更多...

C/C++库函数之——str类和mem篇（常用速学）

C/C++库函数之——str类和mem篇（常用速学）

目录一，str类 1）strlen 2）strcpy 3）strcmp 4）strcat 5）strstr 二，mem类函数 1）memcpy 2）memmove 一，str类 1）strlen 用途&#xff1a…

阅读更多...

光伏5G多合一融合终端|光伏多合一融合终端|光伏多合一群调群控网关|分布式光伏群控群调|光伏AGC/AVC系统这几者之间什么技术关系，多少钱一套预算？

光伏5G多合一融合终端|光伏多合一融合终端|光伏多合一群调群控网关|分布式光伏群控群调|光伏AGC/AVC系统这几者之间什么技术关系，多少钱一套预算？

光伏5G多合一融合终端|光伏多合一融合终端|光伏多合一群调群控网关|分布式光伏群控群调|光伏AGC/AVC系统这几者之间什么技术关系，多少钱一套预算？ 一：光伏5G多合一融合终端的功能光伏5G多合一融合终端的功能：群调群控/AGC/AVC功…

阅读更多...

[MMDetection]生成测试集预测的test.bbox.json文件

[MMDetection]生成测试集预测的test.bbox.json文件

基于MMdetection3.10 困扰了大半天的问题，终于解决了。方法1：定位到configs\_base_\datasets\coco_detection.py 将里面的路径全部换为自己的路径，最重要的是将以下注释取消掉，特别注意以下两个参数改好的文件示例 # datase…

阅读更多...

数据结构 - 线性表（C语言版）

数据结构 - 线性表（C语言版）

线性表分为顺序表和单链表线性表的操作主要是查询、插入、删除 1、顺序表首先，定义一个顺序表的结构体 #define MAX_SIZE 10 typedef struct {int data[MAX_SIZE];int length; }SqList, * PsqList;创建一个线性表 void createSqList(PsqList pSqList) {pSqLis…

阅读更多...

Spring—事务及事务的传播机制

Spring—事务及事务的传播机制

Spring—事务及事务的传播机制 🔎事务的定义🔎Spring—事务的实现铺垫Spring 编程式事务Spring 声明式事务Transactional 的参数注意事项Transactional 的工作原理 🔎Spring—事务的隔离级别MySQL—事务的隔离级别Spring—事务的隔离级别Spri…

阅读更多...

剑指 Offer 04. 二维数组中的查找(java)

剑指 Offer 04. 二维数组中的查找(java)

二维数组中的查找剑指 Offer 04. 二维数组中的查找题目描述抽象 BST 解题二叉树专题剑指 Offer 04. 二维数组中的查找来源：力扣（LeetCode） 链接：https://leetcode.cn/problems/er-wei-shu-zu-zhong-de-cha-zhao-lcof 题目描述…

阅读更多...

js为啥是设计成单线程而不是多线程呢

js为啥是设计成单线程而不是多线程呢

了解这个问题之前，需要先了解一下以下问题： 什么是进程？什么是线程？二者有啥关联？任务队列是什么？宏任务？微任务？eventloop？为什么说js是单线程，为什么要设计…

阅读更多...

UWB高精度定位标签方案，厘米级室内测距，实时人员物品位置确定

UWB高精度定位标签方案，厘米级室内测距，实时人员物品位置确定

随着科技的不断进步，UWB技术正逐渐成为各个领域的定位解决方案的首选。其高精度、安全、实时的特性使其在安全免提访问控制、实时室内定位等应用领域发挥着重要的作用。安全免提访问控制是目前应用UWB技术的重要领域之一。通过将UWB标签（如手机、钥匙扣…

阅读更多...

Django如何删除数据库表中的数据【不断积累】

Django如何删除数据库表中的数据【不断积累】

这篇博客积累Django的数据库常用删除方法。假设有表模型Author定义如下： class Author(models.Model):name models.CharField(max_length100)def __str__(self):return self.name01-根据记录的id号来删除指定的记录 Django 默认为每个模型添加一个名为 id 的自…

阅读更多...

RPA赋能日化产业，实在智能广东日化共推行业数字化转型

RPA赋能日化产业，实在智能广东日化共推行业数字化转型

广东日化，因其独特的地域、产能优势，成为广东制造业的支柱产业之一，占据了全国日化行业的半壁江山。作为本土最具影响力商会组织之一，广东省日化商会凝聚了一批具有影响力的日化企业，其经济总量、市场占有率、品牌知名…

阅读更多...

python网站创建：初识网站（001）

python网站创建：初识网站（001）

1. 初识网站：首先来认识一下，前端、后端、数据库它是怎么分工合作来形成网站的使用python创建网站之前，需要先稍微认识一下两个最流行python web框架：(Flask)和(Django) Flask是一个轻量级的框架，适用于比较轻巧&…

阅读更多...

【*1900倍数遍历】CF1627 D

【*1900倍数遍历】CF1627 D

Problem - D - Codeforces 题意： 思路： 在枚举数列子集的gcd时，通常可以枚举倍数对于这道题要注意，j/i的gcd要为1，这样才能保证i是这个子集的最大公约数 Code： #include <bits/stdc.h>//#define…

阅读更多...

三菱FX3U简单工程编程

三菱FX3U简单工程编程

1.简单工程编程 1.1.元件常开触点（ld） 选中位置，点击图标，输入软元件，完成添加。选中位置，快捷键F5添加。选中位置，输入ld 软元件添加。常闭触点（ldi）横线、竖线 …

阅读更多...

红黑树增删操作详解（相信我，这次你一定会弄懂）

红黑树增删操作详解（相信我，这次你一定会弄懂）

前言： 网上众多关于红黑树的讲解，但大多数都是重复的，只列出了几种简单情况，逻辑和思维深度都不足以解答吾之困惑。。。直到看到张彦峰先生的对红黑树的认识总结，基本可以说是集大成者，本文会基于…

阅读更多...

MySQL原理探索——28 读写分离有哪些坑

MySQL原理探索——28 读写分离有哪些坑

在上一篇文章中，介绍了一主多从的结构以及切换流程。今天我们就继续聊聊一主多从架构的应用场景：读写分离，以及怎么处理主备延迟导致的读写分离问题。我们在上一篇文章中提到的一主多从的结构，其实就是读写分离的基本结构了。这里…

阅读更多...

linux环境下使用jmeter进行分布式测试

linux环境下使用jmeter进行分布式测试

目录 1、前言 2、环境准备 3、分布式配置总结： 1、前言熟练使用jmeter进行性能测试的工程师都知道，jmeter的客户端性能是有点差的。这会导致一个问题，其客户端的性能损耗会干扰到性能测试的结果，而且当线程数/并发大到一定程…

阅读更多...

我爱学QT-仿写智能家居界面上中下

我爱学QT-仿写智能家居界面上中下

学习链接： 仿写一个智能家居界面（上）_哔哩哔哩_bilibili 上给QT工程添加资源文件在这里然后选这个，choose后会有起名，之一千万不能是中文，要不就等报错吧然后把你要添加的图片托到文件夹下&#xf…

阅读更多...

FPGA好找工作吗？薪资待遇怎么样？

FPGA好找工作吗？薪资待遇怎么样？

FPGA：即现场可编程门阵列，它是在PAL、GAL、CPLD等可编程器件的基础上进一步发展的产物。它是作为专用集成电路(ASIC)领域中的一种半定制电路而出现的，既解决了定制电路的不足，又克服了原有可编程器件门电路数有限的缺点。 FPGA太…

阅读更多...

Codeforces round 883 div3

Codeforces round 883 div3

A. Rudolph and Cut the RopeA. Rudolph and Cut the Rope 题目大意有 n 个钉子钉在墙上，第 i 个钉子被钉在离地面 ai 米高的位置，一根长度为 bi 米的绳子的一端被绑在它上面。所有钉子都悬挂在不同的高度上。糖果同时被绑在所有绳子的末端&#xff0…

阅读更多...

推荐文章

最新文章