论文速读:基于概率教师学习的域自适应目标检测

news2024/12/24 2:39:21

原文标题:Learning Domain Adaptive Object Detection with Probabilistic Teacher

中文标题:基于概率教师学习的域自适应目标检测

代码地址: GitHub - hikvision-research/ProbabilisticTeacher: An official implementation of ICML 2022 paper "Learning Domain Adaptive Object Detection with Probabilistic Teacher"."

论文地址: https://arxiv.org/abs/2206.06293

1、摘要

无监督域自适应目标检测的自训练是一项具有挑战性的任务,其性能在很大程度上取决于伪标签框(pseudo boxes)的质量。 尽管取得了令人鼓舞的结果,但之前的工作在很大程度上忽略了自我训练过程中伪标签框的不确定性。 在本文中,作者提出了一个简单而有效的框架,称为概率教师(PT),旨在从逐渐发展的教师中捕捉未标记目标数据的不确定性,并以互利的方式指导学生的学习。 具体来说,作者建议利用不确定性指导的一致性训练来促进分类适应和定位适应,而不是通过精心设计的置信度阈值过滤伪框。此外,作者将锚点自适应与定位自适应并行进行,因为锚点可以看作是一个可学习的参数。与此框架一起,作者还提出了一种新的熵焦点损失(EFL),以进一步促进不确定性引导的自我训练。配备了EFL, PT比以前的所有基线都要好得多,达到了最新的水平。

2、研究背景

在目标检测任务中,卷积神经网络(CNN)在大规模高质量标注数据上表现卓越。然而,当模型部署到未见过的数据上时,比如不同的天气条件、光照变化或图像损坏等,模型性能会显著下降。为了解决这个问题,提出了无监督域自适应目标检测(UDA-OD)方法,目的是将预训练的模型从标记的源域迁移到未标记的目标域。

3、面临的问题

现有的自训练方法在UDA-OD中依赖于高质量的伪标签框(pseudo boxes),但这些方法很大程度上忽略了自训练过程中伪标签框的不确定性。此外,现有的方法依赖于精心设计的置信度阈值来过滤伪标签,这在没有标注的目标数据可用于阈值调整的情况下是不切实际的。

4、提出的办法

文章提出了一种名为“概率教师”(Probabilistic Teacher, PT)的框架,它通过捕获来自逐渐演变的老师模型的未标记目标数据的不确定性,并以互惠的方式指导学生模型的学习。PT框架不依赖于复杂的置信度阈值,而是利用不确定性引导的一致性训练来促进分类适应和定位适应。此外,文章还提出了一种新颖的熵焦点损失(Entropy Focal Loss, EFL),以进一步促进不确定性引导的自训练。

5、解决的问题

PT框架解决了在UDA-OD设置中,没有标注的目标数据可用于阈值调整的问题。它通过不确定性引导的方法,动态地处理自训练过程中的噪声伪标签,而不是简单地过滤掉它们。

6、取得的效果

PT框架在多个源基/无源UDA-OD基准测试中取得了新的最先进结果,并且与以前的基线相比有了显著的改进。特别是在“正常到雾天”的适应任务中,PT框架通过简单的自训练机制就实现了最先进的结果。

7、总结

文章通过提出概率教师(PT)框架和熵焦点损失(EFL),在无监督域自适应目标检测领域取得了突破性进展。PT框架通过不确定性引导的自训练,有效地处理了目标域中未标记数据的适应问题,提高了模型在不同域之间的泛化能力。

8、伪标签框具体生成过程

8.1、预训练阶段(Pretraining)

- 首先,使用标记的源域数据训练目标检测模型(例如 Faster R-CNN),以初始化检测器。

- 训练完成后,将训练得到的模型权重复制给教师模型(teacher model)和学生模型(student model)。

8.2、互学习阶段(Mutual Learning)

- 教师模型预测:使用教师模型对未标记的目标域数据进行预测,生成伪标签框。这些伪标签框包括类别和定位的概率分布。

- 不确定性表示:利用概率模型(如高斯分布)表示每个预测框的类别和位置,从而捕获预测的不确定性。

8.3、不确定性引导的一致性训练(Uncertainty-Guided Consistency Training)

- 类别和定位概率分布:教师模型为每个预测框生成类别概率分布和定位坐标的概率分布(例如,使用高斯分布表示)。

- 概率分布的锐化(Sharpening):对生成的类别和定位概率分布进行锐化处理,以指导学生模型的训练。锐化是通过调整概率分布的熵来实现的,使得模型更加自信。

8.4、熵焦点损失(Entropy Focal Loss, EFL)

- 熵的计算:对于每个预测框,计算其类别和定位的熵,以此作为不确定性的度量。

- 损失函数的设计:EFL利用这些熵信息来加权损失函数,使得模型更加关注那些不确定性较低(即预测更准确)的预测框。

8.5、教师模型的更新

- 指数移动平均(Exponential Moving Average, EMA):**学生模型学到的知识通过EMA的方式传递给教师模型,从而不断更新教师模型的权重。

8.6、锚点适应(Anchor Adaptation)

- 锚点作为可学习的参数:** 在训练过程中,自动调整锚点的形状以适应目标域中框的尺寸分布。

通过上述步骤,PT框架能够动态地生成和优化伪标签框,同时考虑到预测的不确定性,从而在没有标注的目标域上有效地训练目标检测模型。这种方法特别适用于无监督域自适应目标检测任务,其中没有标注的目标数据可用于调整置信度阈值。

9、什么是概率教师

“概率教师”(Probabilistic Teacher, PT)是文章中提出的一种用于无监督域自适应目标检测(UDA-OD)的框架。这个框架的核心思想是利用一个逐渐演化的教师模型来捕获未标记目标数据的不确定性,并通过不确定性引导的一致性训练来指导学生模型的学习。以下是PT框架的关键特点:

1. 双模型结构:PT框架包含两个模型,即教师模型和学生模型。教师模型用于生成未标记目标数据的伪标签,而学生模型则使用这些伪标签进行训练。

2. 不确定性的表示与利用:在PT中,预测的类别和定位信息都表示为概率分布(如高斯分布),从而能够捕获预测的不确定性。这些不确定性信息被用来引导模型的训练,使其更加关注那些预测较为确定的样本。

3. 不确定性引导的一致性训练:PT框架通过比较教师模型和学生模型的预测来训练学生模型,这种比较是基于不确定性的,目的是促进两个模型之间的知识传递。

4. 熵焦点损失(Entropy Focal Loss, EFL):为了进一步促进不确定性引导的自训练,PT设计了一种新的损失函数EFL。这个损失函数使用预测的熵来加权损失,鼓励模型更加关注那些不确定性较低的预测。

5. 无缝扩展到无源域自适应设置:PT框架可以无缝扩展到无需源数据的UDA-OD设置中,这在隐私敏感的应用场景中非常有用。

6. 锚点适应:PT框架还提出了一种锚点适应的方法,自动调整锚点的形状以适应目标域中框的尺寸分布,从而提高检测的准确性。

总的来说,概率教师(PT)通过模拟教师-学生之间的教学过程,利用概率模型来表示预测的不确定性,并设计了新颖的损失函数来提高无监督域自适应目标检测的性能。
 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2197949.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【计算机毕设】springboot-家具销售电商平台(附源码)

摘 要 Abstracts 目 录 第1章 绪论 1.1课题背景 1.2研究意义 1.3研究内容 第2章 技术介绍 2 2.1相关技术 3 2.2 Java技术 3 2.3 MySQL数据库 4 2.4 Tomcat介绍 4 2.5 Spring Boot框架 5 第3章 需求分析 5 3.1需求分析概述 6 3.2可行性分析 6 3.2.1经济可行性 6 3.2.2技…

Docker:快速部署

docker安装: ​‌​‬​⁠​‍‬​‍‬‬‌​‬‬‬​⁠​‍​​‌‬‌​​​​​​‌​​​​⁠​‍⁠‌安装Docker - 飞书云文档 (feishu.cn) docker命令解读 docker run -d \ > --name mysql \ > -p 33…

OpenHarmony(鸿蒙南向开发)——轻量系统内核(LiteOS-M)【异常调测】

往期知识点记录: 鸿蒙(HarmonyOS)应用层开发(北向)知识点汇总 鸿蒙(OpenHarmony)南向开发保姆级知识点汇总~ 持续更新中…… 基本概念 OpenHarmony LiteOS-M提供异常接管调测手段,…

【基础算法总结】字符串篇

目录 一,算法简介二,算法原理和代码实现14.最长公共前缀5.最长回文子串67.二进制求和43.字符串相乘 三,算法总结 一,算法简介 字符串 string 是一种数据结构,它一般和其他的算法结合在一起操作,比如和模拟&…

守护数据安全:.rmallox勒索病毒的防范与应对策略

导言 在当今这个数字化时代,网络空间已成为人们生活、工作和娱乐不可或缺的一部分。然而,随着互联网的普及和技术的飞速发展,网络安全问题也日益凸显,成为了一个全球性的挑战。其中,.rmallox勒索病毒作为一种恶意软件…

【linux】进程间的通信(一)

1. 了解进程通信 两个或者多个进程实现数据层面的交互 因为进程独立性的存在,导致进程通信成本较高(通信需要成本) 2. 进程间通信目的 进程间通信的本质是,让不同的进程看到同一份"资源"(即同一份内存空…

基础算法之前缀和--Java实现(下)--LeetCode题解:-和为 K 的子数组 - 和可被 K 整除的子数组 -连续数组-矩阵区域和

这里是Themberfue 和为 K 的子数组 题目解析 返回子数组中所有元素的和等于给定k的个数。 算法讲解 这题好像是用滑动窗口解决,但其实不能,因为 nums 中的元素可能存在负数,就不能保证其单调性的性质。 用前缀和求也不易想到,…

Java编码方式:Base64编码与解码

1、Base64 算法介绍 Base64 是一种基于 64 个可打印字符来表示二进制数据的表示方法。它主要用于在不支持二进制数据的场合(如电子邮件、URL、文件系统名等)传输二进制数据。严格来说 Base64 并不是一种加密/解密算法,而是一种编码方式。Bas…

数据挖掘学习笔记:朴素贝叶斯 | Python复现

数据挖掘学习笔记:朴素贝叶斯 机器学习系列(四):朴素贝叶斯(华强买瓜版) - yyxy的文章 - 知乎 十分钟,让你再也忘不掉贝叶斯分类 - VoidHaruhi的文章 - 知乎 《机器学习》(西瓜书&am…

快速生成单元测试

1. Squaretest插件 2. 依赖 <dependency><groupId>junit</groupId>

Spring异步线程池的问题

今天看一视频&#xff0c;提到说 Spring默认的异步线程池比较简单&#xff0c;每次执行异步任务&#xff0c;都会新建一个线程进行处理&#xff0c;不会重复利用&#xff0c;所以在用Spring框架开发的时候&#xff0c;需要自定义异步线程池。第一次听到这个说法。遂开始百度。 …

迷你世界表白神器爱心脚本lua

--迷你世界专用爱心表达公式 local a,angle,count,id30,0,0,math.random(668, 681) -- 根据需要调整θ的遍历范围和步长 while true do angle angle0.01 local ra*(math.sin(angle)*(math.sqrt(math.abs(math.cos(angle)))/(math.sin(angle)1.4)-2)2) if r>10…

动手学深度学习59 双向循环神经网络

1. 双向循环神经网络 视频&#xff1a;https://www.bilibili.com/video/BV12X4y1c71W/?p2&spm_id_frompageDriver&vd_sourceeb04c9a33e87ceba9c9a2e5f09752ef8 课件&#xff1a;https://courses.d2l.ai/zh-v2/assets/pdfs/part-3_7.pdf 课本&#xff1a; https://zh-…

机器学习K近邻算法——分类问题K近邻算法示例

针对“数据8.1”&#xff0c;讲解分类问题的K近邻算法&#xff0c;以V1&#xff08;转型情况&#xff09;为响应变量&#xff0c;以V2&#xff08;存款规模&#xff09;、V3&#xff08;EVA&#xff09;、V4&#xff08;中间业务收入&#xff09;、V5&#xff08;员工人数&…

【C++篇】继承之韵:解构编程奥义,领略面向对象的至高法则

文章目录 C 继承详解&#xff1a;初阶理解与实战应用前言第一章&#xff1a;继承的基本概念与定义1.1 继承的概念1.2 继承的定义 第二章&#xff1a;继承中的访问权限2.1 基类成员在派生类中的访问权限2.2 基类与派生类对象的赋值转换2.2.1 派生类对象赋值给基类对象2.2.2 基类…

多端同步的收银系统源码

随着经济的不断发展&#xff0c;很多门店越来越趋向连锁品牌化&#xff0c;收银系统自然也成为很多连锁门店必不可少的软件工具。希望通过一套软件可以帮助门店解决门店线下销售、会员管理、连锁多门店管理、线下线上一体化、商品库存管理等难题实现降本增效&#xff0c;为了方…

MySQL连接查询:联合查询

先看我的表结构 emp表 联合查询的关键字&#xff08;union all, union&#xff09; 联合查询 基本语法 select 字段列表 表A union all select 字段列表 表B 例子&#xff1a;将薪资低于5000的员工&#xff0c; 和 年龄大于50 岁的员工全部查询出来 第一种 select * fr…

大模型微调技术之 LoRA:开启高效微调新时代

一、LoRA 简介 LoRA&#xff0c;即低秩适应&#xff08;Low-Rank Adaptation&#xff09;&#xff0c;是一种用于微调大型语言模型的技术&#xff0c;旨在以较小的计算资源和数据量实现模型的快速适应特定任务或领域。 LoRA 方法通过引入低秩近似的思想&#xff0c;对大型预训…

NFS共享文件系统(将文件目录挂载到别的机器上)

我们创建的磁盘是否都必须挂载到本机上&#xff1f;并不是。在 Linux 和其他操作系统中&#xff0c;有一种叫做 NFS&#xff08;网络文件系统&#xff09;的工具&#xff0c;它允许跨网络共享文件系统资源。通过使用 NFS&#xff0c;我们可以将多个客户端服务器的数据目录挂载到…

Java中常见的等待唤醒机制及实践

JDK自带的等待唤醒机制 在Java中&#xff0c;有一个JDK维度的等待唤醒机制。Object类的wait和notify,notifyAll 需要在synchronized同步代码块内并且对象必须获取到锁才能调用。否则会抛IllegalMonitorStateException异常。 当线程在尝试获取锁时失败&#xff0c;会被封装成节…