无监督域适应 (UDA)(3)

news2024/12/23 4:38:49

本帖介绍基于 bi-classifier adversarial learning 的改进。

一、动机

模型训练在两个步骤之间交替进行:(I)约束两个分类器的学习,以最大化未标记目标域数据的预测差异;(II)约束特征提取器的学习,以最小化这种差异。

尽管这种方法是一种优雅的表述,但它有一个基本的限制:最大化和最小化分类器差异对目标域来说不是类判别的,最终会导致次优的适应模型。

为了解决这一问题,一种新的类判别对抗学习(Class Discriminative Adversarial Learning, CDAL)方法,其特征是发现类判别知识并利用这些知识对分类器差异约束进行判别调节。这是通过引入一个评价标准来判断每个分类器的能力和每个目标域样本的特征重定向,通过客观损失重表述来实现的。

二、基本思想

2.1 基本思想

具体而言,如图1(a)所示,脱离源分布支持的目标样本可以归纳为两种类型:两种分类器预测标签一致的Easy样本;两个分类器预测标签不一致的模糊(硬)样本,至少被一个分类器错误分类。

我们观察到,传统的双分类器对抗学习方法两个分类器的预测不一致,往往会产生更多的模糊样本。此外,在优化特征提取器时,为了使预测误差最小化,可能会将模糊的目标样本匹配到错误的类中。

为了解决这一问题,一种新的CDAL框架,该框架以经验感知分类器干扰(ECI)策略为特征,用于更具判别性的分类器优化。该方法可以逐步剔除模糊的目标样本,从而获得更好的区域对准效果。

具体地说,我们用ECI评估了两个分类器对每个样本识别能力,迫使分类器做出更好的预测。我们最大化与其他分类器的预测差异,在源分布的支持下找到目标样本;与此同时,另一个分类器通过最小化预测差异来进行优化,以便它可以被纠正并与性能更好的分类器对齐,以获得更一致和准确的预测。因此,这两个分类器逐步提高了它们的判别能力,从而减少了模糊样本。

在更新生成器阶段,为了进一步抑制模糊目标样本,我们设计了一种互补表示正则化来增强条件分布对齐特征提取器的学习能力。

2.2 算法步骤

2.1.1 给目标样本做伪标记。

伪标注是基于聚类的。为了实时获取源域各类别的聚类中心,构造了一个内存来保存部分源特征。在训练开始时,我们扫描源域,随机选择每个类别的m 个源样本特征并将其存储在内存中。由于源域数据被标记,任何源样本都可以被模型快速拟合,并且它们的特征具有很强的判别性。为了保证特征的实时性,在每次迭代中,根据先进先出的原则,将每个类别的原始存储特征替换为当前批处理中的源特征进行更新。

然后,利用内存中存储的特征(K-means聚类算法的初始聚类中心)计算源聚类中心。每个时期开始时的具体步骤如下。

(1)每个源聚类中心由内存中标记的源样本近似计算为,其中是相对于内存中第k 个类别的第i 个样本特征。

(2)采用K-means聚类算法对目标样本进行聚类。用源聚类中心初始化

(3)每个目标样本计算其到每个聚类中心的距离(采用余弦距离函数),得到一个伪标签,即:

(4)根据目标域的当前伪标签更新聚类中心,即

其中

重复上述过程(3)和(4),直到算法收敛。经过这一步,所有的目标域样本都可以得到它们的伪标签。 

2.1.2专家感知分类器干扰(ECI)。

ECI策略旨在改进传统双分类器对抗学习方法的第二步。在此步骤中,在固定特征提取器的同时,对两个分类器进行优化。如前所述,传统方法使预测误差最大化,使预测不一致,产生更模糊的目标样本。ECI就是为解决这个问题而设计的。

具体来说,ECI首先需要知道哪些目标样本可以用h 1或h 2更好地分类。第一步是将目标样本分成两个子集分别对应于h1 和ℎ2 。在每次迭代中,给定一批目标样本,它们的两个分类器的预测分别为}和。由于目标域没有标签信息,因此使用伪标签来近似当前的标签信息。Kullback-Leibler (KL)散度(或者是熵等别的方式)用于计算每个样本的分类预测结果与聚类结果之间的相似度。如果KL散度较小,则表示分类预测接近伪标签。所以对于一个特定的目标样本,如果一个分类器对应的KL散度更小,在不失去一般性的情况下,我们可以认为这个分类器在这个样本上表现得更好。基于这一点,目标样本分成两部分:

其中 和分表表示分类器h1和h2那些分的更好的样本集合。

传统的双分类器对抗学习方法是通过最大化预测差异来寻找偏离源分布的目标域样本,而ECI策略则进一步尽可能地减少了模糊样本。

为了同时实现以上两种优化,体现了使用ECI策略对样本进行划分的重要性。具体来说,对于分类h1 在集合B1上的表现优于h2,因此,进一步要求最大化与h2的预测差值,以检测被源域排除的目标样本;由于h1 在集合B2上的表现差于h2,可能会产生不正确的预测结果,因此需要最小化预测差异来修正其预测。ℎ1的损失函数如下:

 同理,h2 的损失函数如下:

 此外,还需要更新在源域中的分类器。综合以上目标函数,ECI策略的总体损失为:

 2.1.3 特征对齐。

传统的双分类器对抗学习方法通常试图最小化目标样本的预测差异,以优化特征提取器g,同时跨域对齐特征。虽然容易的目标样本通常对齐到正确的类别,但这种策略在处理模糊的目标样本时是无效的,这些目标样本可能被错误分类的分类器检测到,并执行不准确的分类分布对齐。

为了解决这个问题,进一步对两个域之间的条件分布对齐施加了表示正则化。形式上,它迫使目标样本的特征接近源分布,即从模糊区域推开。这个正则化的设计如下:

 

 其中为最新计算的第k类的聚类中心,

 为高斯核函数。通过鼓励伪标签和真标签之间的语义对应,对齐源域和目标域的每一类的聚类中心。

将传统的对齐约束与提出的正则化相结合,我们的特征对其目标函数为:

 

2.3 训练步骤

 

在第一步中,模型(包括特征提取器和两个分类器)通过标记的源样本进行训练。

(a)在第二步中,固定特征提取器,同时通过提出的专业知识感知分类器干扰(ECI)策略更新两个分类器。注意,源域上的监督训练监督被用于保持分类能力。

(b)在第三步中,通过最小化两个固定分类器之间的差异来优化特征提取器。特征对齐也可以跨域应用。

三、参考文献:

[1] Zhou L, Ye M, Zhu X, et al. Class Discriminative Adversarial Learning for Unsupervised Domain Adaptation[C]//Proceedings of the 30th ACM International Conference on Multimedia. 2022: 4318-4326.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/516341.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Call for Papers丨第一届LLM@IJCAI‘23 Symposium,大会主席陈雷、杨强、唐杰

大规模语言模型(LLMs),如ChatGPT和GPT-4,以其在自然语言理解和生成方面的卓越能力,彻底改变了人工智能领域。 LLMs广泛用于各种应用,如语音助手、推荐系统、内容生成模型(如ChatGPT&#xff09…

开源进展 |WeBASE更新啦,快来了解新特性!

WeBASE(WeBank Blockchain Application Software Extension) 是在区块链应用和FISCO BCOS底层之间搭建的一套通用组件,围绕交易、合约、密钥管理、数据、可视化管理来设计各个模块,屏蔽了区块链底层的复杂度,从而极大降…

多模态GPT:国内发布一款可以在线使用的多模态聊天机器人!快来把玩~

论文: MultiModal-GPT: A Vision and Language Model for Dialogue with Humans代码: https://github.com/open-mmlab/Multimodal-GPT (包含代码、数据、demo)作者:OpenMMLab 深度学习自然语言处理 原创作者: 林哲乐 使用视觉和语言指令训练一…

Linux基础学习---3、时间日期类、用户管理命令、用户组管理命令

1、时间日期类 1、基本语法date [Option] ...[Format]2、选项说明 选项功能-d<时间字符串>显示指定的“时间字符串”表示的时间&#xff0c;而非当前时间-s<日期时间>设置日期时间 3、参数说明 参数功能<日期时间格式>指定显示时使用的日期时间格式 1.1…

一、数据库设计

整个项目的设计包括5个数据库&#xff1a; glkt_activity:优惠券的相关设计 glkt_order:订单的相关设计 glkt_user:得到微信授权的账号信息的相关设计 glkt_vod:课程信息的相关设计 glkt_wechat:微信公众号的相关设计 glkt_activity&#xff1a; coupon_info:优惠券的信息 cou…

java+iClient Openlayers实现土壤墒情旱情灾害模拟预报预警分析

应用及软件实现效果图&#xff1a; 一、应用背景 作为一个农村长大的人&#xff0c;我非常关注自然灾害和气候变化对土地旱情墒情影响。近年来&#xff0c;干旱和洪涝灾害在很多地方频繁发生&#xff0c;给人们的生命财产安全带来了极大的威胁。因此&#xff0c;旱情和墒情模拟…

在计算语义相似度中,我看网上说要加range,我不知道往哪里加?

点击上方“Python爬虫与数据挖掘”&#xff0c;进行关注 回复“书籍”即可获赠Python从入门到进阶共10本电子书 今 日 鸡 汤 行宫见月伤心色&#xff0c;夜雨闻铃肠断声。 大家好&#xff0c;我是皮皮。 一、前言 前几天在Python白银交流群【王王雪饼】问了一个Python处理语义相…

Python学习历程-元组的基本操作回顾

在学习元组之前&#xff0c;我们先再回过头看看之前写过的文章&#xff0c;看看列表的一些基本操作&#xff1a; Python中的列表介绍 记录我的Python学习历程-列表的基本操作&#xff0c; 接下来再快速回顾一下元组的一些重点&#xff1a; 列表属于可变序列&#xff0c;元组、字…

Powerlink协议使用极简入门教程

网上关于powerlink协议的知识太少&#xff0c;而且都太分散太零碎&#xff0c;容易让人一头扎进去摸不着头绪。新手看到demo源码可能都不知道有什么用途&#xff0c;怎么能联动的跑起来看到效果&#xff0c;有种无从下手的感觉。其实Powerlink协议的使用挺简单&#xff0c;特别…

STM32F4_光敏传感器

目录 1. 什么是光敏传感器、光敏电阻 2. 硬件分析 3. 实验程序 3.1 main.c 3.2 ADC3.c 3.3 ADC3.h 3.4 Lightsensor.c 3.5 Lightsensor.h 1. 什么是光敏传感器、光敏电阻 光敏传感器也称为光电传感器。是利用光电器件把光信号转换成电信号的一种传感器。它的敏感波长在…

opencv实践项目-多张图片拼接之stitcher

目录 1.简介2. 拼接算法流程3. 代码演示 1.简介 OpenCV从2.4.x版本之后多出来一个新的模型 图像拼接&#xff0c;该模块通过简单的高级API设置&#xff0c;可以获得比较好的图像拼接效果&#xff0c;OpenCV官方提供了一个高度集成的API函数 Stitcher&#xff0c;只要两行代码就…

SRE/DevOps不得不懂的:Prometheus的配置工程化!

原创不易&#xff0c;还请关注和转发&#xff5e;谢谢 背景 Prometheus有两个最基本的组件&#xff1a;一个是Prometheus程序&#xff0c;一个是Alertmanager程序。 它们的职责分工很明确&#xff1a; • Prometheus程序负责&#xff1a;定时拉取监控指标数据、存储指标数据、根…

谈谈IOC容器和AOP编程

Java发展的路途中&#xff0c;由刚开始的使用new创建对象&#xff0c;到使用抽象类&#xff0c;接口进行解耦&#xff0c;又到了提问时刻&#xff0c;什么是耦合度&#xff1f; 对于这个对象的关联和依赖关系&#xff0c;例如&#xff1a; 当一个对象要使用&#xff0c;但是&…

4.6k Star,SpringBoot+Vue+App+硬件实现的智能家居系统,一套带走

今天&#xff0c;推荐一个智能家居系统项目。这是我目前见过的最好的智能家居系统项目&#xff0c;功能完整&#xff0c;代码结构清晰。值得推荐。 4.6k Star&#xff0c;SpringBootVueApp硬件实现的智能家居系统&#xff0c;一套带走 简介 FastBee是一个简单易用的物联网平…

Cocos Shader实现HSL和RGB颜色模型

HSL和RGB是两种常见的颜色模型&#xff0c;被广泛应用于计算机图形学、数字图像处理、Web设计等领域。在进行颜色处理时&#xff0c;经常需要将HSL和RGB相互转换&#xff0c;本demo演示如何通过Cocos Creator 3.7游戏引擎&#xff0c;用HSL模型来调节图片颜色&#xff0c;并详细…

徐培:以数据智能技术助力制造型企业降本增效

导语 2023年4月7日&#xff0c;由中国DBA联盟&#xff08;ACDU&#xff09;和墨天轮社区联合主办的第十二届『数据技术嘉年华』(DTC 2023) 在北京新云南皇冠假日酒店盛大开启。次日&#xff0c;云和恩墨数据智能产品部总经理徐培博士在“智胜未来&#xff1a;数据技术创新应用”…

二、讲师管理接口开发总结

首先本项目将实体类单独放在model包中&#xff0c;方便后期集体的调用&#xff1a; 整个项目的建包结构都是在java包中建立com.lxl.ggkt包&#xff0c;方便后期包路径的扫描。 上述有三个包&#xff1a; enums包规定了一些状态规定&#xff0c;比如优惠券是否使用&#xff0c…

CVE-2017-7921漏洞复现

文章目录 漏洞描述 漏洞描述 0x01 CVE-2017-7921漏洞复现 许多HikvisionIP摄像机包含一个后门&#xff0c;允许未经身份验证的模拟任何配置的用户帐户。 0x02 漏洞复现&#xff1a; 利用工具发现漏洞&#xff08;CVE-2017-7921&#xff09;&#xff1a; 利用路径&#xff…

“数字裂变”宇宙,华为云与和伙伴组成“银河护卫队”

最近&#xff0c;《银河护卫队3》正在上映&#xff0c;取得了豆瓣高分和全网好评。很多朋友走出电影院都感叹&#xff0c;真想有像银河护卫队一样的朋友和伙伴。 “伙伴”这个词&#xff0c;不仅是超级英雄电影的内核&#xff0c;更是云计算产业的“新贵”。关注云产业的朋友可…

Go项目组织:在单一repo中管理多个Go module指南

0. 单repo单module管理回顾 众所周知&#xff0c;Go在1.11版本中引入了go module[1]&#xff0c;随着近几年Go module机制的逐渐成熟&#xff0c;它已经被Go团队确定为Go标准的依赖管理与构建方案&#xff0c;原先的GOPATH mode已经被彻底废弃。 在Go module模式下&#xff0c;…