AAAI 2023 | 小鹏汽车纽约石溪:在末层激活上作对抗训练的域自适应

news2025/2/26 19:18:08

原文链接:https://www.techbeat.net/article-info?id=4602
作者:吕骋

增强未标记目标域数据的模型预测置信度是无监督域自适应(UDA) 的一个重要目标。在本文中,作者探讨了末层激活(即最后一层线性分类层输入特征)的对抗训练。文章表明,与先前工作中使用的对输入图像或中间特征作对抗训练相比,该策略更有效,并且与提高预测置信度的目标相关性更强。此外,当模型存在激活归一化时,作者提出了两个方法变种,并系统地分析了归一化对方法中对抗训练的影响。这在理论上和实际域自适应任务的实验中都得到了印证。作者考虑了标准设置和无源域数据设置,在常用的UDA数据集上进行了广泛的实验,验证了文中方法的有效性。
在这里插入图片描述

论文题目:
Domain Adaptation with Adversarial Training on Penultimate Activations
论文链接:
https://arxiv.org/pdf/2208.12853.pdf
代码链接:
https://github.com/tsun/APA

在域自适应中,虚拟对抗训练(VAT)常被引入以提高模型的局部平滑性,其主要思想是迫使模型在原始的和受扰动的图像上得到相近的预测结果。尽管如此,VAT通常只用作一个辅助损失函数,单独使用VAT无法获得理想的性能。同时,VAT为了获取梯度方向需要对整个网络进行一次额外的反向传播,这增加了计算成本。

这些观察启发了作者寻求更有效的对抗训练方式用于解决UDA问题。在UDA中,训练过程常被划分为源域训练和目标域适应两个阶段。作者发现,由于两个域相关,在第二阶段线性分类层变化缓慢。因为主要目标是增强未标记目标域数据的模型预测置信度,作者提出在末层激活上作对抗训练,这相比于在其他层作对抗训练与上述目标关联更强。针对UDA中经常对激活做L2归一化以减少域间隔,作者提出了两个方法变种,并系统分析了归一化对方法中对抗训练的影响,探讨了对抗损失函数相应梯度的“收缩效应”。文中还分析了对抗扰动、激活相应梯度和实际激活变化量三者在域适应任务中的相关性。

本文的贡献包括:

1. 提出了一个基于末层激活作对抗训练的UDA框架;
2. 系统地分析了它与先前在输入图像或中间特征上作对抗性训练的关联和优势;
3. 通过广泛实验验证了文中方法在标准设置和无源数据设置下的优越性能。

一、 本文方法

1.1 背景工作

虚拟对抗学习(VAT)在未标记数据上作对抗训练,常用于增强半监督学习中模型局部光滑性,其目标是:
在这里插入图片描述
其中 D [ ⋅ , ⋅ ] D[\cdot,\cdot] D[,] 是Kullback-Leibler散度。令上划线表示L2归一化,则 r ( v ) r^{(v)} r(v) 可通过下式近似得到:
在这里插入图片描述
这里的扰动是“虚拟”对抗的,因为它不是通过真实标签得到的。

1.2 在末层激活上进行对抗训练

两阶段训练流程:与之前的工作一致,文中将训练过程分为源域训练阶段和目标域适应阶段。在第一阶段,模型仅在源域数据上利用标准交叉熵进行训练;在第二阶段,使用目标域数据(以及可用的源域数据)将获得的源域模型适配到目标域。本文工作旨在第二阶段利用对抗训练增强未标记目标域样本的预测置信度。
在这里插入图片描述
图1: 本文方法框架。 APA u \text{APA}^u APAu APA n \text{APA}^n APAn 分别对归一化前和归一化后的激活作对抗训练。

方法动机:由于分类器先用源域数据作初始化,且目标域和源域相关,作者首先探讨了域适应阶段分类器权重的变化情况。图2绘制了Office Home 12项任务上分类器初始权重 W ( 0 ) W^{(0)} W(0) 和训练过程中权重 W W W 之间的平均余弦相似度。这表明权重变化相当缓慢。因此,在较短训练周期内忽略决策边界变化是合理的。有一些工作在域适应过程中冻结了分类器,作者没有选择这么做,但发现冻结分类器对性能影响不大(参见表7)。

为了提高未标记目标域数据的预测置信度,一种自然的方法是将其末层激活从决策边界移开,这可以通过对抗训练实现。对输入图像或中间特征作对抗训练也可以间接地更新末层激活,但其有效性会降低,文中在方法分析部分对此进行了详细讨论。
在这里插入图片描述
图2: 在(左)标准设置和(右)无源域数据设置下,Office Home 12项任务上初始分类器权重 W ( 0 ) W^{(0)} W(0) 和训练过程中权重 W W W 之间的平均余弦相似度。

方法细节:作者对末层激活作对抗训练,以提高域适应阶段目标域数据的预测置信度,目标函数是:
在这里插入图片描述
该方法可以很容易地扩展到无源域数据设置。由于源域样本在域适应阶段无法获得,作者使用置信的目标域样本伪标签作为额外的监督项,其目标函数变成:
在这里插入图片描述
存在激活归一化时的方法变种:在末层激活上使用L2归一化是一种常用的减少域间隔的技巧。如图1所示,文中方法相应地存在两种变体, APA u \text{APA}^u APAu APA n \text{APA}^n APAn ,分别对应着对归一化之前和归一化之后的激活作对抗训练。

APF u \text{APF}^u APFu 的对抗损失函数是:
在这里插入图片描述
APF n \text{APF}^n APFn 的对抗损失函数是:
在这里插入图片描述
对于后者,作者额外做了一步“扰动投影”,以确保 f ( x ) ‾ + r ( p n ) \overline{f({x})}+{r}^{\left(p_{n}\right)} f(x)+r(pn) 位于单位球上:
在这里插入图片描述

二、方法分析

2.1 相对于在输入图像或中间特征作对抗训练的优势

不失一般性,将特征抽取网络 f f f 分解为 f = f b ⋅ f a f=f_b \cdot f_a f=fbfa,其中任一部分都可以是一个恒等映射。对 f a f_a fa 的输出施加对抗扰动 r ( i ) r^{(i)} r(i) ,相应的对抗损失函数为:
在这里插入图片描述
将扰动 r ( i ) r^{(i)} r(i) 通过 r ( i → p ) = f b ( f a ( x ) + r ( i ) ) − f ( x ) {r}^{(i \rightarrow p)}=f_{b}\left(f_{a}({x})+{r}^{(i)}\right)-f({x}) r(ip)=fb(fa(x)+r(i))f(x) 映射到末层激活,相应的对抗损失函数为:
在这里插入图片描述
比较上述两式,损失函数值是一致的。然而计算图不同导致反向传播是不同的。图3显示,使用映射之后的损失函数训练可以显著提高模型精度。
在这里插入图片描述
图3:(上)将不同强度的输入图像扰动映射到末层激活;(下)将不同的中间层扰动映射到末层激活。

2.2 APA方法的解释

APA对末层激活作对抗训练,以提高模型预测置信度。直觉上,这个过程会将样本 x x x 的激活 f ( x ) f(x) f(x) 移至远离决策边界。图 4 左图示意性描绘了 对抗扰动 r ( p ) {r}^{(p)} r(p) ,激活对应梯度 ∇ ( p ) {\nabla}^{(p)} (p) 和梯度更新前后激活实际变化量 δ ( p ) {\delta}^{(p)} δ(p) 的相对关系, 右图描绘了实际 UDA 任务训练过程中三个量的平均余弦相似度。实际变化量 δ {\delta} δ 和扰动 r {r} r 负相关, 而 r {r} r 出于构造指向决策边界, 可以看出 APA 实质上将样本推离决策边界, 从而提高置信度。
在这里插入图片描述
图4:(左)对抗扰动、激活梯度和实际激活变化量图示;(右)在两个UDA任务训练过程中,三个量的平均余弦相似度。

2.3 激活归一化条件下的“收缩效应”

图 5 比较了Office Home 上不同 APA 变体, 其中 APA n → u \text{APA}^{n \rightarrow u} APAnu 表示在 APA u \text{APA}^{u} APAu 中使用扰动 r ( P n → u ) , APA u → n {r}^{\left(P_{n \rightarrow u}\right),} \text{APA}^{u \rightarrow {n}} r(Pnu),APAun 含义类似。如图所示, 对归一化后的激活 作扰动最后性能稍好。图 6 显示, 随着扰动大小 ε \varepsilon ε 增加, 对归一化前的 激活作扰动其精度因为梯度 “收缩效应” 下降, 这可以通过放大对抗
在这里插入图片描述
图5: Office Home上的APA变体的比较。
在这里插入图片描述
图6:扰动大小 \varepsilonε 对 Office-Home 的影响。(*) 经过损失函数放大补偿。

三、实验

作者使用Office-Home, VisDA-2017,DomainNet等常用UDA数据集,对比标准UDA方法、针对标记分布不一致场景的域适应方法以及无源域数据的域适应方法。文中还对比了熵最小化、互信息最大化(MI)、VAT和FixMatch(FM)等常用的自训练损失函数。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

四、分析

激活归一化的效果:如图7所示,使用激活归一化可以一致地提升所有任务上的性能。当域间隔较大时(例如精度较低的任务),性能增益最显著。这验证了激活归一化可以使源域和目标域数据分布更接近,从而减少自训练中累积误差的影响。
在这里插入图片描述
图7:使用激活归一化(实心标记)和不使用归一化(空心标记)的比较。

与其他自训练损失函数的比较:为了公平对比,作者在和APA相同的框架和超参数下进行实验,结果列于表6。其中,FixMatch和SENTRY需要额外的随机目标域样本数据增强。文中的方法在所有数据集上都获得了最佳分数。
在这里插入图片描述
表6:与其他自训练损失函数的比较。

冻结分类器的效果:在之前的实验中,作者允许分类器的参数在自适应阶段进行更新。尽管如此,特征空间中的分类器和相应的决策边界变化通常可忽略。之前的一些工作在自适应阶段选择冻结分类器,表7显示这两种策略在文中的方法中表现相当。
在这里插入图片描述
表7: 冻结分类器的效果。

超参数的灵敏性:APA主要涉及两个超参数,扰动大小 ε \varepsilon ε 和对抗损失函数权重 β \beta β。注意到归一化前末层激活的平均范数约为30。图6中特意给出了相对大扰动下的结果以显示方法鲁棒性。图8表明本文方法对 β \beta β 不敏感。
在这里插入图片描述
图8: APA n \text{APA}^n APAn(实线)和 APA u \text{APA}^u APAu(虚线)中对抗损失函数权重 β \beta β 的敏感性。

五、结论

本文探讨了UDA中对末层激活作对抗训练以提高模型在无标记目标域数据上的置信度,通过与在输入图像和中间特征上作对抗训练进行比较,显示了本文方法优势。在激活归一化情形下,作者提出两个方法变种,并在标准设置和无源域数据设置下进行了广泛的实验,展现了优异的性能。本文工作表明,对抗训练是UDA任务中的一个强有力策略

Illustration by Manypixels Gallery from IconScout

-The End-

关于我“门”

将门是一家以专注于发掘、加速及投资技术驱动型创业公司的新型创投机构,旗下涵盖将门创新服务、将门-TechBeat技术社区以及将门创投基金。
将门成立于2015年底,创始团队由微软创投在中国的创始团队原班人马构建而成,曾为微软优选和深度孵化了126家创新的技术型创业公司。
如果您是技术领域的初创企业,不仅想获得投资,还希望获得一系列持续性、有价值的投后服务,欢迎发送或者推荐项目给我“门”:
bp@thejiangmen.com

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/361560.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

以假乱真的手写模拟器?

前些时候给大家推荐了一款word插件叫做“不坑盒子”,这款盒子不仅方便了word的操作,还附带了手写模拟器这样的效果只是在使用的时候不仅需要手动下载字体,而且效果也并不是太理想。 今天小编找到了一款软件--手写模拟器,不仅一键生…

木鱼cms系统审计小结

MuYuCMS基于Thinkphp开发的一套轻量级开源内容管理系统,专注为公司企业、个人站长提供快速建站提供解决方案。 ​​ ‍ 环境搭建 我们利用 phpstudy 来搭建环境,选择 Apache2.4.39 MySQL5.7.26 php5.6.9 ,同时利用 PhpStorm 来实现对项目的调试 ​…

求数组中的第k小元素

文章目录第k小的元素🔒题目💡分析🔑题解🍃不去重版🍃去重版第k小的元素 🔒题目 题目来源:3533. 查找第K小数 - AcWing题库 💡分析 不去重版思路:去重版思路&#xff1a…

华为OD机试 - 斗地主(C++) | 附带编码思路 【2023】

刷算法题之前必看 参加华为od机试,一定要注意不要完全背诵代码,需要理解之后模仿写出,通过率才会高。 华为 OD 清单查看地址:https://blog.csdn.net/hihell/category_12199283.html 华为OD详细说明:https://dream.blog.csdn.net/article/details/128980730 华为OD机试题…

一、【cas搭建单点登录】使用cas搭建单点登录服务器

使用cas搭建单点登录服务器 环境要求 JDK 8CAS 5.2tomcat 8 选用5.x的cas版本是应为要是jdk1.8的版本。 cas版本jdk版本5.x86.x117.x17 模板下载 目前cas的官方文档中,cas官方模板分成了5个大类。cas-sso-server 模板下载地址。 在cas的官方模板库中&#xff…

2023年2月22日PMP®项目管理认证课程正式开课

PMP认证是Project Management Institute在全球范围内推出的针对评价个人项目管理知识能力的资格认证体系。国内众多企业已把PMP认证定为项目经理人必须取得的重要资质。 PMP认证是Project Management Institute在全球范围内推出的针对评价个人项目管理知识能力的资格认证体系。…

微服务之Eureka

🏠个人主页:阿杰的博客 💪个人简介:大家好,我是阿杰,一个正在努力让自己变得更好的男人👨 目前状况🎉:24届毕业生,奋斗在找实习的路上🌟 &#x1…

【虚拟机】VirtualBox Host-Only + 主机网络共享配置

文章目录创建Host-Only虚拟机配置主机配置其它工作中经常会使用到虚拟机进行各种技术的试验,之前为了省事常用桥接模式,可是我经常变换办公地点,每个办公地点的局域网网段并不一样,所以我采取了仅主机模式网络共享这种方式&#x…

34-Golang中的结构体!!!

Golang中的结构体结构体和结构体变量(实例)的区别和联系结构体变量(实例)在内存中的布局如何声明结构体字段/属性注意事项和细节说明创建结构体实例的四种方式结构体使用细节结构体和结构体变量(实例)的区别和联系 1.结构体是自定义的数据类型,代表一类事物2.结构体…

C++项目——高并发内存池(3)--central cache整体设计

1.central cache的介绍 1.1框架思想 1.1.1哈希映射 centralcache其实也是哈希桶结构的,并且central cache和thread cacha的哈希映射关系是一致的。目的为了,当thread cache某一个哈希桶下没有内存块时,可以利用之前编写的SizeClass::Index…

论文解读 | [CVPR2019] 基于自适应文本区域表示的任意形状场景文本检测

目录 1 研究背景及意义 2 总体设计 3 方法论 3.1 自适应文本区域表示 3.2 文本建议 3.3 建议改进 4 损失函数 5 实验及结果 1 研究背景及意义 现有的场景文本检测方法使用固定点数的多边形来 表示文本区域。例如,水平文本使用2个点(左上/右下)表示文本区域&…

LinkedList正确的遍历方式-附源码分析

1.引子 记得之前面试过一个同学&#xff0c;有这么一个题目&#xff1a; LinkedList<String> list new LinkedList<>();for (int i 0; i < 1000; i) {list.add(i "");}请根据上面的代码&#xff0c;请选择比较恰当的方式遍历这个集合&#xff0c;并…

七天实现一个分布式缓存

目录教程来源目的思路缓存淘汰(失效)算法&#xff1a;FIFO&#xff0c;LFU 和 LRUFIFO(First In First Out)LFU(Least Frequently Used)LRU(Least Recently Used)实现Lru查找功能删除新增/修改测试单机并发缓存主体结构 Group回调 GetterGroup 的定义Group 的 Get 方法HTTP 服务…

【C++】空间配置器

空间配置器&#xff0c;听起来高大上&#xff0c;那它到底是什么东西呢&#xff1f; 1.什么是空间配置器&#xff1f; 空间配置器是STL源码中实现的一个小灶&#xff0c;用来应对STL容器频繁申请小块内存空间的问题。他算是一个小型的内存池&#xff0c;以提升STL容器在空间申…

AI 生成二次元女孩,免费云端部署(仅需5分钟)

首先需要google的colab&#xff0c;免费版本GPU有额度。其次&#xff0c;打开github网站&#xff0c;选择一个进入colab,修改代码 !apt-get -y install -qq aria2 !pip install -q https://github.com/camenduru/stable-diffusion-webui-colab/releases/download/0.0.16/xforme…

webstom找不到vue全局组件

我真多服气&#xff0c;引入了自动组件注册 // 自动引入组建import { ElementPlusResolver } from unplugin-vue-components/resolversComponents({directoryAsNamespace: true,resolvers: [ElementPlusResolver()]}),生成了 components.d.ts 但是我在webstom中定义了标签 除非…

2023从0开始学性能(1) —— 性能测试基础【持续更新】

背景 不知道各位大佬有没遇到上面的情况&#xff0c;性能这个东西到底是什么&#xff0c;还是以前的358原则吗&#xff1f;明显并不是适用于现在了。多次想踏入性能测试门槛都以失败告终&#xff0c;这次就以系列的方式来督促自己真正踏进性能测试的门槛。 什么是性能测试 通…

九龙证券|机制改革激发转融券活力 全面注册制释放两融展业新空间

在全面注册制准则规矩正式发布的同时&#xff0c;修订后的转融通事务规矩也应约与商场碰头。2月17日&#xff0c;中证金融发布《中国证券金融公司转融通事务规矩&#xff08;试行&#xff09;&#xff08;2023年修订&#xff09;》等规矩&#xff08;简称“转融通新规”&#x…

操作系统(day12)-- 虚拟内存;页面分配策略

虚拟内存管理 虚拟内存的基本概念 传统存储管理方式的特征、缺点 一次性&#xff1a; 作业必须一次性全部装入内存后才能开始运行。驻留性&#xff1a;作业一旦被装入内存&#xff0c;就会一直驻留在内存中&#xff0c;直至作业运行结束。事实上&#xff0c;在一个时间段内&…

秒杀系统设计

1.秒杀系统的特点 瞬时高并发 2.预防措施 2.1.流量限制 对于一个相同的用户&#xff0c;限制请求的频次对于一个相同的IP&#xff0c;限制请求的频次验证码&#xff0c;减缓用户请求的次数活动开启之前&#xff0c;按钮先置灰&#xff0c;防止无效的请求流入系统&#xff0…