ICCV 2023 | 小鹏汽车纽约石溪:局部上下文感知主动域自适应LADA

news2025/1/20 13:17:07

摘要

主动域自适应(ADA)通过查询少量选定的目标域样本的标签,以帮助模型从源域迁移到目标域。查询数据的局部上下文信息非常重要,特别是在域间差异较大的情况下,然而现有的ADA方法尚未充分探索这一点。在本文中,作者提出了一种名为LADA的局部上下文感知ADA框架。为了选择信息丰富的目标域样本,作者设计了一种基于模型预测分布的局部不一致性的新准则。同时,由于标注预算通常较小,仅在查询数据上微调模型相对低效,作者逐步将相邻的置信样本增加到有标记的目标域数据中,并维持类别平衡。实验表明,文中所提出的主动学习准则相比现有的策略能选择更具信息量的目标域样本。此外,本文提出的整体方法在各种基准测试中显著优于现有最好的ADA方法。

论文链接: https://arxiv.org/abs/2208.12856
代码链接: https://github.com/tsun/LADA


01. 引言


无监督域自适应(UDA)需要将源域中的模型迁移到无标记数据的目标域上,这是一个具有挑战性的任务,尤其是当源域和目标域之间存在较大的差异时。近年来,主动域自适应(ADA)颇受关注,它通过查询选定目标域样本的标签来辅助域自适应,可以在最小标记成本下获得优异的性能。虽然ADA取得了进展,但对于查询数据的局部上下文尚未充分探索。传统的主动学习方法,通常选择模型不确定的,或具有代表性的未标记样本进行标签查询。但在ADA中,因为可以使用有标记的源域数据且源域和目标域之间存在分布差异,类似的方法可能效果不佳。利用目标域样本的局部上下文信息可以指导查询样本的选择,在模型微调过程中,也可以降低模型只记住新查询数据的倾向,以便后续的训练轮次聚焦在更难的样本上。在域间差异较大的情况下,利用查询数据的相邻数据也更加可信。


本文提出了Local context-aware Active Domain Adaptation(LADA)框架,即基于局部上下文感知的主动域自适应。首先,作者设计了Local context-aware Active Selection (LAS) 模块,基于模型预测分布的局部不一致性,从不确定区域选择多样化的子集进行标签查询。然后,作者设计了Progressive Anchor-set Augmentation (PAA) 模块以解决可查询数据规模小和数据不平衡的问题,通过逐步增加置信目标域数据进行模型微调。


本文的贡献包括:
1)验证了在ADA中利用查询数据的上下文,可以指导主动选择并改进模型参数更新。
2)设计了LAS模块,提出了基于模型预测分布局部不一致性的主动选择准则,使得模型可以选择比现有主动选择准则信息更丰富的样本。
3)设计了PAA模块,以克服查询数据规模较小的问题,并逐步以类别平衡的方式使用置信样本来增广有标记目标域数据。


02. 本文方法


2.1 问题定义


2.2 方法综述

作者利用查询数据的上下文来选择更具信息量的目标域样本,并改善模型更新。局部上下文感知主动选择(LAS)模块通过模型预测分布的局部不一致性(LI)分数对所有未标记的目标域样本进行排序,然后选择得分最高的一个多样化子集来查询标签;迭代标记数据增广(PAA)模块逐步添加置信目标域样本,并保持类别平衡。这两个模块交替运行,直到用尽标记预算。

2.3 局部上下文感知主动选择

2.4 迭代标记数据增广

03.实验

作者在四个广泛使用的域适应基准测试集上进行了实验:Office-31,Office-Home,VisDA和DomainNet。Office-Home RSUT是Office-Home的一个子集,其构造过程显式地使源域和目标域具有较大的类分布差异。

作者使用预训练的ResNet-50作为骨干网络,并进行5轮主动选择,标记预算B为5%或者10%目标域数据。为了公平比较,作者在统一框架中复现了几种传统的主动学习准则,包括随机选择(RAN),最低置信度(CONF),熵(ENT),预测概率间隔(MAR),CoreSet,BADGE,以及AADA和CLUE等ADA方法。对于最近的一些ADA方法,如S3VAADA ,TQS和LAMDA,作者从相应的论文中获取了结果。

作者在所有数据集上设置置信度阈值 τ 为0.9。对于Office-31,邻域大小 K 为5,其他数据集 K 为10。作者通过经验公式设置 M ,使得大约有12%的未标记目标数据作为候选集。由于VisDA每个类别的数据量巨大,作者将经验值减半。更多的实现细节和分析可以在补充材料中找到。

3.1 主要结果

标准数据集上ADA方法比较。在Office-Home数据集上,使用5%标签预算,结果列在表1中。在各种主动选择准则中,基于不确定性的准则(如ENT和MAR)通常获得比基于代表性的准则(如CoreSet)更高的准确度,表明选择已经与源域对齐的目标域数据是低效的。当使用半监督求解器MME时,这些准则之间的性能差距变小。无论使用哪种策略,作者提出的LAS准则始终获得最好的分数,表明它可以选择更具信息量的目标样本。表2列出了使用10%预算时的结果。在使用微调或CDAC时,LAS的准确度优于其他主动选择准则。与最近的LAMDA方法相比,作者提出的LAS w/LAA作为整体方法提高了2.3%的准确度。


表3显示了在Office-31数据集上使用5%预算的结果。当模型更新方法固定为微调、MME或CDAC时,LAS始终优于其他主动选择准则。当主动选择方法固定为LAS时,作者提出的RAA和LAA始终优于MME、MCC和CDAC。表5列出了在VisDA数据集上使用10%预算的结果。LAS w/ LAA相比LAMDA提升了1.3%。


类分布偏移的数据集上ADA方法比较。源域和目标域之间类别分布不匹配在ADA中会导致一些问题。作者将本文方法与专门用于解决这个问题的LAMDA进行了比较。遵照他们的设置,作者使用了10%标记预算。表4、5列出了比较结果。LAMDA在源域数据上做重要性抽样以匹配源域和目标域的类别分布,这对于类似DANN的域对抗方法特别有用,本文的RAA/LAA属于自训练方法。作者使用类平衡拒绝机制来构造平衡的训练数据。给定LAS,RAA/LAA的准确度高于其他模型更新方法。LAS w/ LAA整体方法比LAMDA提高了1%。

3.2 LAS分析

LAS中不确定性度量。LAS使用LI(Local Inconsistency)分数来发现不确定区域。为了探究其特性,作者将LAS中的LI分数替换为其他不确定性度量方法,同时保持相同的多样性采样过程。比较的度量方法包括预测概率间隔、熵、预测置信度和NAU分数。图4a和图4b显示了不同过采样比例下的性能。


从图中可以看出,使用较大的过采样比例对于所有不确定性度量方法都是有益的,表明在不确定性和多样性之间需要平衡。CLUE和BADGE也是混合方法,但是它们与LAS有所不同。CLUE在所有目标域样本上运行基于熵加权距离的聚类,而BADGE在所有目标域样本上运行基于梯度嵌入的聚类。它们都依赖于整个目标域数据。


LAS相对于其他主动学习准则的优势。为了更好地展示LAS相对于其他主动学习准则的优势,图5绘制了在不同标记预算和领域自适应方法下的准确率。左图中,无论是使用微调还是MME,LAS始终得到了更好或相当的准确率。当标记预算较小时,性能提升更为显著。中间图绘制了使用5%预算的准确率曲线。LAS在整个训练过程中都优于其他准则。右图中,无论使用何种领域自适应策略,LAS都获得了最佳性能。


为了进一步分析这些不确定性度量之间的差异,图2可视化了Office-31 W→A数据集上的目标域数据特征。作者将所有不确定性分数归一化到[0,1],并根据分数对每个样本进行着色,其中分数最高的10%样本标记为黑色边框。熵和预测概率间隔不考虑局部上下文,因此它们往往包含一些孤立样本,如图2a和图2b所示。NAU定义为NAU = NP×NA,其中NP是邻居样本类别分布的熵,NA是样本与其邻居之间的平均相似性。由于邻居数有限,NP具有离散值且往往较小。如图2c和图2e所示,大多数目标域数据的NAU得分较小。相比之下,不确定样本往往具有较大的LI分数并且更加聚集,在LI的直方图中大约0.8位置可以观察到一个峰值。这也解释了为什么对于LI来说,多样性采样是重要的。在图3放大的可视化中,可以看出LI中的平滑操作有助于去除一些孤立样本。


3.3 RAA/LAA分析

类别平衡拒绝机制的效果。为了解决类别分布不一致的问题,作者在构建标记数据集A的时候通过对多数类和少数类不同的拒绝概率,有效地构造了类别平衡的训练集。图6可视化了 A 中每个类别的样本占比。可以看到,不使用拒绝机制时, A 由多数类主导。相比之下,使用了拒绝机制,来自少数类的样本比例增加。这有助于以更平衡的方式训练每个类别,体现在表6中逐类平均准确率有1.0%的提升。

LADA组件消融实验。表6呈现了LADA各个组件的消融实验结果。第二行相较于第一行的改进表明在LAS中选择一个多样化子集至关重要。通过标记集增广,Office-Home上的准确率提高了2.6%,Office-Home RSUT上提高了2.3%。这证实了仅在查询数据上进行模型微调是相对低效的。使用RandAug构造混合图像进一步提升了性能。为了显示类平衡拒绝机制的有效性,作者在Office-Home RSUT上汇报了逐类平均准确率,从最后一行可以看到1.0%的提升。


04. 结论

本文提出利用查询数据的局部上下文进行主动领域自适应。作者首先提出了一种基于模型预测概率局部不一致性的局部上下文感知主动选择方法,相比之前的准则能选择更具信息量的样本。然后,作者提出了一个迭代标记数据增广模块,以解决标记预算较少导致的问题。它利用查询数据及其扩展邻域来更新模型参数,并维持类别平衡。充分的实验证明,本文的完整方法LADA(局部上下文感知主动领域自适应)显著优于现有最好的ADA方法。

作者:吕骋


  关于TechBeat人工智能社区

TechBeat(www.techbeat.net)隶属于将门创投,是一个荟聚全球华人AI精英的成长社区。

我们希望为AI人才打造更专业的服务和体验,加速并陪伴其学习成长。

期待这里可以成为你学习AI前沿知识的高地,分享自己最新工作的沃土,在AI进阶之路上的升级打怪的根据地!

更多详细介绍>>TechBeat,一个荟聚全球华人AI精英的学习成长社区

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/951182.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

六、事务-4.并发事务问题

一、脏读 事务A执行3个操作,第1个操作执行select语句,第2个操作执行update语句。 注意:事务没有执行完成的时候,事务是没有提交的。只有事务的3个操作完成之后,事务才会提交。 但事务A中第2个操作,会把表…

改进YOLOv8系列:原创改进创新点 SIoU-NMS,EIoU-NMS,DIoU-NMS,CIoU-NMS,GIoU-NMS改进

💡该教程为属于《芒果书》📚系列,包含大量的原创首发改进方式, 所有文章都是全网首发原创改进内容🚀 💡本篇文章为YOLOv8独家原创改进:原创改进创新点 DIoU-NMS,SIoU-NMS,EIoU-NMS,CIoU-NMS,GIoU-NMS改进。 💡对自己数据集改进有效的话,可以直接当做自己的原创改…

机器学习笔记之最优化理论与方法(二)凸集的简单认识(上)

机器学习笔记之最优化理论与方法——凸集的简单认识[上] 引言凸优化问题与凸集合凸函数的关系凸优化问题简单示例凸集的简单示例 基本定义:凸集关于凸集性质的等价条件,凸组合,凸包常见凸集 引言 本节将介绍关于凸集的基本信息,包…

【Java】基础入门 (十六)--- 异常

1.异常 1.1 异常概述 异常是指程序在运行过程中出现的非正常的情况,如用户输入错误、除数为零、文件不存在、数组下标越界等。由于异常情况再程序运行过程中是难以避免的,一个良好的应用程序除了满足基本功能要求外,还应具备预见并处理可能发…

青翼科技基于VITA57.1的16路数据收发处理平台产品手册

FMC211是一款基于VITA57.1标准规范的实现16路LVDS数据采集、1路光纤数据收发处理FMC子卡模块。 该板卡支持2路CVBS(复合视频)视频输入,能够自动检测标准的模拟基带电视信号,并将其转变为8位ITU-R.656接口信号或者4:2:2分量视频信…

Qt网络通信——获取本机网络信息

查询一个主机的MAC地址或者IP地址是网络应用中常用到的功能&#xff0c;Qt提供了QHostInfo和QNetworkInterface 类可以用于此类信息的查询 1.QHostInfo 类&#xff08;显示和查找本地的信息&#xff09;是的主要函数 类别 函数原型作用公共函数QList <QHostAdress> addr…

读<一例 Go 编译器代码优化 bug 定位和修复解析>

看到一例 Go 编译器代码优化 bug 定位和修复解析[1]这样一篇文章,感觉有些意思. 在此复现和记录 在Go 1.16版本下,是没有这个bug[2]的(已修复). 参照gvm:灵活的Go版本管理工具[3] 将Go版本切至有问题的1.13.5(或1.14.6) ➜ go versiongo version go1.13.5 darwin/amd64 packag…

Node常用内置模块之url模块和querystring模块

1、URL类 url模块在v16的nodejs中已经明确被废弃&#xff0c;在将来的升级node中&#xff0c;可能被不支持。 官网建议在废弃url、querystring模块后&#xff0c;采用URL类去替代。 图示 URL 各部分 旧版的url模块 作用&#xff1a;url 模块是用于处理和解析 URL 的模块&…

Unity ShaderGraph教程——基础shader

1.基本贴图shader&#xff1a; 基础贴图实现&#xff1a;主贴图、自发光贴图、光滑度贴图、自发光贴图&#xff08;自发光还加入了颜色影响和按 钮开关&#xff09;. 步骤&#xff1a;最左侧操作组——新建texture2D——新建sample texture 2D承…

Linux上部署zentao禅道18.6版本

1. cd /opt 2. 下载 ZenTaoPMS-18.6-zbox_amd64.tar.gz wget https://dl.cnezsoft.com/zentao/18.6/ZenTaoPMS-18.6-zbox_amd64.tar.gz 3. 解压 tar -zxvf ZenTaoPMS-18.6-zbox_amd64.tar.gz 4. 解压成功, 可以看到多了个zbox文件 5. cd zbox/ 进入该目录 6. 修改apache默认…

乙酰基六肽-18——刺激脂肪合成,增加指定部位脂肪,塑造完美曲线

简介 乙酰六肽-18&#xff08;丰胸肽&#xff09;为一种乙酰化的六肽&#xff0c;可显著刺激使用部位脂肪合成&#xff0c;增大胸部或脸颊的体积&#xff0c;塑造完美身材。 INCI 名称 乙酰六肽-18 分子式 C30H54N9O10 分子量 700.32 CAS号 1400634-44-7…

WPF_布局基础

布局容器 Grid 定义由列和行组成的灵活的网格区域。 行 <Grid.RowDefinitions><RowDefinition/><RowDefinition/></Grid.RowDefinitions> 列 <Grid.ColumnDefinitions><ColumnDefinition/><ColumnDefinition/></Grid.ColumnDe…

免费开源MES系统|自动排产管理

万界星空科技免费MES系统助力企业实现生产排程自动化&#xff0c;降低人力成本。生产计划排产管理是指制定一个可行的生产计划并按照该计划安排生产资源和制造活动的过程。 它是制造企业管理中的一个关键过程&#xff0c;涉及到计划制定、资源管理、物料采购、工厂布局、生产调…

手搓的一款基于sql脚本的数据初始化组件

产口孵化新项目时&#xff0c;表中需要提前预置部份数据。如字典&#xff0c;角色、菜单、配置等。以达到快速布署的目的。这部份数据会随着某些因素的影响。如地区变化、系统定制方面。无法使用统一的一份sql。旧方案是在代码里面动态的作insert操作。在项目启动的时候初始化这…

IPIDEA确认参加2023 CCEE(深圳)雨果跨境全球电商展览会

9月1日—9月3日&#xff0c;雨果跨境将在深圳会展中心&#xff08;福田&#xff09;举办 “2023CCEE&#xff08;深圳&#xff09;雨果跨境全球电商展览会”。 届时&#xff0c;IPIDEA将参加此次跨境年度盛会。作为一家专业的全球HTTP代理商&#xff0c;IPIDEA为与会商家准备了…

MES管理系统数据建模有哪些注意事项

在进行MES管理系统数据建模时&#xff0c;需要注意以下几个方面&#xff0c;以确保建立高效、可靠且适应性强的数据模型&#xff0c;为企业的生产管理提供有力的支持。 首先&#xff0c;精确理解业务需求是进行数据建模的前提。与相关部门和人员进行充分的沟通&#xff0c;了解…

基于web的图书管理系统java书店进销存 jsp源代码Mysql

本项目为前几天收费帮学妹做的一个项目&#xff0c;Java EE JSP项目&#xff0c;在工作环境中基本使用不到&#xff0c;但是很多学校把这个当作编程入门的项目来做&#xff0c;故分享出本项目供初学者参考。 一、项目描述 基于web的图书管理系统 系统有1权限:管理员 二、主要…

小程序中如何给会员发送微信服务通知

通过发送微信服务通知&#xff0c;可以及时向会员推送最新的活动、优惠信息等重要通知&#xff0c;从而增加用户参与度和购买意愿。下面就介绍怎么给会员发送微信服务通知的方法和步骤。 1. 找到指定的会员卡。在管理员后台->会员管理处&#xff0c;找到需要接收服务通知的…

【Navicat Premium 16】使用Navicat将excel的数据进行单表的导入,详细操作

业务场景&#xff1a;经常与数据打交道嘛&#xff0c;有的时候会需要将excel的数据导入到数据库中&#xff0c;后面发现对于单表的数据导入&#xff0c;使用Navicat还是非常方便的&#xff0c;仅仅需要将字段关系映射好就可以了 一、开始操作 前提条件&#xff1a;已经成功连接…

算法通关村第9关【白银】| 二分查找与搜索树高频问题

基于二分查找的拓展问题 1.山脉数组的峰顶索引 思路&#xff1a;二分查找 山峰有三种状态&#xff1a;需要注意数组边界 1.顶峰&#xff1a;arr[mid]>arr[mid1]&&arr[mid]>arr[mid-1] 2.上坡&#xff1a;arr[mid]<arr[mid1] 3.下坡&#xff1a;arr[mid]…