9篇论文速览 ICML 2023 测试时自适应(TTA)最新研究进展

news2024/12/22 18:18:31

测试时自适应对于领域转移下真实机器感知应用的成功至关重要,近年来,研究者们仍然在不断优化现有的方法。在今年的ICML中,TTA相关的研究也有了最新进展。

1.Uncovering Adversarial Risks of Test-Time Adaptation

标题:揭示测试时适应的对抗风险

内容:最近,测试时适应(TTA)被提出作为解决分布漂移的有望解决方案。它允许基模型在推理期间利用测试批次中的信息适应未知分布。但是,作者揭示了TTA基于这样的洞见存在新的安全漏洞:良性样本的预测会受到同一批次中恶意样本的影响。为了利用这个漏洞,作者提出了分布入侵攻击(DIA),它向测试批次注入少量恶意数据。DIA导致使用TTA的模型将良性和未经扰动的测试数据错误分类,为对手提供了一种在规范机器学习流水线中不可行的完全新能力。通过全面评估,作者证明了攻击对六种TTA方法在多个基准上的高效性。为应对这一漏洞,作者研究了两个对策来增强现有不安全的TTA实现,遵循“安全设计”的原则。

2.On Pitfalls of Test-Time Adaptation

标题:测试时间自适应的陷阱

内容:测试时间自适应(TTA)最近出现作为一种解决分布转移鲁棒性挑战的有希望的方法。但是,先前文献中缺乏一致的设置和系统的研究,阻碍了对现有方法的彻底评估。为解决这个问题,作者提出了TTAB,一个测试时间自适应基准,它包含十种最先进的算法,各种分布转移和两种评估协议。通过大量的实验,该基准揭示了先前工作中的三个常见陷阱。第一,由于在线批处理依赖性,选择适当的超参数,特别是用于模型选择,非常困难。第二,TTA的有效性在很大程度上取决于所调整的模型的质量和属性。第三,即使在最佳的算法条件下,现有的方法也无法解决所有常见类型的分布转移。

3.Leveraging Proxy of Training Data for Test-Time Adaptation

标题:利用训练数据代理进行测试时适应

内容:TTA的常见做法是忽略训练数据,以减少内存需求和隐私泄露。但是,训练数据是唯一的监督来源。这促使作者研究恰当地使用它们的方法,同时最小化副作用。为此,作者提出了训练数据的两个轻量级且信息丰富的代理,以及一个充分利用它们的TTA方法。代理之一由少量通过数据浓缩合成的图像组成,它们最小化了域特定性以捕获广泛域的一般潜在结构。然后,在TTA中,通过调整它们的样式以匹配无标签测试样本的样式,将它们转换为标记的测试数据,这实现了虚拟的测试时训练。另一个代理是训练数据的类间关系,在TTA期间转移到目标模型。在四个公共基准测试上,我们的方法以显著更少的计算和内存优于最先进的方法。

4.Learnability and Algorithm for Continual Learning

标题:持续学习的可学习性与算法

内容:本文研究了类增量学习(CIL)这一具有挑战性的持续学习设置。CIL学习一系列由不相交的概念或类构成的任务的序列。在任何时间点,都会构建一个单一模型,该模型可以对至今学习过的任何类的测试实例进行预测/分类,而无需为每个测试实例提供任何任务相关信息。尽管已为CIL提出许多技术,但它们大多是经验性的。最近证明,一个强大的CIL系统需要对每个任务具有强大的任务内预测(WP)和出分布(OOD)检测。然而,CIL是否可学习性仍未可知。本文证明CIL是可学习的。基于该理论,还提出了一种新的CIL算法。实验结果证明了其有效性。

5.Test-time Adaptation with Slot-Centric Models

标题:基于槽位的模型的测试时适应

内容:当前的视觉检测器在训练分布内的表现虽然令人印象深刻,但在分布外的场景中解析实体时往往会失败。最近的测试时间自适应方法使用辅助自监督损失来独立地对每个测试示例的参数进行自适应,在图像分类任务中对训练分布之外的泛化显示了有希望的结果。作者发现这些损失本身对于场景分解任务是不够的,如果不考虑建模的归纳偏差。最近的以slot为中心的生成模型试图通过重建像素以自监督的方式分解场景成实体。汲取这两条研究路线的精华,作者提出了Slot-TTA,这是一个半监督的以slot为中心的场景分解模型,在测试时通过对重建或跨视觉合成目标进行梯度下降对每个场景进行自适应。作者评估了Slot-TTA跨多个输入模式(图像或3D点云),并展示了相对于最先进的监督前馈检测器和其他测试时间自适应方法的重大分布外性能改进。

6.Theory on Forgetting and Generalization of Continual Learning

标题:持续学习遗忘和泛化理论

内容:持续学习(CL)旨在学习一系列任务,最近受到广泛关注。但是,大多数工作集中在CL的实验表现,理论研究还比较有限。特别是对影响“灾难性遗忘”和泛化性能的关键因素还缺乏理解。为弥补这一空白,作者在过参数化线性模型下的理论分析首次给出了预期遗忘和泛化误差的显式形式。进一步分析这个关键结果产生了许多理论解释,阐明了过参数化、任务相似性和任务顺序如何影响CL的遗忘和泛化误差。更有趣的是,通过在真实数据集上使用深度神经网络(DNN)进行实验,作者发现一些见解甚至超越了线性模型,可以延伸到实际设置。

7.Test-Time Style Shifting: Handling Arbitrary Styles in Domain Generalization

标题:测试时风格转换:处理域泛化中的任意风格

内容:作者提出了测试时风格迁移,在进行预测之前,它会将测试样本(与源域有较大风格差异的样本)的风格转换为模型已经熟悉的最相近的源域的风格。这种策略使得模型可以处理任意风格统计的目标域,而无需在测试时进行额外的模型更新。另外,作者提出了风格平衡,它为最大限度地发挥测试时风格迁移的优势提供了一个很好的平台,通过处理DG特有的不平衡问题。作者提出的思想很容易实现,并且可以与各种其他DG方案成功配合使用。不同数据集上的实验结果证明了该方法的有效性。

8.Learning Rate Schedules in the Presence of Distribution Shift

标题:分布变化下的学习率调度

内容:作者设计了学习率调度方案,以最小化SGD在线学习在数据分布变化的情况下的遗憾。通过创新的随机微分方程分析完全表征了线性回归的最佳学习率调度。对于一般的凸损失函数,作者提出了鲁棒的学习率调度,给出了遗憾的上下界,仅差一个常数。对于非凸损失函数,作者定义了基于估计模型的梯度范数的遗憾概念,并提出了最小化总预期遗憾上界的学习率调度。直觉上,变化的损失景观需要更多的探索,作者确认最佳学习率调度通常在分布变化时增加。

9.Nonparametric Density Estimation under Distribution Drift

标题:分布漂移下的非参数密度估计

内容:作者研究了非平稳漂移设置下的非参数密度估计。给定从随时间逐渐变化的分布中采样的独立样本序列,目标是计算当前分布的最佳估计。作者证明了离散和连续光滑密度的紧致最小最大风险界,其中最小值是所有可能的估计量,最大值是满足漂移约束的所有可能分布。作者的技术处理广泛的漂移模型,并推广了之前关于漂移下无知学习的结果。

关注下方《学姐带你玩AI》🚀🚀🚀

回复“TTA”获取全部论文PDF+代码合集

码字不易,欢迎大家点赞评论收藏!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/861937.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

JVM垃圾回收篇-垃圾回收器

JVM垃圾回收篇-垃圾回收器 串行垃圾回收器 Serial串行:为单线程环境设计且只使用一个线程进行垃圾回收,会暂停所有用户的线程,所以不适合服务器环境,适用于堆内存小,适合于个人电脑 开启串行垃圾回收 -XX:UseSeria…

MySQL_多表关系

多表关系 一对一关系 用户和用户详情 关系:一对一的关系 用途:用于单表拆分,将一张表的基础字段放在一张表中,其它字段放在另一张表中,可以提升查询效率 实现:在任意一张表里面添加外键,关联…

《向量数据库指南》——判断一个好的向量数据库,标准是什么?

一个不容忽略的问题是,趁着大模型这波狂热浪潮,软件市场催生了大量的向量数据库,软件质量和性能参差不齐,其中更是不乏套壳的向量数据库。那么,如何区分一个向量数据库是否真正具备自己所需的能力,如何迅速了解并对比不同向量数据库的性能和容量成本差距呢? 不久前,Zil…

【dnf5文档】新一代RedHat自动化包管理器

前言 HI,CSDN的码友们,距离上一次我发文章已经过去了半年的时间,现在我又来介绍自己新发现和探究的开源技术了。计算机的发展总是飞速的,当我在写这篇文章的时候,Fedora rawhide已经进入了40版本、默认采用的自动化包管理器为dnf…

亚马逊推出新卖家论坛!提供多种新功能!

亚马逊欧洲站发布公告称新推出的亚马逊卖家论坛新论坛提供更简单的导航和搜索,高级过滤功能,投票功能以及个性化设置,以下是公告内容: 我们推出了新的亚马逊卖家论坛体验,卖家每天都可以在这里寻找答案,帮…

560. 和为 K 的子数组

思路 本题的主要思路为创建一个哈希表记录每个0~i的和,在遍历这个数组的时候查询有没有sum-k的值在哈希表中,如果有,说明有个位置到当前位置的和为k。   有可能不止一个,哈希表负责记录有几个sum-k,将和记录下来。这…

网络远程USB共享 VirtualHere USB Server v4.5.8 Crack

VirtualHere 允许通过网络远程使用 USB 设备,就像本地连接一样! 传统上,USB 设备需要直接插入计算机才能使用。有了 VirtualHere,这不再是必需的,网络本身变成了传输 USB 信号的电缆(也称为 USB over IP、U…

勘探开发人工智能技术:机器学习(2)

0 提纲 3.1 k k k 近邻算法 3.2 决策树 3.3 k k kMeans 3.4 如何定义机器学习问题 3.5 线性回归 1 k k k 近邻算法 开卷考试, 在桌上堆的资料越多, 越是 “见多识广”. 1.1 核心思想 具有讽刺意味的是: 机器学习最基本的算法居然是不学习, 也称为惰性学习 (lazy learni…

Blazor简单教程(1.1):Razor基础语法

文章目录 前言语法介绍生命C#代码控件绑定简单绑定双向绑定带参数的函数绑定 前言 Blazor最重要的是Razor组件和cshtml页面。两个最大的区别就是cshtml是完整的html,Razor是不完整的html 微软Razor 语法官方文档 我的Blazor基础语法个人总结 语法介绍 生命C#代码控件 code…

Stable Diffusion - 幻想 (Fantasy) 风格与糖果世界 (Candy Land) 的人物图像提示词配置

欢迎关注我的CSDN:https://spike.blog.csdn.net/ 本文地址:https://spike.blog.csdn.net/article/details/132212193 图像由 DreamShaper8 模型生成,融合糖果世界。 幻想 (Fantasy) 风格图像是一种以想象力为主导的艺术形式,创造了…

UDS诊断笔记

文章目录 常见缩写简介UDS寻址模式1. 物理寻址(点对点、一对一)2. 功能寻址(广播、一对多)3. 功能寻址使用场景举例 UDS报文格式UDS协议栈网络层网络层功能网络层协议1. 单帧 SF(Single Frame)2. 首帧 FC&a…

matplotlib笔记:bar barh

1 bar 绘制垂直方向的条形图 x条形的 x 坐标height 条形的高度 width 条形的宽度 (浮点数或类数组) bottom 条形的底部的 y 坐标 (浮点数或类数组) align 控制条形对齐方式 center:将基线居中于 x 位置。ed…

cpu的cacheline对程序效率影响

什么是cpu cacheline CPU的缓存行(Cache Line)是存储器层次结构中的一部分,用于在CPU缓存和主存之间传输数据。缓存行是缓存的最小单位,也是处理器从主存中读取数据到缓存或将数据从缓存写回主存的最小数据块。 缓存行的大小是由…

C语言 指针与内存之间的关系

一、内存与字节 一个内存单元一个字节一个地址 整型 int 类型中int类型的字节数是4 且一个字节表示八个bite位 一个二进制数位有着32个bite 所以又可以表示为:一个字节 8个比特位 32位数的二进制数位的八分之一 例如: int a 10; 该表达式…

编程基础与脚本规范

编程基础与脚本规范 一.编程基础1.1程序组成1.2.编程风格1.3 编程语言的分类 二.shell脚本基础2.1shell脚本的用途和应用场景2.2常见的shell解释器2.3shell脚本基本结构2.4shell规范脚本2.5脚本的执行方式2.6脚本错误调试 三.重定向与管道符3.1标准输入去输出3.2重定向3.3 管道…

TypeError: Plain typing.NoReturn is not valid as type argument解决方案

大家好,我是爱编程的喵喵。双985硕士毕业,现担任全栈工程师一职,热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的…

【C语言】初阶指针详解

目录 一、什么是指针? 1.指针变量 2.指针大小 二、指针类型 三、野指针 四、指针运算 1.指针-整数 2.指针-指针 3.指针的关系运算 五、指针和数组 六、二级指针 七、指针数组 一、什么是指针? 指针是内存中一个最小单元的编号,…

MySQL_数据库的DDL语句(表的创建与修改)

DDL 数据库操作 查看当前有哪些数据库 SHOW databases;#查看哪些数据库查询当前数据库 SELECT database();创建数据库 create database [ if not exists ] 数据库名 [ default charset 字符集 ] [ collate 排序 规则 ] ;创建一个sycoder数据库, 使用数据库默认的字符集 CREATE…

retrofit-helper 简洁的封装retrofit,优雅的取消请求

retrofit-helper Retrofit是很多android开发者都在使用的Http请求库!他负责网络请求接口的封装,底层实现是OkHttp,它的一个特点是包含了特别多注解,方便简化你的代码量,CallAdapter.Factory 和Converter.Factory可以很灵活的扩展你的请求。我们在使用的…

“崩溃”漏洞会影响英特尔 CPU 的使用寿命,可能会泄露加密密钥等

对于 CPU 安全漏洞来说,本周是重要的一周。昨天,不同的安全研究人员发布了两个不同漏洞的详细信息,一个影响多代英特尔处理器,另一个影响最新的 AMD CPU。“ Downfall ”和“ Inception ”(分别)是不同的错…