ICLR 2023 | 用于分布外泛化的拓扑感知鲁棒优化

news2024/9/8 23:42:00

image.png

论文链接:https://openreview.net/pdf?id=ylMq8MBnAp
代码链接:GitHub - joffery/TRO: The Pytorch implementation for "Topology-aware Robust Optimization for Out-of-Distribution Generalization" (ICLR 2023)

01. 研究背景

近年来,机器学习(ML)被广泛应用在高风险和安全关键型应用中。这类应用提出了前所未有的“分布外(OOD)泛化挑战”:ML模型不断接触到训练空间之外的未知分布。尽管在“内插”问题上取得了巨大的成功,但现代ML模型(如深度神经网络)在“外推”问题上非常薄弱;即使平均准确性很高的模型在面对罕见或未知分布时也可能发生灾难性失败。例如,针对美国2000年至2020年间所有89次重大洪水事件进行训练的洪水预测模型,会错误地对2021年的“飓风艾达”事件进行预测。如果不解决这个挑战,模型的应用场景及其相关风险将变得不清楚。

一种解决分布外泛化问题的有效方法是进行分布鲁棒优化(DRO)[1]。DRO通过构建一个“不确定性集合”以最小化潜在测试分布的“最坏”(worst-case)预期风险。这个不确定性集合通常被构造为一个围绕训练集的散度球。与最小化平均风险的方法(ERM)相比,DRO对来自虚假相关性、对抗攻击、子群体或自然变化等因素引起的“分布漂移”更具有鲁棒性[2]。

然而,构建一个能够真正近似未知分布的不确定性集合来是一个非常具有挑战性的任务。

一方面,为了对抗广泛的分布漂移,不确定性集合必须足够大,这增加了包含不可信分布(例如异常值)的风险,从而导致过于悲观的模型和低预测置信度[3]。

另一方面,最坏分布不一定是与未知分布真正相关的“有影响力的分布”;优化最坏分布而不是有影响力的分布会牺牲模型的鲁棒性。

02. 方法介绍

因为模型不可能泛化到任意的未知分布,我们假设数据分布的拓扑结构对构建真实的“不确定性集合”至关重要。更具体地说,我们提出了一种整合两个优化目标的拓扑感知鲁棒优化(TRO)方法:

  1. 拓扑学习:我们将数据分布建模为位于共同低维流形上的多个离散组,通过使用物理先验或测量分布之间的多尺度推土距离(EMD)来“探索”分布拓扑。

  2. 拓扑上的学习:然后,利用获得的分布拓扑来构建一个真实的不确定性集合,其中鲁棒优化将泛化风险限制在拓扑图中,而不是盲目地泛化到未知分布上。

image.png
图1 拓扑感知的鲁棒优化(TRO)概述

2.1 拓扑学习:探索分布拓扑

2.2 拓扑上的学习:利用拓扑进行鲁棒优化

03. 实验结果

我们在广泛的任务中对TRO进行了评估,包括分类、回归和语义分割。

我们将TRO与最先进的基准模型进行了OOD泛化性能的比较,并对TRO的关键组成部分进行了消融研究。

3.1 气温预测

image.png
图2 (左) TPT-48上 N →→ S泛化任务。(中) 基于物理的拓扑的分布中心度。(右)基于数据驱动的拓扑的分布中心度。TRO将“PA”识别为物理拓扑中影响力较大的分布;TRO将“NY”,“PA”和“MA”识别为数据驱动拓扑中影响力较大的分布。数据拓扑的均方误差低于物理拓扑。

数据集TPT-48[7] 包含了美国48个相邻州从2008年到2019年的月平均温度数据。

我们专注于回归任务,根据前6个月的温度预测接下来6个月的温度。我们考虑了两个泛化任务:

  1. E(24) →→ W(24):我们将24个东部州作为训练组,24个西部州作为测试组;

  2. N(24) →→ S(24):我们将24个北部州作为训练组,24个南部州作为测试组。

与最近的训练组相距一条边的测试组定义为Hop-1测试组,相距两条边的测试组定义为Hop-2测试组,其余组定义为Hop-3 测试组。

TPT-48数据集上的N(24) →→ S(24)的可视化结果如图 2 (左) 所示。

image.png
表1 E (24)  →→ W (24)和N (24)  →→ S (24)两个任务在TPT-48上的均方误差(MSE)。TRO(基于数据驱动的拓扑)在这两个任务中始终优于TRO(基于物理的拓扑),表明数据驱动的拓扑更准确地捕捉到了分布关系。

结果。我们在上表中展示了TPT-48的结果。

TRO在两个任务中均获得了最低的平均均方误差(MSE)。我们还报告了两个任务中Hop-1、Hop-2和Hop-3测试组的平均均方误差。尽管在N(24) →→ S(24)任务中,REx在Hop-1和Hop-2组上的误差最低,但在Hop-3组上的预测误差最高。

结果表明,REx在面对较大的分布漂移时可能会产生性能上的妥协。TRO在Hop-3组上表现出最佳性能,表明它在面对较大的分布漂移时具有强大的泛化能力。

3.2 洪水分割

image.png
图3 (左)Sen1Floods11 上的11个洪水事件的位置。我们将事件 “BOL” 用于测试,其他事件用于训练。(右) Sen1Floods11 上的基于数据驱动的分布拓扑。 (1)TRO将“IND” 和 “NGA” 识别为最具影响力的分布。 一个可能的解释是,“IND” 和 “NGA” 都是由于暴雨引起的,而暴雨是导致洪水的最常见灾害。 (2)TRO将“GHA”和“KHM”识别为影响力最小的分布。 一个可能的解释是,“GHA”和“KHM”都是由于边缘情况,如水坝破坏,而引起的。基于数据驱动的分布拓扑与领域知识一致,并有助于解释TRO的结果。

数据集Sen1Floods11[8] 是一个用于全球洪水映射的公共数据集。

该数据集提供了全球范围内的4,831个512 x 512的分辨率为10米的卫星图像,涵盖了11个不同的洪水事件,总共覆盖了120,406平方千米的区域。每个图像都附带有像素级的标签。11个洪水事件的位置如图 3(左)所示。

不同的洪水事件在边界条件、地形和其他潜在因素上存在变化,对现有模型的可靠性和可解释性提出了显著的OOD挑战。

按照[8]的约定,事件“BOL”被保留作为测试集,其他事件的数据随机划分为训练集和验证集,比例为80%和20%。

image.png
表2 Sen1Floods11的分割结果(IoU)。TRO在未见的洪水事件上比其他基准模型表现出更好的性能。

结果。我们在上表中展示了Sen1Floods11的结果。

ERM在验证集上获得了最高的Intersection over Union (IoU),而TRO在测试集上获得了最高的IoU。

结果证明,TRO在未见的洪水事件上比其他基准模型表现出更好的性能。

04. 结语

我们的贡献包括:

  1. 一种新的优化方法,通过无缝地集成拓扑信息,以增强模型的分布外(OOD)泛化性能。

  2. 理论分析证明我们的方法在凸和非凸损失函数下都具有快速收敛性,同时对泛化风险进行了严格的界定。

  3. 在包括分类、回归和语义分割在内的广泛任务中的实验结果证明我们的方法相对于SOTA具有更优越的性能。

  4. 数据驱动的分布拓扑与领域知识一致,并增强了模型的可解释性。

参考文献

[1] Namkoong et al. Stochastic gradient methods for distributionally robust optimization with f-divergences. NeurIPS 2016

[2] Robey et al. Model-based domain generalization. NeurIPS 2021

[3] Hu et al. Does distributionally robust supervised learning give robust classifiers? ICML 2018

[4] Leeb et al. Hölder–lipschitz norms and their duals on spaces with semigroups, with applications to earth mover’s distance. Journal of Fourier Analysis and Applications, 2016

[5] Tong et al. Diffusion earth mover’s distance and distribution embeddings. ICML 2021

[6] Newman. A measure of betweenness centrality based on random walks. Social networks, 2005

[7] Xu et al. Graph-relational domain adaptation. ICLR 2022

[8] Bonafilia et al. Sen1floods11: A georefer- enced dataset to train and test deep learning flood algorithms for sentinel-1. CVPR Workshops, 2020

招生信息

特拉华大学(University of Delaware)计算机系(Computer and Information Sciences) 招收2024 Spring/Fall全奖博士生.

研究方向:

  1. Robust and Explainable DL;
  2. Human-centered Computer Vision.

导师:彭曦(Dr. Xi Peng, Assistant Professor)

关于实验室:
我们持续在顶会发表工作包括NeurIPS, ICLR, CVPR, ICCV, ECCV, KDD, AAAI, IJCAI;近些年入学的几位同学已经在CVPR’20-23,AAAI’21,TPAMI’22,ICLR’23,ICCV’23 发表一作论文并且荣获 NeurIPS’21 Workshop Best Paper Award;我们与北美多家工业界实验室合作紧密可推荐优秀学生前往暑期实习Google Research, Snap Research, Amazon AWS, IBM Watson Research.

更多信息:Deep-REAL
邮件: xipeng@udel.edu
邮箱主题/简历命名格式:博士申请+姓名


关于TechBeat人工智能社区

TechBeat(www.techbeat.net)隶属于将门创投,是一个荟聚全球华人AI精英的成长社区我们希望为AI人才打造更专业的服务和体验,加速并陪伴其学习成长。期待这里可以成为你学习Al前沿知识的高地,分享自己最新工作的沃士,在AI进阶之路上的升级打怪的根据地!更多详细介绍>>TechBeat,一个荟聚全球华人AI精英的学习成长社区

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/803039.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

虹科分享 | 工业4.0:IO-Link wireless等先进通信技术是不可或缺的支柱

近年来,随着工业4.0(工业革命4.0)的提出,制造业转型浪潮拉开帷幕。工业4.0是将数字技术整合到传统的制造流程中,从而创建智能工厂。对此类工厂的最初要求是工厂各个层面的完全连接,从制造车间一直到管理和云…

重大更新|Sui主网即将上线流动性质押,助力资产再流通

Sui社区一直提议官方上线流动质押功能,现在通过SIP过程,已经升级该协议以实现这一功能。 Sui使用委托权益证明机制(DPoS)来选择和奖励负责运营网络的验证节点。为了保障网络安全,验证节点通过质押SUI token获得质押奖…

win10小任务栏显示日期

win10存在一个问题, 就是任务栏为小任务栏时, 无法显示系统日期, 只能显示时间, 对这个问题有两个办法, 1, 把小任务栏改为大任务栏, 日期就能显示出来 但如果你就是想用小任务栏, 不想用大任务栏, 又想显示日期, 只靠win10内置的设置是没法实现的, 只能借助其他软件, 具体看…

HTTP协议揭秘:探寻互联网的背后密码、探秘数据传输的奥秘

HTTP(超文本传输协议:Hypertext Transfer Protocol)是一种用于在Web上传输数据的协议,它是互联网上最重要的应用层协议之一。从诞生至今,HTTP一直扮演着连接世界的通信桥梁的角色,在互联网的发展和普及中发…

数组练习题,数组的动态初始化

数组的遍历 定义一个数组&#xff0c;求和 int[] arr {1,2,3,4,5,6,7};int sum 0;for (int i 0; i <arr.length ; i) {sum sum arr[i];}System.out.println(sum);定义一个数组&#xff0c;统计数组里面一共有多少能够被3 整除的数字&#xff1a; int[] arr1 {4,62,8…

JavaScript快速入门:ComPDFKit PDF SDK 快速构建 Web端 PDF阅读器

JavaScript快速入门&#xff1a;ComPDFKit PDF SDK 快速构建 Web端 PDF阅读器 在当今丰富的网络环境中&#xff0c;处理 PDF 文档已成为企业和开发人员的必需品。ComPDFKit 是一款支持 Web 平台并且功能强大的 PDF SDK&#xff0c;开发人员可以利用它创建 PDF 查看器和编辑器&…

了解Unity编辑器之组件篇Playables和Rendering(十)

Playables 一、Playable Director&#xff1a;是一种用于控制和管理剧情、动画和音频的工具。它作为一个中央控制器&#xff0c;可以管理播放动画剧情、视频剧情和音频剧情&#xff0c;以及它们之间的时间、顺序和交互。 Playable Director组件具有以下作用&#xff1a; 剧情控…

数据结构初阶--栈和队列

目录 一.栈 1.栈的定义 2.顺序栈的功能实现 2.1.顺序栈的定义 2.2.顺序栈的初始化 2.3.顺序栈的判空 2.4.顺序栈的入栈 2.5.顺序栈的出栈 2.6.顺序栈的取栈顶元素 2.7.顺序栈的求栈的大小 2.8.顺序栈的销毁 2.9.完整程序 Stack.h Stack.c test.c 二.队列 1.队…

S475支持 ModbusRTU 转 MQTT协议采集网关

6路模拟量输入和2路RS485串口是一种功能强大的通信接口&#xff0c;可以接入多种设备和系统&#xff0c;支持4-20mA输出的传感器以及开关量输入输出。本文将详细介绍6路模拟量输入和2路RS485串口的应用场景和功能&#xff0c;重点介绍其在SCADA、HMI、远程数据监控以及采集控制…

机器学习——样本不均衡学习

1、样本不均衡定义 一般在分类机器学习中&#xff0c;每种类别的样本是均衡的&#xff0c;也就是不同目标值的样本总量是接近的&#xff0c;但是在很多场景下的样本没有办法做到理想情况&#xff0c;甚至部分情况本身就是不均衡情况&#xff1a; &#xff08;1&#xff09;很多…

[洛谷]P2052 [NOI2011] 道路修建(dfs)

在递归过程中也把子节点的贡献&#xff08;以及左右国家数记录下来了&#xff09;。 void dfs(int u,int fa) {d[u]1;//当前节点也算一个 for(int ih[u]; i; ine[i]) {int toe[i];//子节点if(tofa) continue;//防止重复搜索&#xff0c;即防止从下往上搜dfs(to,u);//子节点 //…

基于SSM+JSP+LayUI的宿舍管理系统

修正初始账号密码 默认账号&#xff1a;admin&#xff0c;默认密码&#xff1a;123456修复后台管理头像消失功能相对简单些&#xff0c;可能需要添加一些功能&#xff0c;需要源码免费提供需要运行服务、添加功能等联系我

springboot开放实验室管理系统【纯干货分享,免费领源码03361】

摘 要 随着社会的发展&#xff0c;社会的方方面面都在利用信息化时代的优势。互联网的优势和普及使得各种系统的开发成为必需。 本文以实际运用为开发背景&#xff0c;运用软件工程原理和开发方法&#xff0c;它主要是使用动态网页开发技术java作为系统的开发语言&#xff0c;M…

如何挑选滚珠螺杆的润滑油脂?

滚珠螺杆在日常使用中&#xff0c;出现卡顿或者噪音等问题&#xff0c;不用担心&#xff0c;不是你的滚珠螺杆出了问题&#xff0c;而是润滑系统出了问题&#xff0c;提醒你应该更换润滑油了。那么&#xff0c;我们应该怎样挑选滚珠螺杆的润滑油呢&#xff1f; 一般建议用轴承润…

hive整合es,详细过程。

参考官网 Apache Hive integration | Elasticsearch for Apache Hadoop [7.17] | Elastic 官网的介绍很简单&#xff0c;我看了很多博客&#xff0c;写的也很简单&#xff0c;但是我搞了半天才勉强成功&#xff0c;分享下&#xff0c;免得各位多走弯路。 环境准备 官网也很…

K8S暴露pod内多个端口

K8S暴露pod内多个端口 一、背景 公司统一用的某个底包跑jar服务&#xff0c;只暴露了8080端口 二、需求 由于有些服务在启动jar服务后&#xff0c;会启动多个端口&#xff0c;除了8080端口&#xff0c;还有别的端口需要暴露&#xff0c;我这里就还需要暴露9999端口。 注&a…

mysql常用时间相关函数

在我们平常开发的工作中&#xff0c;我们在数据库中经常会用到时间相关的函数&#xff0c;比如格式化当前时间&#xff0c;求当前时间或者计算某个特定间隔后的时间&#xff0c;那么我们主要会用到哪些函数呢&#xff1f; 1&#xff1a;求当前时间&#xff1a; select now();…

Gradle build 失败后提示.lock文件,解决办法

在Gradle build失败之后时&#xff0c;有时候强制关闭AndroidStudio&#xff0c;再次打开build时&#xff0c;会提示各种.lock 文件问题&#xff0c;删除了一个还有下一个&#xff0c;而且路径不一样。 一般情况下是这两个文件夹下的lockfile影响继续build %GRADLE_HOME%/ca…

YoLoV7做图像分类/目标检测过程(附代码+详细操作说明)

一、准备数据 图像在my_1imgs中&#xff0c;一个是原图jpg&#xff0c;一个是用labelimg画的标签xml文件。&#xff08;这个画的是一个矩形框&#xff09; 把自己的数据集&#xff08;原图和标签准备好后&#xff09;&#xff0c;这两个文件复制到VOCdevkit中,ImageSets为空。 …

EtherNet/IP转CAN网关can协议标准

生产管理设备中&#xff0c;会有设备与其他设备的协议不同&#xff0c;数据无法互通&#xff0c;让你的工作陷入困境。这时&#xff0c;一款神奇的产品出现了——远创智控YC-EIP-CAN通讯网关&#xff01; 1, 这款通讯网关采用ETHERNET/IP从站功能&#xff0c;可以将各种CAN总线…