【论文导读】Causality Inspired Representation Learning for Domain Generalization

news2024/12/24 22:10:12

Causality Inspired Representation Learning for Domain Generalization 阅读笔记_1100dp的博客-CSDN博客Causality Inspired Representation Learning for Domain Generalization 阅读笔记https://blog.csdn.net/qq_44901656/article/details/127341310这一篇讲的不错,主要看博客就行,我的为了放一下实验部分的翻译

4. 实验 

4.1. 数据集 

Digits-DG[64]包含四个数字域,包括MNIST[18]、MNIST-M[7]、SVHN[36]和SYN[7],它们在字体风格、背景和笔画颜色方面存在巨大的差异。按照[64],我们为每个领域的每个类别随机选择600张图像,然后将80%的数据用于训练,20%的数据用于验证。

PACS[20]是专门为DG提出的,它包含来自四个领域(艺术-绘画、卡通、照片和素描)的9,991张图片,风格差异很大。在每个领域中,有7个类别:狗、大象、长颈鹿、吉他、房子、马和人。为了进行公平的比较,使用了[20]提供的原始训练-验证分割。

Office-Home[58]是一个办公室和家庭环境中的物体识别数据集,它收集了65个类别的15,500张图像。这65个类别由四个领域(艺术、剪贴画、产品和真实世界)共享,这些领域在视角和图像风格上有所不同。按照[63],每个领域被分成90%用于训练,10%用于验证。

4.2. 实施 

详细情况 按照常用的 "留一域 "协议[20],我们指定一个域作为评估的未见目标域,用其余域进行训练。对于Digits-DG,所有的图像都被调整为32×32,我们使用迷你批次SGD优化器从头开始训练网络,批次大小为128,动量为0.9,权重衰减为5e-4,共50个epochs。而学习率每20个epochs衰减0.1。至于PACS和Office-Home,所有图像都被调整为224×224。该网络使用迷你批次SGD从头开始训练,批次大小为16,动量为0.9,权重衰减为5e-4,共50个epochs,学习率在总epochs的80%时衰减0.1。对于超参数κ和τ,它们的值是根据源验证集的结果来选择的,因为目标域在训练期间是不可见的。具体来说,我们为Digits-DG和PACS设置了κ=60%,而为Office-Home设置了κ=80%。所有的结果都是基于三次重复运行的平均精度报告的。更多细节在补充细节中给出。

4.3. 实验结果 

表1列出了Digits-DG的结果,其中CIRL在平均准确率方面击败了所有的比较基准。请注意,CIRL超过了基于领域变量表示的方法CCSA[34]和MMD-AAE[22],差距很大,分别为8.0%和7.9%,这表明了挖掘数据和标签之间内在因果机制的重要性,而不是表面的统计依赖。此外,我们还将CIRL与FACT[63]进行了比较,因为我们的因果干预模块也采用了同样的增强技术。值得一提的是,FACT是DG社区中相当先进的方法,1.0%的性能提升是很有挑战性的。而CIRL比FACT有1.0%的改进,这进一步验证了我们方法的有效性。

表2和表3分别报告了基于ReNet-18和ResNet-50的PACS的结果。可以看出,在所有被比较的方法中,CIRL在两个骨干网中都获得了最高的平均准确率。具体来说,与同样将因果关系引入DG问题的MatchDG[32]相比,CIRL在ResNet-18和ResNet-50上以1.76%和4.01%的较大优势优于MatchDG。因为CIRL明确地根据更多的理论表述来学习因果表征,而不是以隐性的方式。也存在CIRL表现相对较差的情况,这可能是由于任务的性能相当饱和,如照片任务,或由于不良的图像质量,如包含受损因果信息的噪声样本。然而,我们仍然在这些任务上取得了第二好的成绩,而且我们的整体表现超过了其他的任务。总的来说,令人鼓舞的结果证明了我们在CIRL中的因果关系重建技术的优越性。

表4总结了基于ResNet-18的Office-Home的结果。更多的类别和样本使得Office-Home成为比PACS更具挑战性的领域概括基准。在这个具有挑战性的基准上,CIRL仍然取得了67.12%的最佳平均性能,以0.56%的优势超过了FACT[63]。这些改进进一步证明了CIRL的功效。

4.4. 分析性 

实验消融研究。我们讨论了CIRL中因果干预(CInt.)模块、因果分解(CFac.)模块和对抗性掩码(AdvM.)模块的影响。表5列出了以ResNet-18为骨干的PACS数据集上CIRL的不同变体的结果。比较变体1、2和变体3,我们可以发现,结合CInt.和CFac.模块的性能要好得多,这表明仅从非因果因素中分离出表示或使维度独立并不足以很好地对因果因素进行建模。此外,变体4比变体2的性能有所提高,这意味着AdvM.模块有助于将更多的信息集成到用于分类的表示中。最后,CIRL表现最好,表明这三个模块相互补充,相互促进,其中没有一个模块是卓越的概括能力所不可或缺的。
视觉解释。为了直观地验证CIRL学习的表征可以模拟因果关系的说法,我们利用文献[52]中的可视化技术,提供了基线(即DeepAll)和CIRL方法的最后卷积层的注意力图。结果显示在图4中。我们可以看到,与基线方法相比,CIRL学到的表征更多的是类别相关的。以长颈鹿为例,它的长脖子可以被看作是分类的因果因素之一,这一点被CIRL准确地捕捉到了。而基线侧重于非因果因素(例如,类似于鬃毛的纹理),这导致了错误分类。更多的可视化结果在补充材料中给出。

因果表征的独立性。图5a和5b显示了任务草图上各维度表征之间的独立程度。具体来说,我们使用∥C∥2 F - ∥diag(C)∥2 2作为度量,较小的值表示较好的独立性,其中C是第3.2.2节中的相关矩阵。很明显,在ResNet-18和ResNet-50上,基线方法的独立性都很差,而CIRL的独立性随着训练历时的增加而增加,最后在稳定后达到了很高的程度。这些结果证明了我们设计的因果分解模块的功效,它允许我们学习的表征可以作为因果因素的模拟。

表征的重要性。理想情况下,我们希望表征的每个维度都能具有重要意义,涉及尽可能多和有利的因果信息,使整个表征在因果上足以用于分类。受[11]的启发,我们利用分类器第一层的权重来估计每个表征维度的这种重要性。请注意,我们对每个维度的权重进行了破坏性的归一化,即(x-min)/(max-min)来处理规模问题。由于维度的数量很大,我们在表6中显示了所有维度的重要性的平均值和标准偏差。可以看出,MatchDG[32]和CIRL呈现出较高的表示法重要性,因为它们将真正影响分类的因果信息嵌入表示法中。此外,CIRL达到的最高平均值和最低标准差表明,我们学习的表征的每个维度都很重要,这进一步显示了CIRL的优越性。

参数敏感度。图5c和5d显示了CIRL对超参数τ和κ的敏感性。具体来说,τ的值从{1.0, 2.0, 3.0, 5.0, 10.0}变化,而κ从{0.5, 0.6, 0.7, 0.8, 0.9}变化。可以看出,在广泛的超参数值下,即5.0≤τ≤10.0和0.5≤κ≤0.6,以ResNet-18或ResNet-50为骨干,CIRL都取得了有竞争力的性能,这进一步验证了我们方法的稳定性。

5. 结论

本文指出了统计学知识的不足,并提出了DG的因果观。其主要思想是重构因果因素,挖掘内在的因果机制。然后,我们提出了一个框架CIRL来学习因果表征,它可以根据我们强调的理想属性来模仿因果因素。全面的经验证明了CIRL的有效性和优越性。考虑到相关工作的主流一般都是基于变量之间的统计依赖性,我们希望我们的工作能够给这个社区带来一些启示。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/466768.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

业内常用即时传输网盘

工具名称 业内常用即时传输网盘 功能简介 无需登录,短时间内有效,多用于传输小型敏感文件 外部链接 请见文内 内部网盘链接 在线站点,无网盘链接 使用说明 许多安全行内人士在团队内互传敏感文件时,为实现上传和下载文件…

【Hugging Face】Hugging Face 主要类和函数介绍

Hugging Face 主要类和函数介绍 Hugging face是什么?什么是自然语言处理?PipelineDatasetPipeline on GPUMetricsAutoClasses在本地保存和加载模型结论参考资料 本文旨在为初学者介绍Hugging Face的主要类和函数,包括Pipeline, Datasets, Met…

Python小姿势 - Python学习笔记:如何使用Python创建一个简单的计算器

Python学习笔记:如何使用Python创建一个简单的计算器 在本教程中,我们将学习如何使用Python创建一个简单的计算器。我们将学习如何使用Python的内置函数input()和print(),以及如何使用Python的运算符来完成这个项目。 首先,让我们…

HBase(1):简介

1 Hadoop 从 1970 年开始,大多数的公司数据存储和维护使用的是关系型数据库大数据技术出现后,很多拥有海量数据的公司开始选择像Hadoop的方式来存储海量数据Hadoop使用分布式文件系统HDFS来存储海量数据,并使用 MapReduce 来处理。Hadoop擅长…

全国计算机等级三级网络技术试卷详解(二)

请点击↑关注、收藏,本博客免费为你获取精彩知识分享!有惊喜哟!! 1. 下列属于广域网QoS技术的是() A) RSVP B) PSTN C) MSTP D) ISDN 属于广域网QoS技术的是RSVP。目前宽带城域网保证服务质量QoS要求…

SpringCould+Vue3-Element-Admin 登录接口,用户信息接口以及Token验证的实现【VegePig教育平台】

文章目录 一.SpringCouldVue3-Element-Admin 登录接口,用户信息接口以及Token验证的实现【VegePig教育平台】1.1 背景1.2 数据库 二、登录接口及其Token实现2.1 前端2.2 后端2.2.1 控制层2.2.2 service层2.2.3 工具类:CreateJwt2.2.4 Dao-Mapper 三、用户…

Android NDK 开发入门学习

android ndk技术早已经不是什么新的技术,但是由于工作中没有涉及到,所以一直没有尝试,今天抽空了解学习一下,顺便记录一下,方便后续回顾,由于是刚学习,很多资料也是网上找的,写的不对…

Docker 容器学习【1】

1.容器概述 1.1什么是容器 容器是一种沙盒技术,主要目的是为了将应用运行在其中,与外界隔离;及方便这个沙盒可以被转移到其它宿主机器。本质上,它是一个特殊的进程。通过名称空间(Namespace)、控制组&…

vivo 推送系统的容灾建设与实践

作者:vivo 互联网服务器团队 - Yu Quan 本文介绍了推送系统容灾建设和关键技术方案,以及实践过程中的思考与挑战。 一、推送系统介绍 vivo推送平台是vivo公司向开发者提供的消息推送服务,通过在云端与客户端之间建立一条稳定、可靠的长连接…

BI实施项目干系人分析案例

最近有在学项目管理,做了个项目干系人分析的小案例 项目背景:BI决策报表实施项目,主要为了甲方公司高层及经理做一些决策报表。 1.识别项目干系人 项目组主要成员: 乙方:王某(技术leader)&am…

关于小波,Morlet,Grossmann,Meyer,Daubechies,Mallat

转自:未来数学家,向大佬致敬。 匈牙利电子工程师丹尼斯加博尔(Dennis Gabor)1946年提出加窗傅里叶变换,开创了在时间-频率平面上分析信号的方法,Gabor还发明了全息摄影术,这项工作让他获得了19…

Clickhouse的数据副本协同原理详解(借助ZK实现)

Clickhouse的数据副本协同原理详解(借助ZK实现) 文章目录 Clickhouse的数据副本协同原理详解(借助ZK实现)Clickhouse数据副本副本的特点 ReplicatedMergeTree原理解析数据结构Zookeeper内的节点结构元数据判断标识操作日志 Entry日…

【AXU3EG】Zynq UltraScale平台启动引导过程

Zynq UltraScale MPSoC(16nm) 的核心是两个 CPU 模块: 应用处理单元(APU):四核 ARM Cortex-A53,适合于 Linux 和裸机应用程序。实时处理单元(RPU):双核 ARM …

Unity 高级程序员应该具备怎样的能力?要怎样成长为 Unity 高级程序员?

如何从零基础小白成长为 Unity 高级程序员?【全篇学习内容免费!快来白嫖】 高能预警,下文包含从零基础新手到高级程序员一站式技术学习、学习方法、心态等内容,供各个阶段的同学进行参考。 从零基础到高级程序员 上干货 话不多说…

MySQL——存储过程和函数从零基础到入门必学教程(涵盖基础实战)

文章目录 目录 文章目录 前言 一、创建存储过程 二、在存储过程中使用变量 1.定义变量 2.为变量赋值 三、光标的使用 1.打开光标 2.打开光标 3.使用光标 4.关闭光标 四、流程控制的作用 1.IF语句 2.CASE语句 3.LOOP语句 4.LEAVE语句 5.ITERATE语句 6.REPEAT语…

碳酸氢锂硫酸锂溶液除钙镁

#碳酸氢锂硫酸锂溶液除钙镁 随着新能源汽车快速发展,以粗Li2CO3(85-98%)和工业级Li2CO3(98.5-99.0%)为原料制备高纯电池级Li2CO3(99.5-99.9%)的工艺的突破,显得尤为重要,正越来越受到人们的关注。 粗Li2CO3…

智能排班系统

大家好,我是csdn的博主:lqj_本人 担任本次比赛的队长,这是我的个人博客主页: lqj_本人的博客_CSDN博客-微信小程序,前端,python领域博主lqj_本人擅长微信小程序,前端,python,等方面的知识https://blog.csdn.net/lbcyllqj?spm1011…

安全技术交底大全

交底内容得过大,过宽,不要造成土建结构缺陷。02)管路敷设完后应立即进行保护其他工种在操作时应注意不要将管子砸扁和踩坏。(3)在碎板,加气板上别洞时,注意不要剔断钢筋,剔洞时应先用钻打孔,再护孔&#xf…

visual stdio c++调用python混合编程

visual stdio2019 c调用python混合编程 1.Python环境的搭建 关于环境创建可以参考https://blog.csdn.net/qq_36559788/article/details/123174309 这里python我用的是anaconda里的python38,并且没有debug库,所以我只用了release库 在vs中设置项目属性…

谈谈JVM的垃圾回收机制

目录 1. 死亡对象的判断算法 1.1 引用计数算法 1.2 可达性分析算法 2. 垃圾回收算法 2.1 标记——清除算法 2.2 复制算法 2.3 标记——整理算法 2.4 分代算法 1. 死亡对象的判断算法 对于支持垃圾回收机制的编程语言来说,常见的死亡对象的判断方法有引用计数…