跨域小样本系列4:finetune方法解决CDFSL

news2024/9/22 5:36:20

来源:投稿 作者:橡皮
编辑:学姐

带你学习跨域小样本系列1-简介篇

跨域小样本系列2-常用数据集与任务设定详解

跨域小样本系列3:元学习方法解决CDFSL以及两篇SOTA论文讲解

跨域小样本系列4:finetune方法解决CDFSL以及两篇SOTA论文讲解(本篇)

跨域小样本系列5:除此之外一些奇门异路的论文讲解

finetune方法解决CDFSL以及两篇SOTA论文讲解

主要贡献:

  • 作者提出了一种新的方法来解决以前的不精确梯度匹配问题,该方法通过对目标样本的不精确梯度进行学习来显著减少不精确梯度匹配。值得注意的是,本文提出的梯度差异最小化是一种广义的学习损失,可以很容易地应用于其他UDA范式。

  • 为了计算目标样本的梯度,作者采用了基于聚类的策略来获得更可靠的伪标签。然后,采用基于伪标签的自监督学习方法,利用源域数据和目标域数据对模型进行微调,以减少模糊目标样本的数量。

  • 作者用上述提出的方法重新改进了原来普通的双分类器对抗框架,并在三个开放的大规模数据集上进行了广泛的实验。实验结果证明了该方法的优越性。

1.框架概述

源域样本和目标域样本都经过生成器G和两个分类器F1和F2。然后利用监督损失最小化源域样本的分类误差。我们使用自监督机制来减少模糊目标样本的数量。对抗性损失的极小极大过程用于检测源域支持之外的目标样本。梯度差异损失进一步用于对齐分布,提高目标样本的精度。

2.算法细节

3.实验结果

收敛性。为验证本文方法的收敛趋势,在图4(a)中报告了源样本的分类损失,该损失是在分类器F1上获得的。图4(b)描绘了训练过程中目标样本的精度曲线。这是C→ I以ImageCLEF为例。数据表明,随着迭代次数的增加,本文方法可以显著减少损失,提高精度,这证明了训练过程是平滑收敛的。

超参数敏感度。本文框架涉及两个超参数α和β,梯度差异损失构成了本文的主要新方法贡献,而自监督损失被用作辅助损失,因此作者将α固定为0.1,根据经验发现α取该值时性能较好。然后将β取值由0逐渐为5,如图5(a)所示。当β在0到1之间时,准确度没有明显下降,当β大于1时,由于梯度差异损失的权重大于源样本上监督学习损失的权重,准确度开始下降。一般来说,本文模型对参数不敏感。

消融实验。为了测试每个模块的有效性,分别在没有自监督学习和梯度差异最小化的情况下进行了实验。如图5(b)所示,与普通双分类器对抗式学习相比,这两个模块都可以显著提高精度,并且当它们一起工作时,模型的性能更好。

CVPR 2022 Oral

  • 该研究首次将布朗距离协方差 (BDC) 这一基于概率统计的相似性度量引入深度学习中。

  • 提出了一种端到端的小样本识别方法 DeepBDC,可适用于不同的小样本学习框架。同时,该研究结合两种不同范式的小样本学习框架对 DeepBDC 进行了实例化,即基于原型网络框架的 Meta DeepBDC 和基于简单迁移学习框架的 STL DeepBDC。

  • 提出的方法在包括一般目标识别、细粒度分类和跨域分类等任务的 6 个标准数据库上都取得了当前最好的性能。

1. 模型概述:

BDC (布朗距离协方差)理论最早是 Gábor 等人建立的,可以表示为随机变量之间的联合特征函数和其边缘分布的乘积之间的欧式距离:

连续表达:

离散表达:

BDC测度的优异特性:1)非负,当且仅当XY独立时等0 2)它可以表征X和Y之间的线性和非线性相关性。3)它对X和Y的单独平移和标准正交变换是不变的,对它们各自的比例因子是相等的。

将该过程实现为一个独立的模块,用于计算每张图像高层卷积特征的 BDC 矩阵。且由于 BDC 矩阵的大小为输入卷积特征维度的二次方,因此为了控制输出维度,该研究引入了一个 1×1 的卷积层进行降维。

计算欧式距离平方矩阵-开平方得到欧式距离矩阵-对距离矩阵减去行均值,列均值以及总体均值得到BDC矩阵.

2.测试设定

如图a所示,Meta DeepBDC 是在 ProtoNet 架构的基础上构建的,通过对支持集图像得到的 BDC 表达进行平均得到了每一类的原型表达,通过计算查询集图像的 BDC 表达和每一类原型表达之间的内积,获得与每类之间的距离,从而进行类别判断。在实验环节,该研究评估了几种不同的获取原型表达的方式。

STL DeepBDC 基于一个典型的迁移学习框架 Good-Embed,使用大量的标注数据进行训练,获得一个更好的基础模型用来得到图像的嵌入特征。在新的类别空间里,通过线性层或者回归器对得到的嵌入特征进行学习,得到一个分类器用于识别。如图b所示,该研究将BDC矩阵当作输入图像的嵌入特征送到尾部的分类器中进行学习,利用交叉熵损失函数进行网络的优化。

3.实验结果

本文中该研究在通用识别任务 miniImageNet 和 tieredImageNet,以及细粒度识别任务 CUB上进行了评估。

在跨域任务上,该研究以 miniImageNet 为源域,以三个细粒度数据集 CUB,Cars,Aircraft 为目标域进行跨域评估。将 miniImageNet 作为训练集,分别在目标域数据集上进行测试。

点击下方卡片关注《学姐带你玩AI》🚀🚀🚀

180+篇经典论文讲解视频+代码数据集免费领

码字不易,欢迎大家点赞评论收藏!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/343249.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

通付盾汪德嘉——设备指纹的尽头是分布式数字身份

作者简介:汪德嘉,美国威斯康星大学麦迪逊分校数学博士、九三学社社员、正高级工程师;时空码发明者,《身份危机》与《数字身份》专著作者;曾在ORACLE、VISA、IBM等企业部门负责总体设计、产品开发,2011年归国…

深度学习训练营_第P3周_天气识别

🍨 本文为🔗365天深度学习训练营 中的学习记录博客🍦 参考文章:Pytorch实战 | 第P3周:彩色图片识别:天气识别**🍖 原作者:K同学啊|接辅导、项目定制**␀ 本次实验有两个新增任务&…

信息论绪论

本专栏针包含信息论与编码的核心知识,按知识点组织,可作为教学或学习的参考。markdown版本已归档至【Github仓库:information-theory】,需要的朋友们自取。或者关注公众号【AIShareLab】,回复 信息论 也可获取。 文章目…

「2」线性代数(期末复习)

🚀🚀🚀大家觉不错的话,就恳求大家点点关注,点点小爱心,指点指点🚀🚀🚀 方阵的行列式 (1) |A^T||A|(2) |&#x1d6…

树莓派 安装 宝塔linux面板5.9. 2023-2-13

​​​​​​​ 一.环境 1.硬件环境: 树莓派3b , 8GB tf卡 ,micro usb电源 2.网络环境: 网线直连路由器 , 可访问互联网 3.软件环境: 树莓派操作系统 CentOS-Userland-7-armv7hl-RaspberryPI-Minimal-2009-sda(linux) 系统刻录工具 Win32DiskImager (win) ip扫描工具 Adv…

Github 上如何提交 pull request

什么是复刻(forking)? 我们可以通过复刻操作将喜爱的仓库保存自己的Github账户中,以便独立地对其进行操作。 通过复刻,我们可以得到包含完整版本历史的目标仓库的实例,之后可以对复刻得到的仓库进行任意操作而不会影响…

iTOP3588开发板直连电脑配置方法(无线上网)配置主机IP

首先使用网线连接好主机和开发板,在没有上电的情况下,可以看到以太网显示网络电缆 被拔出,如下图所示: 当开发板上电以后,开发板网卡与笔记本电脑的网卡会连接,如下图所示: 然后右键点击以太网…

MY2480-16P语音模块的使用

MY2480-16P语音模块的使用开发环境:STM32CUBEMXKEIL5辅助软件:串口助手、迅捷文字转语音一、MY2480-16P语音模块引脚图及引脚定义二、选择触发方式三、使用串口控制MY2480-16P语音模块四、模块使用指南开发环境:STM32CUBEMXKEIL5 辅助软件&a…

Python解题 - CSDN周赛第28期

上一期周赛问哥因为在路上,无法参加,但还是抽空登上来看了一下题目。4道题都挺简单的,有点遗憾未能参加。不过即使参加了,手速也未必能挤进前十。 本期也是一样,感觉新增的题目都偏数学类,基本用不到所谓的…

Buffer Status Reporting(BSR)

欢迎关注同名微信公众号“modem协议笔记”。 以一个实网中的异常场景开始,大概流程是有UL data要发送,UE触发BSR->no UL grant->SR->no UL grant->trigger RACH->RACH fail->RLF->RRC reestablishment:简单描述就是UE触…

Jmeter压测说明

Jmeter使用说明Jmeter下载安装修改编码UTF-8参数说明Get接口测试创建线程组添加HTTP请求添加结果树添加聚合报告启动POST请求添加HTTP信息头管理器设置参数图片上传mysql压测准备数据添加数据库连接jar配置jdbc添加jdbc requestJmeter下载安装 Jmeter官网下载 要求java 1.8以上…

MACD指标在外汇交易中的另类运用方法

外汇交易中怎么另辟蹊径的使用MACD指标 随着外汇市场的不断发展和变化,交易者们不断探索新的方法和技术指标,以提高自己的交易技巧和赢利能力。其中,MACD指标是广大交易者们喜欢使用的一种技术分析工具,它可以帮助交易者判断价格的…

SQL注入Getshell的奇思妙想(上)

前言 前段时间,hvv和找实习的师傅们也多了起来。而我也不例外,尝试投递了不少简历,结果是积累了大量的面试经验。笔者发现大量的hr面试官都喜欢从SQL注入开始询问,所以留心了一下关于SQL注入的问题的频率。结果非常amazing啊&…

传统企业数字化转型,到底难在哪里?

数字化转型过程中面临最大的挑战和问题是什么?这篇整理了企业在数字化转型过程中普遍面临的9大问题和挑战以及如何解决这些问题,希望能够对各位企业数字化转型有多启发和帮助。 01 企业数字化转型三大现状 在梳理企业数字化转型问题之前,我想…

C++数据结构 —— 二叉搜索树

目录 1.二叉搜索树的基本概念 1.1二叉搜索树的基本特征 2.二叉搜索树的实现 2.1数据的插入(迭代实现) 2.2数据的搜索(迭代实现) 2.3中序遍历(递归实现) 2.4数据的删除(迭代实现) 2.5数据的搜索(递归实现) 2.6数据的插入(递归实现) 2.7数据的删除(递归实现) 2.8类的完…

元宇宙开始告别以资本为主导的野蛮生长,新的竞争格局和态势将形成

欲要成为这样一场洗牌的胜利者,元宇宙的玩家需要真正站在商业的角度,而非资本市场的角度来看待元宇宙,来寻找元宇宙的正确的发展模式和方法。原因在于,在这样一场洗牌过程当中,仅仅只是对于以往以资本为主导的发展模式…

Web自动化测试——selenium篇(二)

文章目录一、浏览器相关操作二、键盘操作三、鼠标操作四、弹窗操作五、下拉框选择六、文件上传七、错误截图一、浏览器相关操作 浏览器窗口大小设置 driver.manage().window().maximize();//窗口最大化 driver.manage().window().minimize();//窗口最小化 driver.manage().wi…

【GD32F427开发板试用】01适配RTX4+调试组件Event Recorder

本篇文章来自极术社区与兆易创新组织的GD32F427开发板评测活动,更多开发板试用活动请关注极术社区网站。作者:汪阳 感谢极术社区和兆易创新组织的开发板试用活动。收到开发板有一周多了,因为工作关系好久没有折腾MDK了,上手浪费的…

教你文本生成图片——stablediffusion

今天来点轻松的话题,带大家玩一个用文字生成图片的模型。相信大家如果关注AIGC领域,对文本生成图片,对Stablefiffusion、DEALL.E应该不陌生。今天给大家介绍的就是基于SD2 finetune出来的一个模型()这篇文章不会教大家…

ArcGIS中基于网格实现可视化

1 数据来源介绍 土地利用数据、高程数据、植被指数数据均来源于中国科学院资源环境科学与数据中心(https://www.resdc.cn/)。 2 数据预处理 我们从中国科学院资源环境科学与数据中心官网上下载下来的土地利用栅格数据是整型的,我们可以利用…