Feature Corrective Transfer Learning (2024CVPR)

news2025/1/13 13:12:51

Feature Corrective Transfer learning Framework (特征矫正迁移学习框架)

旨在引导非理想图像上的模型训练与理想图像上训练的模型的特中层更紧密地对齐

在这里插入图片描述

Model Selection and Training on Ideal Images

首先在理想图像上训练,得到理想参数
θ ideal = arg ⁡ min ⁡ θ L det ( M ( D ideal ; θ ) ) \theta_{\text{ideal}} = \arg \min_{\theta} \mathcal{L}_{\text{det}}(M(D_{\text{ideal}}; \theta)) θideal=argθminLdet(M(Dideal;θ))
M是目标检测模型

Generation of Non-Ideal Image Versions

对于每一个 x ∈ D i d e a l ,合成产生一个非理想图像 x ′ (如雨天),可以通过添加噪声做到。 对于每一个x \in D_{ideal} ,合成产生一个非理想图像x'(如雨天),可以通过添加噪声做到。 对于每一个xDideal,合成产生一个非理想图像x(如雨天),可以通过添加噪声做到。

Training the Same Object Detection Model on Non-Ideal Images

在非理想图像上训练M,同样使用对应的理想图像作为验证集。在这一阶段,一个或多个特征层将会被用来评估理想图像上训练的模型和非理想图像上训练的模型的相似性
$$
\theta_{\text{non_ideal}} = \arg \min_{\theta} \left( \mathcal{L}{\text{det}}(M(D{\text{non_ideal}}; \theta))

  • \lambda \mathcal{L}{\text{fs}}(F{\text{ideal}}, F_{\text{non_ideal}}) \right) \
    F_{idal} 和 F_{non_ideal} 分别代表理想图像的特征图和非理想图像的特征图, \lambda 用来平衡两个损失
    $$
Incorporating Feature Similarity Loss during Backpropagation

L = L d e t + λ L f s θ = arg ⁡ min ⁡ θ L t o t a l \mathcal{L} = \mathcal{L}_{det} + \lambda\mathcal{L}_{fs} \\ \theta = \arg \min_{\theta}{\mathcal{L}_{total}} L=Ldet+λLfsθ=argθminLtotal
特征相似性损失Lfs旨在有效地衡量在理想图像上训练的模型特征图与在非理想图像上训练的模型特征图在结构和内容上的差异。值得注意的是,特征空间中的相似性可能与图像相似性存在显著差异,因此需要一个不同的评估指标。本文引入了Extended Area Novel Structural Discrepancy Loss (EANSDL)来评估特征级别的相似性。

Method

Training on Ideal Images

先在理想图像上进行训练
θ i d e a l = arg ⁡ min ⁡ θ L F a s t e r − R C N N ( D i d e a l ; θ ) \theta_{ideal} = \arg \min_{\theta}\mathcal{L}_{Faster-RCNN}(D_{ideal};\theta) θideal=argθminLFasterRCNN(Dideal;θ)

Feature Corrective Transfer Learning

非理想图像上训练的backbone由以下损失引导
t o t a l = L d e t ( D n o n i d e a l ; θ ) + λ L E A N S D L ( F i d e a l , F n o n i d e a l ) L E A N S D L 用来表示特征图之间的相似性 \mathcal{total} = \mathcal{L}_{det}(D_{non_ideal};\theta) + \lambda\mathcal{L}_{EANSDL}(F_{ideal},F_{non_ideal}) \\ \mathcal{L}_{EANSDL}用来表示特征图之间的相似性 total=Ldet(Dnonideal;θ)+λLEANSDL(Fideal,Fnonideal)LEANSDL用来表示特征图之间的相似性

EANSDL ( A , B , δ , r L ) = D ( δ ) ⋅ 1 W ⋅ H ∑ x = 1 W ∑ y = 1 H ( exp ⁡ ( − Δ S ( x , y ) ) ⋅ Δ S ( x , y ) + λ ⋅ Ω ( A , B , x , y , r L ) ) \text{EANSDL}(A, B, \delta, r_{\mathcal{L}}) = D(\delta) \cdot \frac{1}{W \cdot H} \sum_{x=1}^{W} \sum_{y=1}^{H} \left( \exp(-\Delta S(x, y)) \cdot \Delta S(x, y) + \lambda \cdot \Omega(A, B, x, y, r_{\mathcal{L}}) \right) EANSDL(A,B,δ,rL)=D(δ)WH1x=1Wy=1H(exp(ΔS(x,y))ΔS(x,y)+λΩ(A,B,x,y,rL))

δ = c u r r e n t e p o c h t o t a l e p o c h s \delta = \frac{current_epoch}{total_epochs} δ=totalepochscurrentepoch

时变衰减因子,引入了一种动态机制来调整整个训练期间损失函数的响应性,这一因素的实施促进了模型重点的方法转变,从纠正初始训练阶段的突出结构差异到在训练过程的后续阶段磨练更精细的细节。
D ( δ ) = e x p ( − α ∗ δ β ) α 调节衰变轨迹的初始陡度 , β 调节曲率以减缓衰减速度 D(\delta) = exp(-\alpha * \delta^\beta) \\ \alpha 调节衰变轨迹的初始陡度, \beta调节曲率以减缓衰减速度 D(δ)=exp(αδβ)α调节衰变轨迹的初始陡度,β调节曲率以减缓衰减速度
从根本上说,D(δ)使模型最初能够专注于纠正特征图之间的显著不匹配,确保建立坚实的基础。随着训练的进行和模型复杂性的演变,衰减因子减少了对这些失配的强调。这一修改有助于减少EANSDL对后期目标检测总损失的影响,从而更专注于目标检测的典型任务。

Gradient Computation Function

G()应用Sobel operator来描绘特征图上的边缘和结构属性。这个操作将特征图与两个不同的3*3核进行卷积,每个核都被设计维沿各自的方向挖掘边

在这里插入图片描述

垂直边缘通过水平梯度(Sobel-x)识别,而水平边缘(Sobel-y)则通过垂直梯度精确定位。通过合并这些正交梯度来确定总梯度幅度

在这里插入图片描述
在这里插入图片描述

Local Gradient Magnitude Difference

在这里插入图片描述

该指标量化了直接的结构差异,突出了由于非理想成像条件导致边缘和纹理信息显著不同的区域。从本质上讲,∆S(x,y)精确地指出了模型需要纠正的局部差异,以更好地对齐从非理想和理想场景中得出的特征图。
e x p ( − Δ S ( x , y ) ) 作为加权因子调节每个局部差异 Δ S ( x , y ) 对全局损失的影响 exp(-\Delta S(x,y))作为加权因子调节每个局部差异\Delta S(x,y)对全局损失的影响 exp(ΔS(x,y))作为加权因子调节每个局部差异ΔS(x,y)对全局损失的影响

当 e x p ( − Δ S ( x , y ) ) ∗ Δ S ( x , y ) 当exp(-\Delta S(x,y))*\Delta S(x,y) exp(ΔS(x,y))ΔS(x,y)

相乘,损失计算中的指数衰减函数放大了较小差异的影响,将模型的重点放在细化微小但本质的结构差异上。同时,它减轻了对较大差异的处罚,以避免对不太关键的差异进行不当处罚。该机制确保了平衡的模型训练,优先考虑早期阶段的主要差异以获得整体性能,并随着特征图差异的减少,在后期阶段转向更精细的调整,促进细微的结构对齐,以提高目标检测精度。

可以这样理解:
当差异过大, e − Δ S ( x , y ) → 0 当差异过大,e^{-\Delta S(x,y)} \to 0 当差异过大,eΔS(x,y)0
所以模型不会关注差异较大的,避免对不关键的差异进行不当处罚

Extended Area Gradient Consistency

Extended Area Gradient Consistency term,
Ω ( A , B , x , y , r L ) \Omega(A,B,x,y,r_{\mathcal{L}}) Ω(A,B,x,y,rL)
仔细检查指定区域内梯度过度的均匀性,从而评估更广泛的空间模式。它评估由半径rL定义的扩展领域内梯度变化的一致性。该半径针对Faster RCNN特征金字塔中的每一层进行自适应调整,从而实现多尺度分析:
Ω ( A , B , x , y , r ( L ) ) = 1 ( 2 r L + 1 ) 2 r L = r 0 2 l e v e l , r 0 是最大特征图的初始半斤 \Omega(A,B,x,y,r\mathcal(L)) = \frac{1}{(2r_{\mathcal{L}}+1)^2} \\ r_{\mathcal{L}} = \frac{r_0}{2^{level}} ,r_0 是最大特征图的初始半斤 Ω(A,B,x,y,r(L))=(2rL+1)21rL=2levelr0,r0是最大特征图的初始半斤
这种扩展的区域梯度一致性确保了模型不仅能捕捉到逐像素的差异,还能欣赏到更广泛的空间模式和对齐。这种多尺度方法对于鲁棒的对象检测至关重要,因为它允许模型识别和适应不同特征图尺度上对象大小和形状的变化。
∑ i = − r L r L ∑ j = − r L r L ∣ ( G ( A , x , y ) − G ( A , x + i , y + j ) ) − ( G ( B , x , y ) − G ( B , x + i , y + j ) ) ∣ . \sum_{i=-r_{\mathcal{L}}}^{r_{\mathcal{L}}} \sum_{j=-r_{\mathcal{L}}}^{r_{\mathcal{L}}} \left| (G(A, x, y) - G(A, x+i, y+j)) - (G(B, x, y) - G(B, x+i, y+j)) \right|. i=rLrLj=rLrL(G(A,x,y)G(A,x+i,y+j))(G(B,x,y)G(B,x+i,y+j)).

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1959290.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

NV170D语音芯片:为洗地扫地一体机带来新体验!

随着物联网、人工智能技术的飞速发展,家用电器的智能化转型已成为不可逆转的趋势。在这一背景下,洗地扫地一体机,作为家务自动化的先锋,融合了高效清洁与便捷操作的双重优势,而语音芯片的应用,更是为其增添…

使用 nvm在linux上安装多个版本的node

使用 nvm(Node Version Manager): nvm 是一个流行的 Node.js 版本管理工具,允许你安装和使用多个版本的 Node.js。 1、安装nvm wget -qO- https://raw.githubusercontent.com/nvm-sh/nvm/v0.39.1/install.sh | bash source ~/.nvm/nvm.sh2、…

javaEE(3)

目录 一. 前端浏览器保存用户信息 二. 前端路由导航守卫 三. 路由嵌套 四. web会话跟踪 1. web会话跟踪原理 2. JWT 2.1 传统的session认证 2.2 基于token的鉴权机制 2.3 jwt的构成 2.4 jwt搭建 五. 前端发送请求携带token 5.1 请求拦截器 六. 后端过滤器验证toke…

springboot合肥师范学院实习实训管理系统-计算机毕业设计源码31290

摘要 随着社会对高校毕业生的职业素养和实践能力要求不断提高,高校实习实训教育愈发受到重视。信息化技术的快速发展也为高校教学管理带来了新的机遇。合肥师范学院实习实训管理系统的研究就是源自当前高等教育对学生实习实训管理的需求。 实习实训管理系统充分利用…

手机录屏直播,教你3个方法,秒变录屏高手

在移动互联网飞速发展的今天,手机录屏直播已成为越来越多用户分享内容、交流心得的重要方式。无论是游戏高手展示高超技艺,还是教育从业者进行远程授课,手机录屏直播都能提供极大的便利。 在手机录屏的世界里,安卓手机和苹果手机…

深入分析 Android ContentProvider (九)

文章目录 深入分析 Android ContentProvider (九)ContentProvider 的高级使用及最佳实践(续)1. 复杂查询与联合查询复杂查询示例 2. 数据同步与一致性示例:使用事务确保数据一致性 3. 数据分页加载示例:分页加载数据 4. 内容提供者…

jmeter录制

1、添加代理服务器 添加方法:“测试计划”右键 -> 添加 -> 非测试元件 -> HTTP代理服务器 2、添加线程组 添加方法:“测试计划”右键->添加->线程(用户)->线程组 3、配置http代理服务器 (1&a…

电脑录屏软件带声音,3款软件推荐,一键录制

在今天,电脑录屏软件带声音的功能已经悄然改变了我们的学习、工作和娱乐方式。录屏软件,这个看似简单的工具,实则蕴藏着无穷的魅力。它不仅能够捕捉屏幕上的每一个细节,还能将声音完美地融入其中。无论是游戏中的背景音乐、会议中…

谷粒商城实战笔记-77-商品服务-API-平台属性-规格参数列表

文章目录 一,新增product/attr/base/list接口二,踩坑记录1. 使用 Lazy 注解2. 使用 PostConstruct 注解代码分析解决方案分析 这一节的主要内容是完成规格参数的列表查询功能。 一,新增product/attr/base/list接口 这个接口用来查询规格参数…

电力巡检红外热成像夜视手持终端有多强?

电力巡检红外热成像夜视手持终端在电力巡检中展现出强大的功能和应用价值。这些手持终端结合了红外热成像技术和夜视功能,能够在夜间或光线不足的环境下对电力设备进行精确的温度测量和状态监测。以下是对其强大之处的详细分析: 1. 精准的红外热成像能力…

【机器学习】正规方程的简单介绍以及如何使用Scikit-Learn实现基于正规方程的闭式解线性回归

引言 Scikit-learn 是一个开源的机器学习库,它支持 Python 编程语言。它提供了多种机器学习算法的实现,并用于数据挖掘和数据分析 文章目录 引言一、正规方程的定义二、正规方程的原理三、使用 Scikit-Learn 实现基于正规方程的闭式解线性回归3.1 工具3.…

爬虫“拥抱大模型”,有没有搞头?

验证码坐标识别 数据采集过程中,可能会碰到各种风控策略。其中,验证码人机验证是较为常见的,点选类验证码需要识别出相应的坐标,碰到这种情况,一般要么自己训练模型,要么对接打码平台。现在也可以将识别工…

RocketMQ事务消息机制原理

RocketMQ工作流程 在RocketMQ当中,当消息的生产者将消息生产完成之后,并不会直接将生产好的消息直接投递给消费者,而是先将消息投递个中间的服务,通过这个服务来协调RocketMQ中生产者与消费者之间的消费速度。 那么生产者是如何…

领夹麦哪个牌子音质好?直播采访十大公认音质好的麦克风!

在追求内容品质的今天,音频质量成为了衡量作品成功与否的关键指标之一。对于频繁出镜的互联网从业者、短视频创作者及直播达人而言,一款性能卓越的无线领夹麦克风无疑是提升专业形象的得力助手。它不仅轻便易携,更能在复杂环境中捕捉纯净、清…

[QT开发_音乐播放器项目笔记01]

目录 一:常用类 26 QByteArray 是 Qt 框架中的一个类,用于处理字节数组。它提供了动态大小的字节数组,可以用于存储和操作二进制数据,比如文件内容、网络数据等。 QT项目记录: 一:常用类 26 QByteArray…

capl代码写法

CAPL是一种专门用于构建通信系统测试脚本的编程语言,全称为"Communication Access Programming.Language"。 CAPL是一种类C语言的解释性脚本语言,常用于CAN和LIN总线等通信系统的开发和测试中。 CAPL提供了丰富的库函数和API,可以用…

【Spring Cloud】Sleuth +Zinkin 实现链路追踪并持久化的解决方案

文章目录 前言链路追踪介绍Sleuth入门Sleuth介绍TraceSpanAnnotation Sleuth入门1、引入依赖2、修改配置文件3、网关路由配置4、演示 Zipkin的集成ZipKin介绍ZipKin服务端安装Zipkin客户端集成1、添加依赖2、添加配置3、访问微服务4、演示 Zipkin数据持久化使用mysql实现数据持…

vue3.0学习--创建项目,基于vite创建

vite 官网地址:https://cn.vitejs.dev/guide/ 1,执行创建命令 npm create vitelatest 2, cd my3d ---- my3d 是创建的项目名字 3,npm install ---- 安装需要的插件包 4,npm run format ---- 通常用于代码格式化 5, npm…

【Docker】Docker 的背景

一、容器技术发展史 1、Jail 时代 容器不是一个新概念或者新技术,很早就有了,只是近几年遇到了云计算,整个技术被彻底引爆了。 (1)1979 年贝尔实验室发明 chroot chroot 系统调用是在 1979 年开发第 7 版 Unix 期间…

Java多重循环控制,break,continue,return

目录 1.多重循环控制 执行步骤分析 案例演示 2.跳转控制语句-break 基本介绍 基本语法 示意图 注意事项和细节说明 练习题 3.跳转控制语句-continue 基本介绍 基本语法 示意图 细节案例分析和说明 4.跳转控制语句-return 介绍 1.多重循环控制 执行步骤分析…