【论文阅读笔记】Split frequency attention network for single image deraining

news2024/11/14 19:02:40

1.论文介绍

Split frequency attention network for single image deraining
用于单幅图像去噪的分频注意力网络
Paper Code
2023年 SIVP

2.摘要

雨纹对图像质量的影响极大,基于数据驱动的单图像去噪方法不断发展并取得了巨大的成功。然而,传统的卷积神经网络只能隐式地对频域特征进行建模,而离散余弦变换(DCT)可以看作是对频域特征的显式建模。因此,我们提出了一种分裂频率注意力,以改善内部相关性的输入特征在频域的DCT。我们选择前K个低频分量作为DCT层的输出,在频域恢复出高质量的图像,而分裂机制使网络聚焦于信息丰富的区域,保持了恢复图像细节的保真度。在几个数据集上的实验表明,我们的方法取得了更好的结果比最近的最先进的方法。

Keywords:频域,去噪,图像恢复

3. Introduction

雨条纹降低了从相机捕获的图像,大多数高级别的户外视觉任务需要清晰的图像,并且由于下雨场景,这些方法通常表现不佳。因此,研究者们提出了许多处理降雨图像的算法。大多数方法忽略了图像的结构信息,并且由于不能保持图像细节和结构的保真度而破坏了纹理细节。由于分裂注意力通过对输入特征图进行分裂和分类,使网络专注于具有丰富信息的区域。分裂注意力通过改善输入特征的内部相关性,保持了图像细节的保真度和图像结构的一致性。因此,我们采用了分裂注意力的方法来恢复降雨图像。

综上所述,我们提出了一个分裂频率的注意力网络用于单图像去噪。首先,我们提出了一个分裂频率注意(SFA),以改善内部相关性的输入特征在频域的DCT。在此基础上提出了一种分裂频率注意块(SFAB)算法,从图像的丰富信息区域中提取特征,使恢复后的图像保持了图像细节和结构的保真度。最后,提出了一种分裂频率注意组(SFAG)级联的端到端网络,恢复雨图像。

4.网络结构介绍

网络结构如下图,主要包含四个模块:预处理模块、分裂频率注意力特征提取、动态特征增强(DFE)模块和重建模块。预处理模块包含一个3 × 3卷积层和两个下采样层,大大降低了GPU的内存消耗。使用分裂频率注意组来提取深度特征。然后利用两个DFE模块融合更多的空间信息,增强了变换能力。对称地,重建模块包含两个上采样层和一个3 × 3卷积层,用于恢复特征的大小和输出恢复的图像。mixup操作用于连接下采样层和上采样层。
在这里插入图片描述

频域学习

根据二维离散余弦变换(DCT),频谱可按下式计算:在这里插入图片描述
其中 x ∈ R H × W x ∈ R^{H×W} xRH×W表示输入,H和W分别是输入的高度和宽度。基函数 B h , w i , j B^{i,j}_{h,w} Bh,wi,j为:
在这里插入图片描述
相应地,可以通过下式从频谱f中恢复x:
在这里插入图片描述
如果假设h、w =0,则:
在这里插入图片描述
f 0 , 0 d c t f^{dct}_{0,0} f0,0dct表示2D DCT的最低频率分量,并且它与全局平均池化(GAP)成比例。

当使用GAP时,仅保留最低频率信息。将GAP推广到2D DCT的更多频率分量,并使用2D DCT的多个频率分量压缩更多信息。设X为输入特征图,分配2D DCT分量来压缩通道注意力的结果,并定义:
在这里插入图片描述
[ui vi ]是对应于X的频率分量2D索引,并且Freqi是压缩向量。在信道注意之后,DCT层的输出被定义为:
在这里插入图片描述
其中sigmod是激活函数,fc表示诸如一维卷积或全连接层的映射函数,并且Freq是具有不同2D DCT分量的整个压缩向量:
在这里插入图片描述
其中K是前K个低频分量,根据先前的工作,低频分量更适合CNN。

就是介绍了一下二维离散余弦变换和逆变换:
在这里插入图片描述
然后根据频域信号,只提取低级特征,即i=0、1、……K-1的信号,把它们连接在一起然后形成Freq。

分离的网络

由于受感受野的限制,CNN缺乏交互性和相关性,所以提出了一种分裂网络,通过对特征进行分裂和分类来提高输入特征的内部相关性,并从信息丰富的区域中提取特征,使恢复后的图像保持图像细节和结构的保真度。在分裂网络和频率关注度的基础上,设计了一种基本的分块分裂频率关注度(SFA)来构建去盲网络。

分频注意
如下图所示,在SFA中,输入特征图沿通道轴沿着分成m个部分。以 X ∈ R W × H × C X ∈ R^{W×H×C} XRW×H×C为输入特征图,利用3 × 3卷积得到 X 1 ∈ R W × H × C 1 X_1 ∈ R^{W×H×C_1} X1RW×H×C1,其中C1=mC,然后利用逐元素求和运算融合这些分裂。跨多个分裂的元素求和可以融合组合表示。

然后将融合特征f ∈ RW×H×C通过一个DCT层得到X2 ∈ RW×H× C,然后采用两个1 × 1卷积层得到X3 ∈ RW×H×C和X4 ∈ RW×H×C1,然后使用r − softmax操作增强来自丰富区域的信息,然后将特征再次分类为m个分裂。然后将每个分裂乘以前一个分裂,最后再次使用逐元素求和运算以获得输出特征。结构如下:
在这里插入图片描述

分裂频率注意块(SFAB)是基于SFA设计的。SFAB由若干个1 × 1卷积层、批归一化(BN)、校正的线性激活函数(ReLU)和SFA。
在这里插入图片描述

使用跳过连接来增强细节信息。然后利用SFAB和SFA建立分裂频率注意群(SFAG)。在SFAG中,输入特征被分成两条路径,一条是SFA,另一条是几个SFAB,两个结果融合生成输出:
在这里插入图片描述
其中G(·)由几个SFAB和一个3×3卷积层组成。
在这里插入图片描述

动态特征增强

通常,在卷积层中使用固定网格内核。具有固定网格内核的卷积不能提取结构化信息。提出了具有动态和灵活内核的可变形卷积以利用结构化信息。两个可变形卷积层被用作动态特征增强(DFE),以从丰富区域捕获更重要的信息。

混接

在浅层中捕获的低级特征可以通过短连接传递到更深层,并且可以增强图像的细节信息。但是深度网络表现出了不受欢迎的行为,如鲁棒性和记忆,并且提出了一种mixup操作。混淆很简单,它可以增加神经网络的鲁棒性我们应用mixup来连接下采样层和上采样层,并且下采样层中的细节信息可以与更深的上采样层中捕获的高级特征融合。第二下采样层的输出与第一上采样的输出混合,并且第一下采样层的输出与第二上采样的输出混合。混合操作定义为:
在这里插入图片描述
其中fmix是输出,α是在训练期间学习的参数,f↓是来自下采样层的特征,f↑表示来自上采样层的特征图。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1527300.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

7大结构型设计模式

结构性设计模式是软件工程中常用的一类设计模式。 作用:主要用于处理类或对象之间的组合以实现更灵活、可扩展和可维护的代码结构。 这些模式通常涉及到类和对象之间的静态组合关系,以及如何将它们组织在一起以满足特定的设计目标。 结构型模式有&#x…

git设置别名及查看别名

设置别名 git config --global alias.lg "具体的参数"git config --global alias.lg "log --dateformat:%Y/%m/%d %H:%M:%S --prettyformat:%C(yellow)%h%C(reset) %C(bold blue)%ad%C(reset) %an %C(green)%s%C(reset)"查看别名 git config --list | fi…

新能源汽车小三电系统

小三电系统 新能源电动汽车的"小三电"系统,一般指车载充电机(OBC)、车载 DC/DC 变换器,和高压直流配电盒(PDU)。一辆纯电动汽车一般配备一台OBC 和一台车载 DC/DC 变换器。OBC将外部输入的交流电转化为直流电输出给电池,DC/DC衔接…

数据可视化实战(二)

将每个城市在每个月份平均PM2.5绘制成折线图 import pandas as pd import matplotlib.pyplot as plt df pd.read_excel(./PM2.5.xlsx)display(df.head(10)) df.shape # (161630, 15)城市年份月份日期小时季节PM2.5露点湿度压强温度风向累计风速降水量累计降水量0北京2010112…

总结mac下解决matplotlib中文显示问题的几种方法

一、前言: 使⽤matplotlib画图时,由于matplotlib默认没有中⽂,显⽰中文时会出现空⽩⼩⽅块。 二、方法: 2.1 matplotlib中使用SimHei字体 1)进入终端后查看matplotlib的字体路径: $ python >>&g…

机器学习-04-分类算法-04-支持向量机SVM

总结 本系列是机器学习课程的系列课程,主要介绍机器学习中分类算法,本篇为分类算法与SVM算法部分。 本门课程的目标 完成一个特定行业的算法应用全过程: 懂业务会选择合适的算法数据处理算法训练算法调优算法融合 算法评估持续调优工程化…

Qt5.14.2 深入理解Qt多线程编程,掌握线程池架构实现高效并发

在高并发的软件系统中,多线程编程是解决性能瓶颈和提高系统吞吐量的有效手段。作为跨平台的应用程序开发框架,Qt为我们提供了强大的多线程支持。本文将深入探讨Qt多线程编程的实现细节,并介绍线程池的设计思想,帮助读者彻底掌握Qt…

Pytorch常用的函数(七)空洞卷积详解

Pytorch常用的函数(七)空洞卷积详解 1 初识空洞卷积 1.1 空洞卷积与语义分割任务 语义分割面临的困境: 与检测模型类似,语义分割模型也是建立是分类模型基础上的,即利用CNN网络来提取特征进行分类。在CNN分类模型中,一般情况下…

鸿蒙开发 一 (一)、框架了解

一、UI框架 开发范式名称 语言生态 UI更新方式 适用场景 适用人群 声明式开发范式 ArkTS语言 数据驱动更新 复杂度较大、团队合作度较高的程序 移动系统应用开发人员、系统应用开发人员 类Web开发范式 JS语言 数据驱动更新 界面较为简单的程序应用和卡片 Web前端…

2025张宇考研数学基础36讲,视频百度网盘+PDF

一、张宇老师全年高数体系(听课用书指南) 25张宇全程: docs.qq.com/doc/DTmtOa0Fzc0V3WElI 复制粘贴在浏览器上打开,就可以看到2025张宇的全部的啦! 一般来说我们把考研数学划分为3-4个阶段,分别是基础阶…

详解基于快速排序算法的qsort的模拟实现

目录 1. 快速排序 1.1 快速排序理论分析 1.2 快速排序的模拟实现 2. qsort的模拟实现 2.1 qsort的理论分析 2.2 qsort的模拟实现 qsort函数是基于快速排序思想设计的可以针对任意数据类型的c语言函数。要对qsort进行模拟实现,首先就要理解快速排序。 1. 快…

【物联网应用】基于云计算的智能化温室种植一体化平台

目录 第一章 作品概述 1.1. 作品名称 1.2. 应用领域 1.3.主要功能 1.4.创新性说明 第二章 需求分析 2.1 现实背景 2.2 用户群体及系统功能 2.3 竞品分析 第三章 技术方案 3.1. 硬件组成与来源 3.2. 硬件设计合理性 3.3. 硬件系统设计图 3.4. 接口的通用性与可扩展性 3.5. 代码规…

【已解决】在pycharm终端无法激活conda环境,但在cmd命令行中可以

一、问题描述 在windows下winr启动cmd命令行,可以成功运行conda命令并且激活环境在pycharm中打开Terminal终端,发现无法运行conda和pip命令,报错环境无法激活 无法在管道中间运行文档: D:\software\Anaconda3\condabin\conda.bat。 所在位置…

uniapp+vue3+setup语法糖开发微信小程序时不能定义globalData的解决方法

在使用 uniapp 开发小程序的时候, 发现使用了setup 语法糖 ,定义 globalData 时,要不是定义不了, 要不就是使用 getApp()取不到,后来想到一个不伦不类的方法解决了, 这个方法有点难看, 但是解决…

云手机的数据安全有保障吗?

随着移动互联网的迅速发展,云手机作为一种新兴的移动终端技术,正在逐渐受到人们的关注和应用。然而,对于云手机而言,数据安全问题一直是人们关注的焦点之一。本文将探讨云手机的数据安全性,并分析其是否具备足够的保障…

每周编辑精选|微软开源 Orca-Math 高质量数学数据集、清华大学研究团队发布条件去噪扩散模型 SPDiff...

Orca-Math 是微软研究院发布的数学推理模型,该模型展示了较小的专业模型在特定领域的价值,它们可以匹配甚至超越更大模型的性能。微软近期开源了用于训练 Orca-Math 的 Orca-Math-200K 数学单词问题数据集,现已在 hyper.ai 官网提供下载&…

记录对NSIS的一些微调 实现Electron安装包美化

利洽科技-nsNiuniuSkinUI - NSIS 实现了electron 的安装包美化,免费,便捷。 下面我整理了一些关于它的微调,使其安装卸载更加简单快捷。 1. 默认展示安装路径部分 (1)将moreconfiginfo标签visible 设置为 true&#…

const,static深度总结——c++穿透式分析

前言;c类和对象的知识点中除了几种默认函数, 比较重要的还有使用const和static修饰成员相关知识点。const在c中特性很简单。 但是在使用中, 比较容易疏忽大意出现问题。 static特性也很简单, 但是比起const来要直接的多。 在使用中…

PHP-小皮创建php网站中遇到的问题及解决方案—我耀学IT

一、安装 1.1 在学习php时我们需要用到的软件有两个,一个时vscode,一个就是小皮面板(phpstudy) 1.2 vscode安装直接从官网下载,根据系统下载对应的版本,例如:windows64、linux等;同…

智慧城市中的智慧生活:便捷、舒适与高效

目录 一、智慧城市中的智慧生活概述 二、智慧生活带来的便捷性 1、智慧交通的便捷出行 2、智慧购物的轻松体验 3、智慧政务的一站式服务 三、智慧生活带来的舒适性 1、智慧环境的绿色宜居 2、智慧医疗的健康保障 3、智慧教育的均衡发展 四、智慧生活带来的高效性 1、…