使用多阶段和多尺度联合通道协调注意融合网络进行单图去雨[2022论文]

news2025/2/25 1:06:17

这是篇2022年来自一区的International Journal of Intelligent Systems的贵州大学的去雨论文

论文链接:百度网盘 请输入提取码 提取码:zdje

✍介绍

作者提出的问题:

1、目前去雨方法不能对不同密度和方向的雨条纹信息进行有效的编码

2、去除雨条纹的同时如何保持图像的细节不丢失

作者提出multi‐stage and multi‐scale joint channel coordinate attention fusion network (MMAFN)进行解决

总结来说:

1、使用两阶段的编解码网络来提取特征,第一阶段来提取粗略特征,第二阶段来整合并完善特征

2、joint channel coordinate attention block(JCCAB) 放置在两个网络中编解码层来编解码不同方向和密度的雨条纹特征

3、Multi‐level feature fusion (MLFF) block 利用注意力机制来防止图像细节丢失

4、Inception attention branch block (InceptionABB) 针对细雨条纹,融合不同尺度的相关信息

💪方法

网络是由两个编解码网络组成,对于每个阶段使用3 \times 3卷积来提取初始特征(对应流程图中Conv2d),然后JCCAB来提取每个维度(通道维度和空间维度)的有用信息,并使用InceptionABB来提取多尺度特征,跳连接依然使用JCCAB处理特征映射,并在两个编解码网络之间引入MLFF块来将第一阶段网络提取的特征给第二阶段,来丰富特征信息并补偿多次下采样造成的信息损失。最后通过一个3\times 3卷积来获得输入图像的残差输出。

JCCA block(JCCAB)

设计目的:被用于在网络的编解码部分来提取特征

Joint channel coordinate attention (JCCA)

通过引入位置信息,可以消除具有不同密度,大小和方向的雨水条纹。JCCA对通道关系和位置信息进行编码,分两个步骤即多通道注意融合位置信息嵌入

多通道注意力融合

由多个不同大小的卷积内核输出的特征图的通道信息,采用类似于CAB模块的设置,受SKNet启发。

位置信息嵌入

设计了一个位置注意模块来准确捕捉雨点的位置信息,使用全局平均池对水平和垂直维度中的特征进行编码,生成水平和垂直方向的特征图。这两种变换在保持精确位置信息的同时,捕获了两个不同方向上的长距离依赖关系,有助于网络更准确地定位不同方向的雨点(可解释性好)。使用1\times1卷积恢复出原通道数,并通过BN和Sigmoid进行激活

JCCA的最终输出:

F_{\text {out }}=X \times \delta(B(\hat{P})) \times \delta(B(\tilde{P}))

Inception attention branch block (InceptionABB)

JCCAB虽然能编码不同方向和密度的雨条纹,但是忽略了小的雨条纹。

设计目的:采用多尺度融合的思想来聚合上下文信息来处理细小的雨条纹。

提出的InceptionABB模块设计,使用DBB从不同的尺度上提炼和整合相关信息。JCCAB聚焦于信息量最大的有用尺度信息,增强网络的判别学习能力。下面的DBB被用来帮助更详细地表达多尺度雨纹信息。此外,在跳越连接中使用了一个大小为1的卷积核,实现了多尺度信息的逐步融合,有效地防止了梯度的消失。

diverse branch block(DBB)

 

不同大小的卷积核分支的效果要优于相同大小的卷积核分支,受InceptionNet启发,将网络变宽而不是变深。

Multi ‐ level feature fusion (MLFF)

设计目的:保留图像的背景细节,同时删除雨纹。在两级网络之间,融合了两级网络的特征,进一步细化了从第一级网络提取的特征。

 MLFF将第一阶段的编码和解码部分,第二阶段的编码部分作为输入,参考CSFF模块。融合信息经过DBB模块丰富特征信息。

优点:加入注意力机制来捕获融合有效部分,融合机制可以弥补多次下采样细节的丢失。

Loss function

 👉实验结果

采用MPRNet的多数据集训练方法

定量和定性结果

 

 

 

目标检测

 

 

消融实验

 


如果觉得对你有帮助的话:

👍 点赞,你的认可是我创作的动力!

⭐️ 收藏,你的青睐是我努力的方向!

👄 评论,你的意见是我进步的财富!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2583.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

ThreadLocal类详解

ThreadLocal类注释翻译 打开JDK中ThreadLocal类源码,翻译类上注释如下(提取重点部分): 每个访问ThreadLocal实例对象的线程都有其自己的关于ThreadLocal对象的变量副本(通过get和set方法),只要线程存活而且ThreadLocal对象也存活,则线程都保…

嵌入式和单片机开发模式的区别

一、 开发模式 单片机开发多为裸机,程序规模小,多为单个程序员独立开发。有些复杂产品也会使用高端单片机如STM32之类,并使用RTOS(uCOS、freeRTOS等)。嵌入式开发几乎全部基于嵌入式操作系统,目前使用最多的是 linux 和Android。…

公众号搜题接口系统使用方法

公众号搜题接口系统使用方法 本平台优点:免费查题接口搭建 多题库查题、独立后台、响应速度快、全网平台可查、功能最全! 1.想要给自己的公众号获得查题接口,只需要两步! 2.题库:题库后台http://daili.jueguangzhe.c…

html实现飞机小游戏(源码)

文章目录1.思路讲解1.1 游戏设计1.2 主界面1.3 倒计时进入游戏1.4 游戏效果1.3 游戏结束2.实现源码2.1 游戏动态效果2.2 游戏主代码2.3 源码目录源码下载作者:xcLeigh 文章说明 html实现飞机大战源码,酷炫的界面效果,有四款飞机大战背景&…

Elasticsearch:通过热、温、冷和冻结层管理数据自动化 — 无需编码!

如果你想完全按照本文标题的建议去做,那就别无所求。 这篇文章旨在指导如何使用 Kibana Dashboard 的 “堆栈管理(Stack Management)” 功能集通过热、温、冷和冻结层自动移动数据,而无需进行任何编码或执行命令行动作。 在下面的…

Cookie 和 Session

本文主要讲解一下 Cookie 和 Session 的关系和区别,大家都知道 Session 比 Cookie 安全,Session 是存储在服务器端的,Cookie 是存储在客户端的,然而更详细的说,恐怕就不太清楚了 文章目录1. 什么是 HTTP2. Cookie2.1 图…

​目标检测算法——YOLOv5/YOLOv7改进之结合Criss-Cross Attention

关注”PandaCVer“公众号 深度学习Tricks,第一时间送达 (一)前沿介绍 论文题目:CCNet: Criss-Cross Attention for Semantic Segmentation 论文地址:https://arxiv.org/pdf/1811.11721.pdf 代码地址:ht…

B树和B+树(平衡多路查找树)

文章目录为什么需要B树B 树的特点B树的查找B树的引入B树的删除链接:https://www.cs.usfca.edu/~galles/visualization/Algorithms.html 可以点击 Indexing 下的 B Trees 和 B Trees 去学习。 为什么需要B树 对 B 树的需求随着访问物理存储介质(如硬盘&…

【Java】反射, 枚举,Lambda表达式

✨博客主页: 心荣~ ✨系列专栏:【Java SE】 ✨一句短话: 难在坚持,贵在坚持,成在坚持! 文章目录一. 反射1. 反射的概述2. 反射的使用2.1 反射常用的类2.2 通过反射获取Class对象2.3 获得Class类相关的方法2.4 使用反射创建实例对象2.5 使用反射获取实例对象中的构造方法2.6 通过…

Spring学习第1篇:学习spring必备的概念知识

大家家好,我是一名网络怪咖,北漂五年。相信大家和我一样,都有一个大厂梦,作为一名资深Java选手,深知Spring重要性,现在普遍都使用SpringBoot来开发,面试的时候SpringBoot原理也是经常会问到&…

纸牌博弈问题

纸牌博弈问题 作者:Grey 原文地址: 博客园:纸牌博弈问题 CSDN:纸牌博弈问题 题目描述 有一个整型数组 A,代表数值不同的纸牌排成一条线。玩家 a 和玩家 b 依次拿走每张纸牌, 规定玩家 a 先拿&#xff…

win11开机音效设置的方法

微软为win11重做了开机音效,与我们一直以来使用的开机音效不太一样,听起来很不舒服,因此我们可以通过设置开机音效的方法来修改它,只要在个性化设置中就可以找到了,下面一起来试试看吧。 win11开机音效怎么设置&#…

wordpress图片压缩插件-免费批量wordpress图片压缩

wordpress图片压缩插件,相信每个人都知道图片的太大会影响到网站的加载速度。过多的图像会对服务器产生相应的压力。导致网站打开会越来越慢。而图片也是会被搜索引擎收录的,可以在百度图片里面能搜索的到,也算是增加了网站的宣传力度。今天给…

(附源码)计算机毕业设计SSM基于微信平台的匿名电子投票系统

(附源码)计算机毕业设计SSM基于微信平台的匿名电子投票系统 项目运行 环境配置: Jdk1.8 Tomcat7.0 Mysql HBuilderX(Webstorm也行) Eclispe(IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持)。…

【微信小程序支付功能】uniapp实现微信小程序支付功能

支付实现流程 首先前端写一个页面,简单说就是有一个输入支付金额的 然后有一个按钮,点击可以支付。 点击按钮后触发支付方法,就是我下面写的这些代码,复制就可以了。 然后先请求后端的一个方法,把你的价格还有openid之…

在Vue中使用Swiper轮播图、同时解决点击轮播图左右切换按钮不生效的问题、同时将轮播图抽离出为一个公共组件

轮播图左右的切换按钮、如果点击没有反应,控制台也没有报错。很大可能是版本问题。如果不指定版本信息、默认安装的是最新的版本。版本过高或者过低都有可能导致无效。目前兼容性和稳定性比较好的是:5.4.5。 官网地址:https://www.swiper.com…

【隧道应用-1】netsh端口映射内网

1、端口映射 是指将一台主机的内网(LAN)IP 地址映射成一个公网(WAN)IP 地址,当用户访问提供映射端口主机的某个端口时,服务器将请求转移到本地局域内部提供这种特定服务的主机;利用端口映射功能…

猿创征文|程序员的浪漫(代码猜诗词)

✅作者简介: 全栈领域新星创作者,阿里云专家博主,华为云云享专家博主,掘金后端评审团成员, 💕前言:在大众的认知里,程序员只是一群坐在电脑前熬夜敲代码的…

webrtc 笔记

webrtc主要步骤 navigator.mediaDevices.getUserMedia({audio:true,redio:true}) 获取用户的摄像头状态,返回媒体流,把媒体流赋给video的srcObject属性,就能在页面上展示自己的音视频 let peer new RTCPeerConnection(servers) 创建peer实例,通过这个实例的一系列方法实现p2p…

vue3 :一个实用的 vite + vue3 组件库脚手架工具

目录 1 组件库脚手架内容 2 组件库脚手架技术栈 3 使用说明 3.1 克隆代码到本地 3.2 安装依赖 3.3 本地开发 3.4 创建新组件 3.5 构建文档 3.6 构建 example 3.7 发布组件库 4 组件库命令说明 无论是 vue2 全家桶还是 vue3 vite TypeScript,组件库的使…