【多尺度密集递归融合网络:超分】

news2024/9/25 11:22:25

A novel image super-resolution algorithm based on multi-scale dense recursive fusion network

(基于多尺度密集递归融合网络的图像超分辨率算法)

随着卷积神经网络(CNN)技术的成熟度,超限分辨的图像重建(SR)方法基于CNN正在蓬勃发展,取得了许多显著的成果。毫无疑问,SR已经成为图像重建技术的主流方向。然而,大多数现有的SP方法提高重建的性能通过增加网络的深度,也增加参数的数量,数量的网络计算和困难的训练网络。为了解决随机共振中的性能复杂度问题,提出了一种多尺度稠密递归融合网络(MSDRFN)。该网络由三部分组成:初始特征提取模块、多尺度稠密融合分组模块和递归重建模块。具体地,首先通过浅层特征提取模块提取粗特征,然后将粗特征输入到多尺度密集融合块(MSDFB)组。每个MSDFB充分利用不同大小卷积核中的图像特征获得不同的层次特征,并将这些输出特征输入到信道关注机制中学习其对应的权重。所有MSDFB输出将通过递归重建模块恢复为高分辨率图像。此外,网络通过残差学习来补充信息损失,这体现在一个长跳连接和多个短跳连接上。

介绍

图像超分辨率重建(SR)可以提高计算机视觉应用中的图像和视频质量。SR将观察到的低分辨率图像或视频转换为相应的高分辨率图像或视频。这样的图像处理技术对于目标检测、医学成像、卫星遥感和其他应用是重要的。然而,图像SR是多解问题,因为在低分辨率(LR)图像和其对应的高分辨率(HR)图像之间存在多个映射。当上采样因子较大时,难以获取用于恢复SR的高频信息。在这种情况下,SR必须通过图像的一些先验知识来发现LR和HR图像之间的内在相互作用。可以通过基于CNN的深度学习来学习描述LR和HR图像之间的内在交互的非线性映射。
尽管现有的基于CNN的SR模型已经取得了相对较好的结果,但是它们的训练受到大量参数和计算的阻碍。大部分研究都集中在结构和算法较为复杂的深度网络上,没有考虑不同层次的特征,浪费了大量的时间和存储空间。
为了有效解决复杂度问题,本文提出了一种多尺度稠密递归融合网络(MSDRFN),可以实现图像的超分辨率重建。与现有的基于神经网络的随机共振方法相比,该模型在不消耗过多计算资源和时间的前提下提高了图像重建性能。该方法的特点是充分利用了不同尺度下的卷积核,并在网络中嵌入多尺度稠密融合块(MSDFB)以提取更多的信息。此外,对于大量具有冗余信息的要素,1×1卷积核进行降维,去除冗余特征,获取有用信息。最后,通过递归重建模块将所有MSDFB的输出恢复为高分辨率图像。利用残差学习来补充信息损失,并将细节特征和轮廓特征相结合,形成丰富的特征。总之,我们建立了一个具有三尺度卷积特征提取分支和多个残差学习结构的MSDRFN。该方法使用减少数量的参数以令人满意的性能实现单个图像的超分辨率重建。

贡献

1)提出了一种新的平衡两阶段结构的MSDFB,该结构利用残差学习、多尺度深度递归融合和信道注意机制在网络中的信息流动中发挥作用。
2)学习图像的层次特征信息,利用递归思想将每个层次特征连接到图像重构模块,适当平衡了图像重构性能、计算资源和时间。
3)在MSDFB群的基础上,提出了一种新的MSDRFN网络,该网络不同于大多数现有方法,直接从LR图像中提取特征,并利用多个MSDFB提取最有用的信息。
4)多个亚像素卷积递归重建网络(SpCRNets)用于恢复分层特征。增加了HR图像特征的数量,达到了更好的重建效果。我们提出的MSDRFN上级其他SR方法。

相关工作

Image super-resolution based on CNN

大多数现有SR方法分为三类:插值法、重建法]和学习法。基于插值的算法是一种相对简单、复杂度较低的图像重建方法,但其有效性有限,且图像中的高频细节不易修复,导致重建过程中计算复杂、图像模糊、实时性差。因此,基于插值的方法不适合具有大放大因子的图像重建(例如×3和×4)。
基于卷积神经网络(CNNs)的深度学习技术已经克服了这个问题。在深度学习中,使用CNN的主动学习优于其他方法。2014年,Dong等人引入了第一个基于CNN的SR方法,称为SRCNN,该方法使用3层CNN直接学习从LR到HR图像的端到端映射。尽管SRCNN优于以往的方法,但SRCNN中的插值会引入噪声,影响网络性能。随着网络层次的加深,网络速度变慢,网络训练难度加大。Dong等人的工作引发了对具有深度学习的SR方法的极大兴趣。基于SRCNN的两个相对浅的网络是快速超分辨率CNN(FSRCNN)和高效亚像素CNN(ESPCN)。两种网络在速度和准确性上都优于SRCNN。FSRCNN通过采用更少参数的更快模型和放大图像的去卷积层来改进SRCNN。因此,网络可以输入非插值的小图像。ESPCN提出了一种亚像素卷积上采样方法,通过通道数扩展和像素点重排实现图像放大。
这些浅网络不能满足重建性能的要求。此后,连续开发的基于CNN的模型克服了上述网络的局限性,其中大多数模型通过深化网络来改善性能。2016年,研究学者分别提出了两种非常深的神经网络,表示为VDSR和DRCN。两种网络均采用全局残差学习(GRL),并通过深度神经网络获得了成功的SR。人们可能认为深度CNN是图像SR的必要条件,GRL可以减轻训练深度,但不能消除多参数问题。为了减少参数的数量,Tai等人提出了一种深度递归残差网络(DRRN),它共享在深度网络中扩散的参数。他们还加入了局部残差学习,减轻了图像信息通过深度网络时的损失。为了获得大倍数(大于8倍)的上采样因子,Lai等人设计了一个金字塔结构的网络模型,记为LapSRN。LapSRN结构的每一级仅产生原始图像的两倍放大的结果。EDSR是赢得NTIRE2017锦标赛挑战的超分辨率方案。如文中所述,对EDSR模型进行了改进,主要是去除了一些冗余模块,提高了模型的通用性。
但这些方法大多没有充分利用LR图像的特征信息,而是通过加深网络来提高性能。随着网络层数的增加,图像特征信息会在传输过程中逐渐消失。现阶段,如何充分利用网络中已有的特征,已成为高质量图像重建的关键问题。这个问题已经被两个具有多尺度卷积模块的网络解决,即级联交叉网络(CMSC)和多尺度残差网络(MSRN)。CMSC以由粗到细的方式捕获图像中的高频细节信息,而MSRN通过重构多尺度残差块来恢复高质量图像。
一些研究者提出了深度反投影网络(Deep Back-Projection Networks,DBPN),构造了相互依赖的上下采样模块。每个采样模块代表不同的图像退化和高分辨率分量。Qin等人提出了一种深度自适应双网(Deep Adaptive Dual-network,DADN)双向SR网络,其中网络的一个分支被训练用于聚焦简单图像区域,另一个分支被训练用于处理硬图像区域。2020年,Liu等人在中提出了两种轻量级、有效的图像超分辨率网络,分别称为基于注意力的多尺度残差网络(AMSRN)和改进的双尺度残差网络(IDSRN)。这两种网络主要是基于注意机制的多尺度特征捕获方法。但它们没有考虑层次特征信息。不久之后,Zhang等人充分利用了残差分支的层次特征,将多个残差块合并在一起,通过加入跳跃连接来促进每个残差分支特征的前向传播。
上述许多方法都存在一些问题。由于HR和LR图像之间潜在的较大分布差异,影响了信息利用的有效性。为了解决这一问题,Lu等人提出了基于参考的图像超分辨率(MASA)网络的匹配加速和空间自适应,其中设计了两个新模块来解决这些问题。匹配提取模块采用由粗到细的相应匹配方案,大大降低了计算成本。空间自适应模块学习LR和HR图像的分布差异,并以空间自适应的方式将特征分布重新映射为LR特征分布。该方案使得网络在处理不同参考图像时具有鲁棒性。
最近,Li等人提出了一种区域感知的对抗学习策略,以引导模型专注于纹理区域细节的自适应生成。Lu等人提出了一种新的高效超分辨率变换器(ESRT),用于快速和准确的图像超分辨率。ESRT是一种混合变压器,其中基于CNN的SR网络被设计在前端以提取深层特征。面对多域图像超分辨率,Rao等人提出了一种深度超分辨率残差StarGAN,这是一种新颖的、可扩展的方法,仅使用单个模型就可以对多个LR域的LR图像进行分辨率。Ahn等人[64]介绍了一种神经结构搜索(NAS)方法,以实现结构构建过程的自动化。他们将NAS扩展到了超分辨率领域,发现了一个轻量级的、高密度连接的网络,称为DeCoNASNet,并定义了一个基于复杂性的惩罚来解决图像的超分辨率问题。Villar-corrales等人认为,一些算法可能会在上采样步骤中放大噪声,并且通常无法从低分辨率图像的噪声版本重建高分辨率图像。因此,他们提出了一种联合去噪和超分辨率的方法。Tran等人[66]提出了一种基于学习的方法,应用于3D核线图像(EPI)以重建高分辨率。该方法通过两阶段超分辨率框架,有效地解决了各种超分辨率问题,提高了高分辨率EPI体的质量。Sun等人提出了加权多尺度残差网络,以更好地平衡SR性能和计算效率。Liu等人提出了一种基于多尺度特征融合的交叉卷积边缘检测方法,用于定位和表示超分辨率图像的边缘特征。因此,他们提出了一种联合去噪和超分辨率的方法。Tran等人[66]提出了一种基于学习的方法,应用于3D核线图像(EPI)以重建高分辨率。该方法通过两阶段超分辨率框架,有效地解决了各种超分辨率问题,提高了高分辨率EPI体的质量。Sun等人提出了加权多尺度残差网络,以更好地平衡SR性能和计算效率。Liu等人提出了一种基于多尺度特征融合的交叉卷积边缘检测方法,用于定位和表示超分辨率图像的边缘特征。

Residual learning

Feature extraction block

为了避免训练过程中梯度的消失或爆炸,He等人提出了一种带残差块的学习框架(图2(a)),保留了大量重要的输入信息。初始块(图2(b))的主要作用是使用不同大小的卷积核从图像中提取更丰富的特征。密集块(图2©)用于单一大小的卷积核。通过致密块后,网络深度增加,增加量为致密块的厚度乘以致密块的数量。Zhang和Tian 提出了一种由残差块和稠密块组成的残差稠密块(图2(d)),它充分提取了局部和全局特征。请添加图片描述

Channel attention

当面对图像时,人眼可以快速扫描全局图像并找到需要关注的目标,并聚焦于关键目标区域,而选择性地忽略其他非关键目标区域。生活中也存在这种现象。人的眼睛总是首先关注需要注意的物体,其他无关的物体会被忽略。鉴于人类视觉的这种能力,研究人员希望计算机也能拥有这种形式的注意力,能够从海量数据中选择对眼前目标更有价值的信息,并持续关注。
2018年,Hu等人引入了挤压激励网络,通过学习各通道对图像的贡献度自适应地调整通道权重。同年,Zhang等人将残差网络与信道注意机制相结合,提出了残差信道注意网络(residual channel attention,RCAN)。为了消除无用信息,网络计算不同信道分量之间的相关性,将相关性作为权值分配给初始信道,并使用残差学习来补充网络的信息损失。实验表明,信道注意机制可以提高网络图像处理的性能。

方法

Network model architecture

现有的基于神经网络的模型虽然在一定程度上满足了性能要求,但模型中参数和计算量大,浪费了较多的时间和存储空间,极大地阻碍了模型的训练。目前的研究主要集中在结构复杂的深层网络上,没有考虑不同层次的特征。为了有效解决超分辨率图像重建的复杂性问题,提出了一种多尺度稠密递归融合网络(MSDRFN),该网络能够在不消耗过多计算资源和时间的前提下提高图像重建的性能。
该方法的独特之处在于提出了一种新的平衡两阶段MSDFB算法,该算法利用残差学习、多尺度深度递归融合和信道注意机制在网络信息流中发挥作用。通过学习图像的层次特征信息,利用递归连接将每个层次特征链接到图像重建模块,合理平衡图像重建的性能和计算资源与时间。图3示出了所提出的网络的架构,该网络输入LR图像并输出HR图像。该网络由三个主要图像处理模块组成:初始特征提取模块、多尺度稠密融合分组模块和递归重建模块。请添加图片描述
Initial feature extraction module:从原始输入LR,使用3×3卷积核捕获初始特征映射P1在这里插入图片描述
Multi-scale dense fusion group module:使用多个多尺度密集融合块从初始特征中提取丰富的特征。因此,我们有在这里插入图片描述
请添加图片描述

Recursive reconstruction module:为了充分利用深度学习提高图像分辨率,我们提出了一种如图4所示的重建模块,称为亚像素卷积递归重建网络(SpCRNet),它采用1×1卷积层和亚像素卷积层,可以学习不同层次的信息特征。将多尺度融合块中学习到的特征图 P 1 P^1 P12 P k P^k Pk2 P N P^N PN2,C1分别输入SpCRNet的相应子模块,得到更好的图像。然后,融合重构模块得到的所有层次特征。最后,通过双三次插值将初始图像与在此阶段获得的高分辨率图像相加,并将结果作为网络的最终输出。该阶段简单地实现为:在这里插入图片描述

Multi-scale dense fusion block

本小节描述具有三个不同尺度卷积核的MSDFB的完整分支(图5)。MSDFB采用局部残差学习、多尺度密集融合和信道注意机制来获取特征信息。MSDFB分为两部分:多尺度特征提取、挤压和激励机制。在这里插入图片描述
Multi-scale feature extraction:如图5所示,该部分由两个结构相同的多尺度卷积相位组成。在每个阶段中,不同尺度的三个卷积核(7×7、5×5、3×3)并行排列进行特征提取。在每个并行路径中,第二层卷积核之后是LReLU。总体上,利用跳连接将初始特征与这一阶段提取的特征进行融合,获得多尺度特征信息。MSDFB输入和输出表示为Sn-1和Sn组成。第一阶段的实施情况如下:在这里插入图片描述
同样,我们可以得到:
在这里插入图片描述
其中A、B和D分别表示3的三个分支的中间结果7×7、5×5和3×3卷积运算。C表示与A连接的特征;B和D; W和b分别表示神经元的权重和偏置。E1表示通过1×1卷积运算。这些符号的下标和上标分别表示卷积核的层位置和大小。M表示多尺度特征提取的输出。f(·)LReLU函数。LReLU负域的斜率设定为0.05。方程式(15)以及(22)表示级联操作。在这里插入图片描述
Squeeze and excitation mechanism:该部分用于根据损失学习特征图通道的权值,使得有效特征图的权值显著,无效特征图的权值较小。整个MSDFB表示多尺度密集融合特征,不仅提供丰富的上下文信息,而且学习通道的权重。
第二部分具体实现如下:在这里插入图片描述

Training and loss functions

当训练网络时,通常的优化目标是均方误差(MSE),其预测所获得的HR图像与真实的HR图像之间的差异。实际上,MSE返回的是许多可能场景的平均值,因此输出图像在视觉上是模糊的和不可靠的。平均绝对误差(MAE)较好地反映了预测误差的实际情况。因此,我们采用MAE作为优化目标函数。此外,为了更好地收敛网络,我们使用L1正则化通过在MAE损失之后添加惩罚来平衡拟合训练的目标。θ、λ分别表示所提出的网络的参数和正则化系数。然后,优化目标函数被定义为:在这里插入图片描述
我们的主要目标是解决以下优化问题:在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/372201.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

RIP路由协议的更新(电子科技大学TCP/IP第二次实验)

一.实验目的 1、掌握 RIP 协议在路由更新时的发送信息和发送方式 2、掌握 RIP 协议的路由更新算法 二.预备知识 1、静态路由选择和动态路由选择 2、内部网关协议和外部网关协议 3、距离向量路由选择 三.实验原理 RIP 协议&#xff08…

使用Python进行数据分析——线性回归分析

大家好,线性回归是确定两种或两种以上变量之间互相依赖的定量关系的一种统计分析方法。根据自变量的个数,可以将线性回归分为一元线性回归和多元线性回归分析。一元线性回归:就是只包含一个自变量,且该自变量与因变量之间的关系是…

AMBA-AXI(一)burst 传输-INCR/WRAP/Fixed

💡Note:本文是根据AXI协议IHI0022F_b_amba_axi_protocol_spec.pdf(issue F)整理的。主要是分享AXI3.0和4.0部分。如果内容有问题请大家在评论区中指出,有补充或者疑问也可以发在评论区,互相学习&#x1f64…

JUC 体系的基石——AQS

—— AQS(AbstractQueuedSynchronizer) 概念 抽象队列同步器;volatile cas 机制实现的锁模板,保证了代码的同步性和可见性,而 AQS 封装了线程阻塞等待挂起,解锁唤醒其他线程的逻辑。AQS 子类只需要根据状…

182、【动态规划/数组】leetcode ——647. 回文子串:动态规划+双指针(C++版本)

题目描述 原题链接:647. 回文子串 解题思路 (1)动态规划 动态规划的思路是每次判定子串两端对称位置是否相等,然后再基于已有的内侧对称情况判定是否为回文串。 动态规划五步曲: (1)dp[i][…

语音识别与Python编程实践

博主简介 博主是一名大二学生,主攻人工智能研究。感谢让我们在CSDN相遇,博主致力于在这里分享关于人工智能,c,Python,爬虫等方面知识的分享。 如果有需要的小伙伴可以关注博主,博主会继续更新的&#xff0c…

uni-app入门并使用学习

笔记课程 工具准备 下载HBuilderX 点击下载HBuilderX 下载微信开发者工具 点击下载微信开发者工具 使用参考uni-app官网 官网 新建项目运行 文件---新建----项目 运行到谷歌浏览器H5 运行------谷歌浏览器打开---打开成功(第一次可能需要安装插件&#xff0…

React(三) ——新、旧生命周期

🧁个人主页:个人主页 ✌支持我 :点赞👍收藏🌼关注🧡 文章目录⛳React生命周期🌋初始化阶段👣运行中阶段🏓销毁阶段🏫新生命周期的替代🚚react中性…

MS9123是一款单芯片USB投屏器,内部集成了USB2 0控制器和数据收发模块、视频DAC和音视频处理模块,MS9123可以通过USB接口显示或者扩展PC、

MS9123是一款单芯片USB投屏器,内部集成了USB2.0控制器和数据收发模块、视频DAC和音视频处理模块,MS9123可以通过USB接口显示或者扩展PC、智能手机、平板电脑的显示信息到更大尺寸的显示设备上,支持CVBS、S-Video视频接口。 主要功能特征 C…

基本中型网络的仿真(RYU+Mininet的SDN架构)-以校园为例

目录 ​​​​​​​具体问题可以私聊博主 一、设计目标 1.1应用场景介绍 1.2应用场景设计要求 网络配置方式 网络技术要求 网络拓扑要求 互联互通 二、课程设计内容与原理 (1)预期网络拓扑结构和功能 (1)网络设备信息 …

aws ecr 使用golang实现的简单镜像转换工具

https://pkg.go.dev/github.com/docker/docker/client#section-readme 通过golang实现一个简单的镜像下载工具 总体步骤 启动一台海外区域的ec2实例安装docker和awscli配置凭证访问国内ecr仓库编写web服务实现镜像转换和自动推送 安装docker和awscli sudo yum remove awsc…

超市怎么做微信小程序_线上超市小程序开发可以实现什么功能呢

1。开发超市小程序有什么价值? 1、对于消费者来说:通过超市小程序能够更加直接的购买到想要的产品,消费者无需再到门店寻找商品可以直接通过超市小程序进行在线浏览;通过在线搜索的方式能够更加便捷的搜索到相应的商品&#xff0…

第一篇自我介绍(单片机)

小白的单片机之旅 🤔自我介绍🤔 😊学习目标😊 😜关于单片机😜 🌝小结🌝 🎉博客主页:小智_x0___0x_ 🎉欢迎关注:👍点赞&…

JavaSE学习笔记day14

二、Set Set集合是Collection集合的子接口,该集合中不能有重复元素!! Set集合提供的方法签名,与父接口Collection的方法完全一致!! 即没有关于下标操作的方法 Set接口,它有两个常用的子实现类HashSet,TreeSet 三、HashSet HashSet实现了Set接口,底层是hash表(实际上底层是HashM…

QML 中的 5 大布局

作者: 一去、二三里 个人微信号: iwaleon 微信公众号: 高效程序员 在 QML 中,可以通过多种方式对元素进行布局 - 手动定位、坐标绑定定位、锚定位(anchors)、定位器和布局管理器。 说到 anchors,可能很多人都不太了解,它是 QML 中一个非常重要的概念,主要提供了一种相…

C语言几种判断语句简述

C 判断 判断结构要求程序员指定一个或多个要评估或测试的条件,以及条件为真时要执行的语句(必需的)和条件为假时要执行的语句(可选的)。 C 语言把任何非零和非空的值假定为 true,把零或 null 假定为 fals…

Vuex基础语法

Vuex vuex官网 文章目录Vuexvuex的工作原理图2.vuex的环境搭建3.vuex的使用1.actons2. mutations3.getters4.vuex中的map映射属性4.1 mapState和mapGetters4.2 mapMutations和mapActions5.vuex多组件通信1.通过计算属性获得2.通过mapState获得6.vuex模块化和命名空间6.1模块化…

为什么要用线程池?

1.降低资源消耗。通过重复利用已创建的线程降低线程创建和销毁造成的消耗。 2.提高响应速度。当任务到达时,任务可以不需要的等到线程创建就能立即执行。 3.提高线程的可管理性。线程是稀缺资源,如果无限制的创建,不仅会消耗系统资源&#…

王道《操作系统》学习(一)——计算机系统概述

1.1 操作系统的概念、功能 1.1.1 操作系统的概念(定义) (1)操作系统是系统资源的管理者 (2)向上层用户、软件提供方便易用的服务 (3)是最接近硬件的一层软件 1.1.2 操作系统的功能…

Java 输入输出流

应用程序经常需要访问文件和目录,读取文件信息或写入信息到文件,即从外界输入数据或者向外界传输数据,这些数据可以保存在磁盘文件、内存或其他程序中。在Java中,对这些数据的操作是通过 I/O 技术来实现的。所谓 I/O 技术&#xf…