【基于增强上下文注意网络:超分】

news2024/11/25 14:50:26

Enhanced Context Attention Network for Image Super Resolution

(基于增强上下文注意网络的图像超分辨率)
深度卷积神经网络(CNN)极大地提高了图像超分辨率(SR)的性能。尽管图像随机共振的目标是恢复高频细节,但大多数随机共振方法仍然侧重于通过深而宽的网络生成高级特征。它们缺乏对隐藏在丰富CNN特征中的高频信息的区分能力,从而阻碍了CNN产生更好的SR结果。为了解决这个问题,我们提出两个新的注意机制:语境加权通道注意(CWCA)和持续空间注意(PSA)。它们通过抑制无用特征和增强感兴趣的特征,以通道和空间的方式对丰富的特征进行调制。然后使网络能够更多地集中于与图像的高频分量密切相关的信息特征。此外,我们提出了具有密集连接的增强注意残差群(EARG-D),不仅捕获短期信息,而且捕获长期信息,以保持更多有用的特征。最后,我们构造了一个深度增强的上下文注意超分辨率网络(EASR),以获得更好的图像重建效果,定量和定性实验表明,该方法的性能优于现有的随机共振方法。
超分辨率(SR)图片是一个高度不适定的逆问题,其目标是从低分辨率(LR)图像重建出视觉上令人愉悦的高分辨率(HR)图像。它是经典的计算机视觉任务之一,越来越受到学者们的关注。近年来,随着深度学习的快速发展,基于卷积神经网络(CNN)的许多方法被提出来解决该逆问题。Dong等人首次尝试利用三层CNN(SRCNN)求解图像SR,Kim等人在引入跳跃连接的同时,提出了更深层次的网络VDSR,以减轻模型训练的难度。遵循类似的思想,已经提出了许多具有诸如递归学习和存储器块之类的仔细网络设计的预放大网络。然而,预放大网络以二次方式增加计算复杂度。为了保存计算资源,Dong等人引入了去卷积层来提高空间分辨率。Shi等人提出了ESPCN ,以使用高效的亚像素卷积层来放大特征图,从而可以直接从LR图像中提取特征。随后,各种工作集中于如何有效地从LR输入中提取特征以提高SR性能。Ledig等人首先利用ResNet中的残差块提出了深度网络SRResNet 。Lim等人提出了两个残差网络EDSR和MDSR ,赢得了NTIRE 2017超分辨率挑战赛。后来,针对SR引入了DenseNet中的密集连接。Zhang等人通过将稠密连接集成到残差块中,提出了一种残差稠密网络RDN 。深度和广度的网络可以获得令人信服的SR性能增益,但它仍然具有局限性。网络中丰富的特征将包含关于图像的不同类型的信息,例如轮廓、纹理和强度。由于图像SR的目标是HR图像的重建,因此,与包含低频信息的特征相比,包含高频信息的特征更有利于图像SR。然而,大多数SR方法没有区分这些层次特征,从而阻碍了CNNs恢复更好的SR结果。
为了解决这个问题,我们提出了两种新的图像SR注意机制:上下文加权通道注意(CWCA)机制和持续空间注意(PSA)机制。CWCA通过对比度上下文加权池(CCWP)自适应地挤压通道特征。然后利用通道依赖性来强调感兴趣的通道特征。PSA修改空间信息统计以重新校准每个空间位置中的特征。在每个PSA单元中,经由增强空间注意力(ESA)单元从输入特征生成粗略空间注意力(SA)图。PSA对先前的空间注意特征图进行密集聚合,并生成残差SA图,以将当前SA图重新校准为更好的SA图,从而形成持久的空间注意记忆机制。CWCA和PSA增强了网络的区分学习能力,使其更加关注信道和空间两方面的信息特征。此外,我们还提出了一个具有稠密连接的增强注意残差群(EARG-D)。EARG-D将不仅收集短期信息,而且收集长期信息,以保持更多有用的特征。最后,我们构造了一个深度增强的上下文注意超分辨率网络(EASR)来更好地重建HR图像。

贡献

1)提出了一种上下文加权信道关注机制(CWCA)来有效利用信道依赖性。CWCA使用对比度上下文加权池(CCWP)以更精确的方式挤压特征。因此,网络可以更加关注信息性特征,从而增强网络区分能力。
2)我们提出持续性空间注意力机制(PSA),以适应性地在空间维度上重新缩放特征。PSA首先利用增强的空间注意力(ESA)单元来生成粗略的空间注意力图。它进一步密集地融合先前的空间注意特征图来微调当前的SA图,从而导致持续的空间注意记忆机制。
3)提出了一种深度增强的上下文注意超分辨率网络(EASR)用于图像SR,定量和定性实验表明,EASR的性能上级现有的SR方法。

相关工作

CNN Based SR Methods

自从Dong等人提出SRCNN以来,许多CNN结构已经被提出用于SR。Kim等人提出了具有20个卷积层的跳跃连接的更深网络VDSR。Kim等人随后提出了一种深度递归网络DRCN,它同时使用了跳跃连接和递归卷积层。然而,这些预放大网络需要对LR图像进行上插,这增加了计算复杂度。为了减轻计算负担,Dong等人引入了去卷积层以提高网络尾部的空间分辨率。Shi等人进一步提出了一种具有高效亚像素卷积层的后上尺度网络ESPCN ,其最近也通过在EUM中级联多尺度特征而得到增强。在ESPCN和SRResNet 之后,EDSR 通过移除不必要的层(例如,批归一化层)来修改使用的残差块。简化残差块已成为基于CNN的随机共振方法中最常用的模块。随后SRDenseNet、RDN和CARN利用稠密连接融合网络中的层次特征,为随机共振提供了更多线索,而这在以前的工作中被忽略了。
利用这种后尺度结构,我们还利用了亚像素卷积层以及残差学习和稠密连接在我们提出的方法。我们进一步利用通道注意和空间注意机制来提高网络对不同层次特征的区分能力。

Attention Mechanism

注意在人类感知中起着重要的作用。它允许人类视觉系统选择性地处理视觉信号并聚焦于显著区域以捕获更好的视觉信息。近年来,已经进行了一些尝试将注意机制集成到高级计算机视觉任务中。Zhang等人首先将通道注意(CA)机制引入图像SR,他们将SE块直接用于极深卷积网络RCAN,并取得了优于以往SOTA方法的性能。Hui等人用标准差和平均值的总和取代了SE块中的全局平均合并,并提出了图像SR的对比度感知通道注意。
然而,CA仍然以全局方式为特征,这导致对SR有益的大部分高频信息被丢弃。Hu等人利用RCAN 中的CA机制和空间注意力(SA)机制以全局和局部的方式动态地重新校准多级特征,但SA仅聚合通道式特征以调制空间信息。为了解决这些缺点,我们提出了上下文加权信道关注(CWCA)和持续空间关注(PSA)。

方法

Context Weighted Channel Attention

通道注意力用于以全局的方式重新校准特征,以增强感兴趣的特征,同时抑制无用的特征。以前的工作利用平均池以全局方式squeeze特征。虽然平均池有助于提高性能,但忽略了高频分量的信息,应引起更多的关注。本文引入对比度上下文加权池(CCWP)作为压缩过程,根据空间区域的对比度信息对全局特征进行加权压缩。
给定输入U =[u1,u2,…,uC]∈ R C × H × W R^{C×H×W} RC×H×W,该模型有C个H×W大小的特征图,我们首先通过减去每个特征图的均值来归一化每个特征图,得到对比度-上下文特征图 U c c U^{cc} Ucc =[ u c c   1  , u^{cc}~1~, ucc 1 u{cc}$~2~,…,$u{cc}C ]∈ R C × H × W R^{C×H×W} RC×H×W在这里插入图片描述
在这里插入图片描述
然后我们利用一个1 × 1卷积层和softmax激活函数σ作为变换过程,生成每个位置的像素权重,如图3所示:在这里插入图片描述
其中W是用于加权池化的权重映射,zk是CCWP的第k个压缩输出。最后,我们使用激励和缩放过程来形成所提出的上下文加权信道关注度,如图3所示。

Enhanced Spatial Attention

由于通道注意力通过挤压和激励全局信息来区分通道方面的特征,空间方面的信息也被去除。对于图像而言,不同的空间区域包含不同的信息特征。边缘和纹理区域通常包含高频分量,而平坦区域更可能包含低频信息。提高网络对不同空间区域的区分能力,对包含高频细节的区域给予更多的关注是必要的。为此,提出了增强空间注意力(ESA)来增强网络的表征能力。与提出的SA方法不同,ESA不是通过简单地挤压通道方面的特征,而是通过聚合空间方面和通道方面的上下文信息来选择不同局部区域中的重要特征。通过第4节中的定量实验证明了其上级性和有效性。ESA包括挤压和激发过程。对于挤压过程,ESA使用4个卷积层。该算法首先将CWCA中的输入特征图U ∈ R C × H × W R^{C×H×W} RC×H×W归一化为 U c c U^{cc} Ucc,然后利用1 × 1卷积层将特征图压缩为降维 R ( C / r ) × H × W R^{(C/r)×H×W} R(C/r)×H×W,压缩比为r。其次,利用两个3×3的深度可分离卷积层提取空间维的上下文特征。最后的1×1卷积层进一步将特征缩减为 R 1 × H × W R^{1×H×W} R1×H×W。最后,激发过程生成一个具有sigmoid激活函数的空间注意特征图βESA R 1 × H × W R^{1×H×W} R1×H×W

Persistent Spatial Attention

请添加图片描述

空间的关注(SA)提取空间关注基于特征映射的从前馈输入功能。由于不同的接受域卷积网络层深,中间卷积特性将成为分层。这意味着从不同特征中提取的不同SA特征也包含不同的空间信息。另一方面,图像中高频信息的分布在网络的前馈过程期间不改变。如果结合这些多尺度SA特征,则将有益于网络。我们提出持续空间注意(PSA)来密集融合全局SA特征图。
PSA中有两个过程:压缩和融合。压缩过程融合并压缩网络的先前SA特征以生成残余SA特征图,并且融合过程执行当前SA特征图与残余SA特征图之间的残余连接。对于第n个PSA,其可表示为:在这里插入图片描述
其中 β P S A   n  表示第 n 个 P S A 的输出 S A 特征图, β   E S A n  表示第 n 个 E S A 单元产生的当前 S A 特征图, β^{PSA}~n~表示第n个PSA的输出SA特征图,β~ESAn~表示第n个ESA单元产生的当前SA特征图, βPSA n 表示第nPSA的输出SA特征图,β ESAn 表示第nESA单元产生的当前SA特征图,β^{SA}resn表示PSA中压缩过程产生的残余SA特征图。特别地,当n = 0时, β P S A   0   = β   E S A 0  。 P S A 算法通过密集地聚集先前的 S A 特征,动态地调整当前的 S A 特征映射,使其更加准确,从而形成一种持久的空间注意记忆机制。最后,通过输出 S A 映射 β^{PSA}~0~= β~ESA0~。PSA算法通过密集地聚集先前的SA特征,动态地调整当前的SA特征映射,使其更加准确,从而形成一种持久的空间注意记忆机制。最后,通过输出SA映射 βPSA 0 =β ESA0 PSA算法通过密集地聚集先前的SA特征,动态地调整当前的SA特征映射,使其更加准确,从而形成一种持久的空间注意记忆机制。最后,通过输出SA映射β^{PSA}$调制输入特征:在这里插入图片描述

Network Architecture

如图2所示,我们的EASR的总体架构由三部分组成:粗图像特征提取模块(IFE)、密集特征提取模块(DFE)和重构模块(RE)。IFE利用一个卷积层来提取粗略的图像特征。DFE包含具有密集连接的级联增强注意残差群(EARG-D)。DFE中有N个EARG-D和两个卷积层。
请添加图片描述
对于单个EARG-D,存在M个堆叠的增强注意残差块(EARB)和尾部的一个全局特征融合(GFF)单元。GFF单元将网络中的前几个EARG-D密集连接起来,融合前几个特征,生成一个1×1卷积层的EARG-D最终输出。在每个EARB中,两个卷积层和一个ReLU激活函数被用作特征提取单元。然后,CWCA单元和PSA单元被顺序地整合以重新校准通道方面和空间方面的特征。特别地,PSA仅聚集来自同一EARG-D中的EARB的先前SA特征。
最后,我们使用ESPCN作为RE模块来生成SR图像。给定训练数据集{ I n I^n InLR I n I^n InHR}N n=1,其中N表示训练图像对的数量,我们使用L1损失来训练我们的EASR网络,以最小化HR图像和SR图像之间的差异:在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/373563.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Mysql视图,存储过程,触发器,函数以及Mysql架构

一,视图视图是基于查询的一个虚拟表 , 也就是将sql语句封装起来, 要用的时候直接调用视图即可, select语句查询的表称为基表, 查询的结果集称为虚拟表, 基本表数据发生了改变, 那么视图也会发生改变, 使用视图就是为了简化查询语句.1.CREATE VIEW view_admin AS SELECT * FROM…

聊一聊过度设计!

文章目录什么是过度设计?过度设计的坏处如何避免过度设计充分理解问题本身保持简单小步快跑征求其他人的意见总结新手程序员在做设计时,因为缺乏经验,很容易写出欠设计的代码,但有一些经验的程序员,尤其是在刚学习过设…

top -p pid为什么超过100%

CPU:Cores, and Hyper-Threading 超线程(Hyper-Threading ) 超线程是Intel最早提出一项技术,最早出现在2002年的Pentium4上。单个采用超线程的CPU对于操作系统来说就像有两个逻辑CPU,为此P4处理器需要多加入一个Logic…

Spring Cache的基本使用与分析

概述 使用 Spring Cache 可以极大的简化我们对数据的缓存&#xff0c;并且它封装了多种缓存&#xff0c;本文基于 redis 来说明。 基本使用 1、所需依赖 <dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-…

redis秒杀

redis优惠券秒杀 为什么订单表订单ID不采用自增长&#xff1f; id规律性太明显&#xff0c;容易被用户猜测到&#xff08;比如第一天下订单id10&#xff0c;第二天下订单id100&#xff0c;在昨天的1天内只卖出90商品&#xff09;受单表数据量限制&#xff08;订单数据量大&am…

Redis高级删除策略与数据淘汰

第二章&#xff1a;Redis高级 学习目标 目标1&#xff1a;能够说出redis中的数据删除策与略淘汰策略 目标2&#xff1a;能够说出主从复制的概念&#xff0c;工作流程以及场景问题及解决方案 目标3&#xff1a;能够说出哨兵的作用以及工作原理&#xff0c;以及如何启用哨兵 …

《分布式技术原理与算法解析》学习笔记Day23

分布式数据复制 我们在进行分布式数据存储设计时&#xff0c;通常会考虑对数据进行备份&#xff0c;以提高数据的可用性和可靠性&#xff0c;“数据复制技术”就是实现数据备份的关键技术。 什么是数据复制技术&#xff1f; 在分布式数据库系统中&#xff0c;通常会设置主备…

Java StringBuilder类(为什么更高效、常用方法、构造器)

StringBuilder类一、引言二、StringBuilder类特点三、StringBuilder构造方法四、StringBuilder常用方法五、StringBuilder为什么高效率六、StringBuffer类一、引言 为什么要引入StringBuilder类 提高字符串操作效率&#xff0c;尤其是涉及大量字符串拼接 //获取1970年1月1日0时…

2023年三月份图形化一级打卡试题

活动时间 从2023年3月1日至3月21日&#xff0c;每天一道编程题。 本次打卡的规则如下&#xff1a; 小朋友每天利用10~15分钟做一道编程题&#xff0c;遇到问题就来群内讨论&#xff0c;我来给大家答疑。 小朋友做完题目后&#xff0c;截图到朋友圈打卡并把打卡的截图发到活动群…

土著刷题新功能上线:根据每日学习时间,制定专属学习计划,多种数据统计维度追踪计划进度

吐槽社区的一个小伙伴在用土著刷题微信小程序进行碎片化学习&#xff0c;同时进行多科目题库练习的时候&#xff0c;不好追踪学习进度&#xff0c;希望有个能制定每日目标的功能。因此土著刷题微信小程序v1.11迭代开发了 学习计划 模块功能&#xff0c;学习计划是一个可以设置题…

HTML#3图片,音频,视频标签

一. 介绍1.标签与描述标签 描述<img> 定义图片<audio> 定义音频<video> 定义视频2.标签的详细介绍img:定义图片src:规定显示图像的 URL (统一资源定位符)height:定义图像的高度width:定义图像的宽度audio: 定义音频。支持的音频格式: MP3、WAV、OGGsrc:规定音…

角度制与弧度制的相互转换np.deg2radnp.rad2deg

【小白从小学Python、C、Java】【计算机等级考试500强双证书】【Python-数据分析】角度制与弧度制的相互转换np.deg2radnp.rad2deg选择题以下关于python代码表述错误的一项是?import numpy as npprint("【执行】np.rad2deg(np.pi)")print(np.rad2deg(np.pi))print(&…

有没有必要考PMP证书?

其实针对有没有必要考试吗&#xff0c;这个可以根本不同行业的人来决定的。 1.高等教育项目管理专业科班出身的人员。 在我国本科学历和硕士研究生学历中&#xff0c;项目管理也有开设。不管以后从事的工作是否为项目管理或其他管理&#xff0c;作为本专业的同学&#xff0c;…

HDMI协议介绍(三)--InfoFrame

目录 Auxiliary Video information (AVI) InfoFrame AVI InfoFrame包结构 Header Body 举个例子 附录 Audio InfoFrame Audio InfoFrame包结构 Header Body Vendor Specific InfoFrame Vendor Specific InfoFrame包结构 Header Body AVI/AUDIO/VSI Infoframe都…

Linux 操作系统原理 — 内存管理 — 虚拟地址空间(x86 64bit 系统)

目录 文章目录目录虚拟地址格式与内核页表&#xff08;四级页表&#xff09;虚拟地址格式与内核页表&#xff08;四级页表&#xff09; 在 x86 64bit 系统中&#xff0c;可以描述的最长地址空间为 2^64&#xff08;16EB&#xff09;&#xff0c;远远超过了目前主流内存卡的规格…

QML 颜色表示法

作者: 一去、二三里 个人微信号: iwaleon 微信公众号: 高效程序员 如果你经常需要美化样式(最常见的有:文本色、背景色、边框色、阴影色等),那一定离不开颜色。而在 QML 中,颜色的表示方法有多种:颜色名、十六进制颜色值、颜色相关的函数,一起来学习一下吧。 老规矩…

华为OD机试用Python实现 -【信号发射和接收】(2023-Q1 新题)

华为OD机试题 华为OD机试300题大纲信号发射和接收题目描述输入描述输出描述说明示例一输入输出说明示例二输入输出说明Python 代码实现代码运行结果代码编写思路华为OD机试300题大纲 参加华为od机试,一定要注意不要完全背诵代码,需要理解之后模仿写出,通过率才会高。 华为…

【蓝桥集训】第七天并查集

作者&#xff1a;指针不指南吗 专栏&#xff1a;Acwing 蓝桥集训每日一题 &#x1f43e;或许会很慢&#xff0c;但是不可以停下来&#x1f43e; 文章目录1.亲戚2.合并集合3.连通块中点的数量有关并查集的知识学习可以移步至—— 【算法】——并查集1.亲戚 或许你并不知道&#…

前端组件库自定义主题切换探索-03-webpack-theme-color-replacer webpack 同时替换多个颜色改造

接上一篇《前端组件库自定义主题切换探索-02-webpack-theme-color-replacer webpack 的实现逻辑和原理-02》 这篇我们来开始改造&#xff0c;让这个插件最终能达到我们的目的&#xff1a; 首先修改plugin.config.js。 插件首先要在vue.config.js引用注册&#xff0c;因此先对…

NCRE计算机等级考试Python真题(一)

第一套试题1、关于数据的存储结构&#xff0c;以下选项描述正确的是A.数据所占的存储空间量B.数据在计算机中的顺序存储方式C.数据的逻辑结构在计算机中的表示D.存储在外存中的数据正确答案&#xff1a; C2、关于线性链表的描述&#xff0c;以下选项中正确的是A.存储空间不一定…