【多尺度注意力的轻量化图像超分辨率】

news2025/1/17 1:14:43

MSAR-Net: Multi-scale attention based light-weight image super-resolution

(MSAR-Net:基于多尺度注意力的轻量化图像超分辨率)
近年来,单幅图像超分辨率(SISR)技术在视频和图像处理领域得到了广泛的应用,其目标是从输入的低分辨率图像中保留丢失的结构和纹理信息。卷积神经网络(CNNs)的巨大成功彻底改变了SISR领域。然而,对于大多数基于CNN的SISR方法,在参数和触发器方面过度的存储器消耗阻碍了它们在低计算能力设备中的应用。此外,不同的最新SR方法通过平等地对待对网络性能有贡献的所有像素来收集不同的特征。本文综合考虑性能和重构效率,提出了一种用于SISR的轻量级多尺度注意残差网络(MSARNet)。MSAR-Net由用于特征细化的多尺度注意力残差(MSAR)块和用于提取的多尺度特征的边缘细化的上下采样投影(UDP)块组成。这些块能够有效地利用多尺度边缘信息,而不增加参数的数量。特别地,我们以渐进的方式设计网络,用小尺度因子(×2)组合代替大尺度因子(×4)组合,从而逐步利用层次信息。同时,为了以全局和局部方式调制多尺度特征,使用MSAR块中的信道和空间注意力。在合成的基准超分辨率数据集上,可视化结果和PSNR、SSIM的定量指标验证了该方法的准确性。实验分析表明,该方法在内存占用、推理时间和视觉质量方面均优于现有的SISR方法。

介绍

单幅图像超分辨率(SISR)虽然是一个古老的图像复原问题,但仍然是研究界的一个非常热门和迫切的课题。该技术在许多应用中找到了它的方式,如面部分析、视图合成、深度图估计。很多时候,目标检测、图像分割、图像分类等高级任务的准确性取决于重建的高分辨率图像。超分辨率(SR)问题是一个病态问题,即一幅低分辨率(LR)图像可能对应多幅高分辨率图像,这使得超分辨率问题具有很大的挑战性,引起了学术界越来越多的关注。在过去的几年里,随着卷积神经网络(CNN)的出现,SR模型已经显示出上级的结果,完全盖过了传统的插值和基于实例的方法。Dong等人介绍了基于CNN的SISR模型领域的先驱工作,并通过采用基于预上采样的SR框架显示了显著的改进。提出了使用相同预上采样框架的几种模型,如MemNet、DRRN,在学习策略和网络深度方面存在细微差异。与上述利用预处理图像的方法相反,许多作者提出在低维空间中提取特征,并使用亚像素卷积或转置卷积在网络末端进行上采样。Lim等人提出了一种非常深的随机共振网络,其优越的性能超越了当时所有的随机共振方法。此外,Lai等人引入了渐进式上采样方法,其中每个水平需要通过学习预测结果和上一水平的上推来预测残差。为了有效地使用特征,Ahn等人在残差网络上使用了级联结构。然而,这些方法没有充分利用LR图像的特征,使得难以重建真实的SR图像。
在各种工作中,为了强调更好的特征探索,使用了多尺度特征。Li等人提出了多尺度超分辨率领域的第一项工作。但是,交叉连接的体系结构导致模型复杂,增加了计算成本。Zhen等人利用了SISR反馈机制的概念。Hu等人提出了一种用于高频细节重建的多尺度信息网络。Lu等人探索了多尺度残差特征,以获得更好的特征提取。最近,Wang等人探索了SISR中稀疏性的概念。尽管由上述SR技术带来了相当大的改进,但是需要开发用于在单个网络中合并特征表示和边缘增强能力的专用方法。考虑到上述问题,在所提出的框架中,在每个多尺度注意残差块之后,使用一种新的上下采样投影块来收集高频信息。
关注特征空间或通道相关性的注意力机制在图像超分辨率领域也显示出良好的效果,基于注意力的SR网络的提出显示出令人印象深刻的性能,但代价是大量的参数。Hu等人遵循针对高级视觉问题提出的想法,利用通道和空间注意机制,表现出更好的性能。由于注意块的有效性,我们提出的方法进一步将组合注意模块嵌入到提出的残差块中。但是仍然自然地出现了一个问题,是否可能具有能够促进图像内容的理解的有效的合并框架,具有更少数量的参数?显然,增加层深度将导致梯度消失、计算负担问题。因此,为了用较少的参数提高重建性能,我们提出了一种轻量级的MSAR-Net,在单个网络中同时利用特征和边缘信息。

贡献

1)我们提出一个渐进的多尺度网络,以较少的参数顺序探索层次信息。这种轻量级架构使得可以有效地处理图像特征以实现高质量的图像恢复。
2)提出了多尺度注意残差(MSAR)块用于自适应地捕捉特征之间的多尺度相关性,以及上下采样投影(UDP)块用于提取的多尺度特征的边缘细化。

相关工作

在过去的十年中,计算机视觉界已经提出了过多的工作,包括基于插值、基于学习和基于CNN的方法。SRCNN 是第一个深度学习框架,为超分辨率领域的许多伟大作品铺平了道路。Lai等人提出了一种用于超分辨率重建HR图像子带残差的深拉普拉斯金字塔网络。Zhang等人通过剩余稠密块提取了丰富的局部特征,使得前一个关系数据库可以直接连接到当前关系数据库的所有层。此外,Jiang等人进一步探索了分层密集连接的思想,以获得更好的特征表示。在ResNet中残差块的成功之后,提出了EDSR和DRRN的非常深的网络。Liu等人提出了一种通过残差特征聚合(RFA)网络来探索特征的新方法。提出了几项研究,重点关注网络的轻量化设计和利用特征信息之间的差异。为了克服深宽网络中固有的计算复杂性,进一步提出了类似的方法。
近年来,使用基于注意力的网络来进一步提高SR网络的性能成为一种发展趋势。自从Zhang等人在残差块中引入信道注意机制以来,注意机制一直是SR应用的布恩。Hu等人遵循高级视觉问题中提出的想法,利用通道和空间注意机制,并表现出更好的性能。自那时以来,已经提出了诸如SAN、CSFM和RNAN之类的若干其他方法来自适应地处理视觉信息并关注显著区域。

方法在这里插入图片描述

图1所示的拟建网络的整体管道由三个模块组成:(1)特征提取模块(FEB)处理LR输入图像以收集鲁棒特征,(2)多尺度注意力残差(MSAR)模块的堆叠,用于在探索特征之间的关系之后执行非线性映射,(3)上下投影(UDP)模块,用于执行所提取特征的边缘细化。特征提取模块由两个3 × 3卷积层组成,通过采集输入的激活信息提取特征,生成LR特征图。方程式(1)定义了FEB的基本功能。在这里插入图片描述
我们使用像素混洗作为上采样层。值得一提的是,以不同尺度处理信息并随后进行汇总有助于为下一阶段提取特征,从而使模型能够提取各种信息。此外,在模型中使用残差连接,这有助于消除梯度消失的问题,从而最终稳定训练过程。

Multi-scale attention residual block

使用了一个整体渐进的多尺度模型,以获得更好的特征相关性,同时在网络中移动得更深。与现有文献中提出的其他残差和起始块不同,已经进行了增加感受野以更好地提取特征的尝试。为了将可用资源分配给图像中信息量更大的内容,我们使用了启发的注意力概念。为了进一步提高网络学习更重要特征的能力,设计了空间注意单元和通道注意单元。通过传递来自大小为1、3、5 - 1的并行卷积层的信息而获得的多尺度特征被级联为:在这里插入图片描述
对于局部感受野未收集的进一步上下文信息,使用了全局平均池。我们选择使用Sigmoid函数来提取信道特性,以增强信道之间的非线性相互作用。通道注意块定义如下:请添加图片描述
VGP(·)表示平均全局池化操作,以考虑信道方式的空间信息。δ(·)表示Sigmoid函数,λ(·)表示LeakyReLU激活函数。ψCA表示通道注意块的输出。ψresc表示第c个通道特征映射,xc表示ψres空间收缩后的统计量。为了强调通道之间的非线性激活,首先通过32个滤波器和1 × 1核大小的卷积层对获得的特征进行通道方式下采样,然后通过具有64个滤波器的1 × 1卷积层执行通道上采样。为了重新调整输入,将获得的通道统计乘以第c个通道中的特征图,如公式(6)以缩放重要的通道特征。
为了局部地调制特征,已经使用了空间注意单元,其被定义为,在这里插入图片描述
这里,ψSA表示空间注意块的输出。ψMSAR表示MSAR模块的最终输出。Φ(·)表示滤波器大小为3 × 3的深度方向卷积。ψcat代表连接的注意特征。所提出的关注块能够利用通道间和通道内信息,其中深度方向卷积的使用进一步帮助为每个通道生成不同的2D空间关注图。然后,所获得的图通过具有64个滤波器的卷积层,以便更好地细化。为了同时利用这两个模块的优势,我们通过连接将它们组合在一起。

Up and down projection block

在从MSAR块中获得精细特征之后,我们应该通过使用如图1所示的所提出的UDP块来增加图像中高频信息的内容。UDP块的整体操作已经在等式(9)和(10)总结。首先,对MRFE的连续多尺度特征图进行差异性评价。它集中于高频信息,然后将减去的特征传递通过步长为2的上采样层Conv2DTranspose。通过使用跨距为2的卷积层将上采样的特征转换回LR空间。最后的减法运算,输出公式(9)中的ζn有助于去除冗余信息。等式(10)所示的加法运算,结合ψUDP输出,提取清晰图像重建所需的相关特征,从而增强多尺度特征。此外,来自所有UDP块的特征被加在一起以用于更好的梯度传播。最后将所有的残差特征和边缘特征进行拼接,充分利用多尺度边缘特征。在这里插入图片描述
请添加图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/197989.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Python基础语法预习,开学查漏补缺

嗨害大家好鸭~我是小熊猫 Python3 基础语法 Python学习资料电子书 点击此处跳转文末名片 编码 默认情况下,Python 3 源码文件以 UTF-8 编码, 所有字符串都是 unicode 字符串。 当然你也可以为源码文件指定不同的编码: # -*- coding: cp-125…

(HR职场)什么是计划能力?如何提高计划能力?

不论是学习还是工作,光靠努力是不行的,还得有计划,有周密的部署,懂得按计划做事情的人,不仅可以高效率地完成工作,还能在枯燥的工作中寻找到乐趣。这就是做计划的意义和必要性。当然光有计划也不行&#xf…

ArcGIS基础:将多个面要素融合成一个多边形面要素操作

操作目标:有多个多边形要素,并且字段属性没有统一的,可以采用以下两种办法融合成一个面要素。 如下所示,是对被选中的高亮数据进行处理的。 下面介绍第一种方法: 保持数据选中状态,找到【地理处理】下的…

Codeforces Round #849 (Div. 4) D Distinct Split

题目:大概翻译:让我们把一个字符串x的f(z)函数表示为该字符串包含的不同字符数。例如,f(abc)3。f(bbbb) 1, 和 f(babacaba) 3. 给定一个字符串s,将其分成两个非空字符串a和b,使f(a)f(b)为最大可能。换句话说&#xf…

2023软考软件设计师易混淆知识点~(7)

将2023上半年软考《软件设计师》易混淆知识点&#xff0c;分享给大家&#xff0c;快来跟着一起打卡学习吧&#xff01;--<<<点击链接加入群聊【软考学习交流群】>>>易混淆点 :对称加密和非对称加密1、对称加密技术:KeKd;加密解密共用一个密钥;特点:加密强度不…

python设计模式-适配器设计模式,装饰器设计模式

适配器设计模式 适配器模式可用作两个不兼容接口之间的桥梁。 这种类型的设计模式属于结构模式&#xff0c;因为此模式结合了两个独立接口的功能。 这种模式涉及一个类&#xff0c;它负责连接独立或不兼容接口的功能。 一个现实的例子是读卡器&#xff0c;它是存储卡和笔记本电…

超多免费API接口分享

分享一下近段时间在网上看的超多免费API接口&#xff0c;赶紧收藏起来吧&#xff01; 一、APISpace 为超过100 万开发者提供专业的 API 服务&#xff0c;包括 API 管理、测试、访问控制等功能&#xff0c;让您无忧探索广阔的API世界~所有接口提供免费试用 https://www.apisp…

【最坏贪心】代码源每日一题div1 排列 2023.02.03

排列 - 题目 - Daimayuan Online Judge今天牛牛完结撒花辣&#xff01;但是我还没补完题&#xff0c;感觉这几场rk都差不多&#xff0c;但是总体来说感觉签到签的有点困难&#xff0c;然后好不容易开到算法题&#xff0c;算法的题也最多只能出一题然后后面这几天除了vpCF&#…

现在都这么拽吗?面试一个工作4年的测试工程师,连自动化基础都搞不清楚,还反过来怼我....

年后招聘黄金期&#xff0c;我们公司也开始大量招人了&#xff0c;我这次是公司招聘的面试官之一&#xff0c;主要负责一些技术上的考核&#xff0c;这段时间还真让我碰到了不少奇葩求职者 昨天公司的HR小席刚跟我吐槽&#xff1a;这几个星期没有哪天不加班的&#xff01;各种…

代码随想录 day55动态规划 回文子串

代码随想录 day55动态规划 回文子串 题647 回文子串 动态规划解法&#xff1a; 1&#xff0c;确定dp数组以及下标的含义 对于绝大多数题目来说&#xff0c;题目求什么dp数组就定义为什么&#xff0c;但此题如果定义&#xff0c;dp[i] 为 下标i结尾的字符串有 dp[i]个回文串的…

【2003NOIP普及组】T3.栈 试题解析

【2003NOIP普及组】T3.栈 试题解析 时间限制: 1000 ms 内存限制: 65536 KB 【题目描述】 栈是计算机中经典的数据结构,简单的说,栈就是限制在一端进行插入删除操作的线性表。 栈有两种最重要的操作,即pop(从栈顶弹出一个元素)和push(将一个元素进栈)。 栈的重要…

对比coco anationtions和coco result的数据保存形式

一、背景 coco anationtions是coco数据集提供的数据标签&#xff0c;coco result是预测的结果的形式&#xff0c;方便用pycocotools计算模型的map等指标。 二、两种数据形式对比 1. coco anationtions的形式 以person_keypoints_val2017.json为例。整体结构如下图 是一个字…

服务器搭建原神私服教程

1. 准备工具这个端在Windows、Linux系统上都可以跑&#xff0c;本次教程基于Linux。准备如下工具服务器1台 centos7 系统 最低配置8核16G 如需公网联机可用云服务器手保证云服务器的443端口未使用&#xff08;服务器上没有网站&#xff09;2. 环境配置安装系统依赖环境yum -y i…

揭密字节跳动薪资职级,资深测试居然能拿......

曾经的互联网是PC的时代&#xff0c;随着智能手机的普及&#xff0c;移动互联网开始飞速崛起。而字节跳动抓住了这波机遇&#xff0c;2015年&#xff0c;字节跳动全面加码短视频&#xff0c;从那以后&#xff0c;抖音成为了字节跳动用户、收入和估值的最大增长引擎。 自从字节逐…

论文阅读_模型鲁棒性的量化指标

论文信息 name_en: Robustness Metrics&#xff1a;How Are They Calculated, When Should They Be Used and Why Do They Give Different Results? name_ch: 鲁棒性度量&#xff1a;它们是如何计算的&#xff0c;何时应该使用以及为什么会给出不同的结果? addr: http://doi…

软件工程(2)--瀑布模型

前言 这是基于我所学习的软件工程课程总结的第二篇文章。 在20世纪80年代之前&#xff0c;瀑布模型一直是唯一被广泛采用的生命周期模型&#xff0c;现在它仍然是软件工程中应用得最广泛的过程模型。传统软件工程方法学的软件过程&#xff0c;基本上可以用瀑布模型来描述。 正…

【OpenGL学习】光照贴图

光照贴图 上节中我们给物体添加了材质&#xff0c;使得物体能够对光照做出不同的反应&#xff0c;但是有个问题就是&#xff0c;使用该种材质的物体&#xff0c;只能够表现出我们所定义的一种性质&#xff0c;而实际生活中我们的一个物体往往具有多种材质&#xff0c;因此本节…

一文了解jquery

簡述本文主要介紹jquery的重要語法功能&#xff0c;如選擇器&#xff0c;dom操作&#xff0c;事件等處理操作什麼jquery&#xff1f;jquery由美国人John Resig&#xff08;约翰莱西格&#xff09;于2006年创建 ,是目前最流行的JavaScript程序库。以輕量&#xff0c;代碼簡潔&am…

windows快速切换jdk版本号

前言 因为老项目和新项目的需要&#xff0c;在电脑上需要切换jdk1.8和jdk17&#xff08;其它版本jdk同样可以切换&#xff09;。网上有修改配置文件的方式&#xff0c;但是感觉比较繁琐&#xff0c;后来找到了通过bat文件和环境变量来快速切换jdk环境的方法。这里记录分享出出…

rclone挂载webdav详细步骤(含脚本)

挂载说明 文章目录挂载说明文件下载地址&#xff1a;文件夹及文件说明windows安装、配置和挂载操作步骤安装新建连接配置挂载开机自启linux安装、配置和挂载操作步骤安装新建连接配置,见 [链接新建连接配置](#新建连接配置)挂载linux开机自启文件下载地址&#xff1a; 文件下载…