【基于通道-空间注意的高分辨率锐化】

news2024/11/17 2:48:51

Channel–spatial attention-based pan-sharpening of very high-resolution satellite images

(基于通道-空间注意的很高分辨率卫星影像全色锐化)

全色锐化处理旨在生成新的合成输出图像,其保留全色的空间细节和多光谱图像输入的光谱细节。近年来,基于深度学习的方法在遥感领域取得了巨大的成功,主要是传统卷积神经网络(CNNs)的应用。传统的基于神经网络的方法大多对所有信道一视同仁,无法学习信道间的相关性。注意机制可以学习通道间的相关性,在超分辨率和目标检测任务中被证明是有效的。在本研究中,我们借由设计一个密集残余注意力模组(RAM),提出了一个新颖的深度学习架构–以通道空间注意力为基础的全色锐化方法(CSAPAN)。此外,我们在高频域训练模型,并在与全色图像叠加以进一步提取特征之前,使用像素重排(pixel shuffle)方法对低分辨率多光谱图像进行上采样。

介绍

全色锐化是遥感中生成新的合成输出图像的常用技术,该合成输出图像保留全色的空间细节和多光谱图像输入的光谱细节。全色锐化遥感图像已广泛应用于土地覆盖分类、变化检测、目标检测,甚至Mastcam图像。在过去的几十年里,人们提出了各种方法来对地球观测(EO)数据进行全色锐化,这些数据可以分为四类:(1)基于组件替换(CS)的方法;(2)基于多分辨分析(MRA)的方法;(3)基于变分优化(VO)的方法;(4)基于深度学习的方法。此外,Kwan等人从是否使用点扩散函数(PSF)的角度将全色锐化方法分为四类。
最近,基于深度学习的方法在全色锐化中得到了广泛关注并产生了成功的结果。基于神经网络的全色锐化(PNN)的思想来源于使用卷积神经网络的超分辨率(SRCNN),SRCNN是为单幅图像超分辨率而设计的,仅包含三个卷积层,并取得了令人满意的结果。Yang等人提出了一种PanNet,其中上采样的多光谱图像被包含在网络输出中以保持光谱,并且网络在高通滤波域中进行训练以保持空间。Yuan等人提出了一种多尺度多深度卷积神经网络(MSDCNN),其中PNN被用作浅部,较深的多尺度特征提取层被用作深部,以生成深度架构。Wang等人进行了详细的比较分析,以评估典型的基于深度学习的模型的全色锐化结果的性能和视觉质量。
2018年提出了一种用于遥感图像全色锐化的生成对抗网络(Generative adversarial network,PSGAN),该网络以两个流为生成器,以三层卷积网络为鉴别器,并取得了竞争性的结果。最近,Ozcelik等人提出了一种自监督框架PanColorGAN,将全色锐化处理作为一个彩色化问题,实现了高水平的空间细节保持。
由于当前基于神经网络的方法通常公平地对待所有通道,并且不能学习通道之间的相关性,因此提出了注意机制,并且已经证明在目标检测和图像超分辨率任务中是有效的。在遥感领域,Li等人引入了多尺度信道注意残差网络(MSCARN),用于提取多尺度特征和信道特征。不过,在全色锐化任务上仍值得进一步探索。

在本研究中,我们提出了一个新的深度残余通道-空间注意力为基础的框架,即CSAPAN的全色锐化任务,通过构造一个密集残余注意力模块(RAM)。首先,我们将通道空间注意机制引入到全色锐化中,以改善和提高全色锐化图像的质量。其次,与传统的基于CNN的方法相比,我们在高频域中训练我们的模型以保留空间信息,并且使用双三次插值方法的上采样多光谱图像通过网络传播以进行光谱保留。最后,当与全色图像叠加用于进一步的特征提取时,我们使用像素重排(pixel shuffle)方法而不是简单的双三次插值对下采样的多光谱图像进行上采样。

Material and methods

Attention mechanism

基于CNN的网络已经在包括全色锐化在内的各种任务中取得了有希望的性能。然而,在基于CNN的网络中,所有的信道被同等对待,低分辨率图像中包含的丰富的高频信息没有被充分利用。注意机制被提出来解决这些问题,并且已经被证明能够学习通道之间的更深的相互依赖性,如在用于图像超分辨率的具有递归挤压和激励网络(SESR)的单幅图像超分辨率和非常深的残余通道注意网络(RCAN)中所示。图1(a)描述了挤压和激发模块。SE模块包括通过使用平均池来挤压每个通道的全局空间信息的挤压函数以及包含两个完全连接的层和Sigmoid函数。然后,sigmoid函数的输出与原始H × W × C输入进行元素级乘积,以完全捕获通道级相关性。请添加图片描述
图1(b)示出了信道注意模块(CAM),其用卷积层替换了全连接层。简单地说,设X ∈ R H × W × C R^{H×W×C} RH×W×C是一个具有C个特征的输入,特征大小为H × W。我们通过应用平均池得到了信道统计量z ∈ R C R^C RC。然后,我们通过使用sigmoid函数来获得注意映射 s:
在这里插入图片描述
其中f和σ分别表示Sigmoid函数和ReLU函数。WD表示具有缩减率r的信道下采样卷积层的权重。WU表示具有比率r的信道上采样卷积层的权重。最后,利用学习到的通道统计量对输入信号X进行尺度变换。
请添加图片描述

图1(c)描述了空间注意力模块。输入X ∈ R H × W × C R^{H×W×C} RH×W×C的最大池和平均池沿着信道轴的级联被馈送到卷积层。然后我们计算Sigmoid函数的输出与原始H ×W × C输入的逐元素乘积。

Proposed framework

我们提出的CSAPAN的总体框架如图2所示。该方法由四部分组成:图像预处理、特征融合子网络、超分辨率子网络、光谱保持子网络。
请添加图片描述

Image preprocessing

基于Wald协议设计了典型的基于深度学习的全色锐化模型,包括PNN 、MSDCNN、PanNet 。根据Wald协议,首先对IPAN和IMS进行尺度因子为4的降采样,分别得到全色IPAN-down和多光谱图像IMS-down的降分辨率。其次,通过比例因子4对下采样的多光谱图像IMS-down进行上采样,以生成具有与原始多光谱图像IMS相同分辨率的上采样的多光谱图像IMS-up。最后 ,基于深度学习的模型将IPAN-down和IMS-up作为输入,将IMS作为目标图像来计算损失。IHRMS代表融合的全色锐化图像。我们还根据Wald的协议训练我们的模型。
请添加图片描述

从图2可以看出,红色虚线框为图像预处理部分。首先,全色图像IPAN被下采样到多光谱图像的大小,缩放因子为4 ×到IPAN-down。其次,对多光谱图像IMS进行4倍尺度下采样,得到IMS-down在这里插入图片描述

Features Fusion subnetwork

特征融合如图2中的绿色虚线框所示。在特征融合子网络中,首先对输入的IPAN-down和IMS-down进行高通滤波,得到高频信息IPAN-edge和IMS-edge。然后,我们使用三个卷积层和一个像素混洗层对IMS-edge进行上采样以产生IMS-edge-up。因此,我们有
在这里插入图片描述
我们将Xfuse表示为IPAN-edge和IMS-edge-up的级联特征:
在这里插入图片描述
其中fconcat表示级联操作。

Super-resolution subnetwork

受图像超分辨率任务的启发,我们设计了一个超分辨率子网络,如图2中紫色虚线框所示,用于学习图像的高频。超分辨率子网络由一个用于浅层特征提取的卷积层、多个用于深层特征提取的剩余注意模块(RAM)和另一个用于图像重建的单个卷积层组成。
让我们将X0表示为浅层特征提取部分的输出。
请添加图片描述
如果我们将 X i X^i Xiin X i X^i Xiout分别作为第i个RAM模块的输入和输出
在这里插入图片描述
然后,使用卷积层来重构图像信息。假设我们有n个RAM模块,在这里插入图片描述
请添加图片描述

Spectral preservation subnetwork

光谱保存子网络如图2中的蓝色虚线框所示。为了保存光谱信息,我们通过使用具有4 ×比例因子的简单双三次插值方法将IMS-down上采样到IMS-up,并将长跳跃连接添加到深度残差网络,如红线所示。因此,最终全色锐化输出IHRMS可描述为在这里插入图片描述

Residual attention module

提出了一种用于深度信息提取的剩余注意力模型。提出的RAM是由超分辨率任务中使用的注意机制激发的。如图3所示,RAM由密集残差块、注意块、1 × 1卷积层和全局跳跃连接组成。
请添加图片描述
密集残差块由五个卷积层组成,每一层将所有后续层作为其输入。我们在卷积层后增加了一个注意模块,如图1(a)-(c)所示,用于学习通道之间的相关性,并分别命名为CSAPAN-SE、CSAPAN-CA和CSAPAN-CBAM。同时,我们将不使用注意模块的模型命名为NCAPAN,以评估注意模块的效果。添加1 × 1卷积层以改变特征的尺寸。最后,采用全局跳跃连接来稳定训练过程。
请添加图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/111751.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【服务器端程序的演进过程】

目录 1 服务器端程序的演进过程 阶段一:静态服务器 阶段二:普通动态服务器 阶段三: 以用户共享内容为主的互联网生态 阶段四: 微服务时代(有高并发需求或特征的网站) 2 Java服务器项目分类 3 微服务概述 3.1 什么是微服务 3.2 为什么需要微服务 3.3 怎么搭建微服务项…

C#获取计算机详细的软件和硬件信息

利用System.Management提供的类可以用于读取本地计算机设备的各种数据,包括操作系统、软件、硬件的各种详细信息,内容很丰富。 System.Management的命名空间下,ManagementObjectSearcher类用于查询特定类型的设备,ManagementObjec…

转行做“程序员”很难?这里有几个建议...

“是什么?为什么?怎么样?”的灵魂三连问在我们生活中比比皆是,目的是为了清晰思考和看到事物的本质。对于编程学习也是一样,需要带着疑问从本质上去学习编。 本人是某985高校的本硕连读,非计算机科班出身&…

利器 | AppCrawler 自动遍历测试实践(三):动手实操与常见问题汇总

1080469 14.7 KB 上两篇文章介绍了自动遍历的测试需求、工具选择和 AppCrawler 的环境安装、启动及配置文件字段基本含义,这里将以实际案例更加细致的说明配置文件的用法和一些特殊场景的处理。 下面我们继续之前的例子,在雪球搜索框输入搜索内容后的页面…

CloudFlare系列--功能介绍与常用配置

原文网址:CloudFlare系列--功能与特性的介绍_IT利刃出鞘的博客-CSDN博客 简介 本文介绍CloudFlare的功能与常用的配置。 功能介绍 CloudFlare是世界最强的网络服务商。它可以提供如下服务: 防御DDoS攻击 世界最强防御DDos攻击的厂商。域名注册 世界最…

JavaWeb语法四:多线程案例

目录 1.单例模式 1.1:饿汉模式 1.2:懒汉模式 2.阻塞式队列 2.1:生产者消费者模型 2.2:阻塞队列的模拟实现 3.线程池 3.1:标准库中的线程池 3.2:模拟实现线程池 前言:前一篇我们讲了线程不安全的原因…

SAP UI5 里 FlexBox 的使用方法

ScrollContainer 的使用方式: ScrollContainer 是一个控件,可以在有限的屏幕区域内显示任意内容,并提供滚动以使所有内容都可访问。注意,为了避免影响用户使用体验,不要嵌套沿相同方向滚动的滚动区域。例如&#xff…

【LaTex】基础语法框架快速入门教程——Tex live+TexStudio简要安装及使用教程

0. 引言 LaTeX对于论文排版有着巨大的便利,并且对于参考文献的引用也十分方便,不会出现使用word引用参考文献一旦更改文献引用顺序,就必须全部改编号的情况。这里记录一下如何从0开始学习使用LaTeX书写论文。 1. 软件安装&环境配置 1.…

Qt中实例化一个函数变量时加不加括号的区别,以及括号中的this的使用

一、设计一个测试小程序 废话不多说,直接上代码。 main.h函数就不多说了,没改动。直接上mainwindow.h,也没改动。看mainwindow.cpp的内容。 #include "mainwindow.h" #include "ui_mainwindow.h" #include "test.…

机器学习算法基础——KNN算法

KNN (K-Nearest Neighbor)–K近邻分类算法 • 为了判断未知实例的类别,以所有已知类别的实例作为参照选择参数K • 计算未知实例与所有已知实例的距离 • 选择最近K个已知实例 • 根据少数服从多数的投票法则(majority-voting),让未知实例归类为K个最邻…

Zerobot僵尸网络出现了新的漏洞利用和功能

©网络研究院 Zerobot DDoS僵尸网络已经获得了重大更新,扩展了其针对更多互联网连接设备和扩展网络的能力。 微软威胁情报中心 (MSTIC)正在以DEV-1061的名称跟踪持续的威胁,名称为未知、新兴或发展中的活动群集。 本月早些时候,Fort…

2022年山东省职业院校技能大赛中职组“网络安全”赛项规程

2022年山东省职业院校技能大赛中职组“网络安全”赛项规程一、赛项名称赛项名称:网络安全英文名称:Cyber Security赛项组别:中职组赛项类别:电子与信息类二、竞赛目的网络空间已经成为陆、海、空、天之后的第五大主权领域空间,习总…

SpringCloud 网关组件 Zuul-1.0 原理深度解析

为什么要使用网关? 在当下流行的微服务架构中,面对多端应用时我们往往会做前后端分离:如前端分成 APP 端、网页端、小程序端等,使用 Vue 等流行的前端框架交给前端团队负责实现;后端拆分成若干微服务,分别…

k8s使用glusterfs(静态供给、动态供给)、glusterfs的安装与使用

目录前言主机准备配置主机名、关闭防火墙、关闭selinux挂载磁盘安装glusterfs服务端glusterfs的端口分布式集群的结构组成glusterfs集群创建存储卷启动卷k8s使用glusterfs作为后端存储(静态供给glusterfs存储)恢复初始化环境安装Heketi 服务(…

如何快速读懂开源代码?

文章目录**RUN起来****调试****把控关键数据结构和函数****从小的开始****关注一个模块****工具****一、阅读开源代码存在的一些误区**二、阅读代码的心态**三、阅读源码与**辅助材料**四、如何阅读开源代码****《gdb 高级调试实战教程》电子书下载链接:**1 下载 Ng…

ASP.NET开源版MES加工装配模拟系统源码/WinForm工厂加工装配系统源码/流程工序管理

一、源码描述 本系统用户大学机械科上位机加工装配模拟实验,目前正常用于实验当中。环境:VS2010(C# .NET4.0,多层结构)、sqlserver2008 r2 ;Winform;使用到RFID读写器(设备是可以变更的,修改RFID.Library项目的…

Mycat2(一)简介、分库分表概念

文章目录mycat是什么;为什么要用;mycat的作用原理分库分表的意义数据库优化的层次:数据切分的方式,带来的问题和解决方案分库分表带来的问题mycat的特性与详细配置含义mycat2与mycat1.6区别mycat2映射模型多数据源解决方案mycat核…

JavaScript控制元素(标签)的显示与隐藏

使用JavaScript有多种方式来隐藏元素: 方式一、使用HTML 的hidden 属性,隐藏后不占用原来的位置 hidden 属性是一个 Boolean 类型的值,如果想要隐藏元素,就将值设置为 true,否则就将值设置为false 【HTML hidden 属性…

【STM32+cubemx】0030 HAL库开发:DDS芯片AD9833实现简单的波形发生器

大家好,我是学电子的小白白,今天带大家了解一款波形发生器芯片——AD9833。 AD9833是AD公司出品的一款DDS波形发生器,能够产生正弦波、三角波和方波输出。 1)什么是DDS 通俗来讲,DDS是一种把波形预先存储在芯片内部的…

H5对接NSS主扫遇到的一些问题

需要对接以下这些钱包: WXPAY(微信)ALIPAY(支付宝)LINEPAY(linePay)PAY_PAY (PayPay)RAKUTEN_PAY(乐天)MER_PAY(MerPay)AU_PAY(auPay)DOCOMO_PAY(Dpay)判断钱包类型 这…