【基于空间纹理的残差网络无监督Pansharpening】

news2024/10/7 12:26:01

Unsupervised Pansharpening method Using Residual Network with Spatial Texture Attention

(基于空间纹理的残差网络无监督泛锐化方法)

近年来,深度学习已经成为最受欢迎的泛锐化工具之一,许多相关方法已经被研究并反映出良好的性能。然而,一个不可忽视的问题是缺乏地面实况(GT)。常见的解决方案是使用退化图像作为训练输入,原始图像被用作GT。低分辨率(LR)和高分辨率(HR)之间的学习映射是模拟的,不是真实的,这可能导致融合图像的光谱失真或空间纹理增强不足。为了解决这一问题,提出了一种新的无监督注意力泛锐化网(UAP-Net)。提出的UAP网络主要包含两个主要组成部分:1)深度残差网络(DRN)和2)空间纹理关注块(STAB)。DRN的目标是从低分辨率多光谱(LRMS)和全色(PAN)中提取光谱特征和空间细节特征,并融合这些特征,使其更具代表性。所设计的STAB采用相应输入PAN的高频分量作为权重,以增强剩余块输出特征的空间细节。建立了一个包含两个空间损耗和两个频谱损耗的新的损失函数。分别在空间域和频率域中计算损失。在Gaofen 2和Worldview-2遥感数据上的实验表明,该UAP-Net可以在不需要高分辨率多光谱(HRMS)的情况下有效地融合PAN和LRMS图像。该框架是完全通用的,可用于许多多源遥感图像融合,并达到最佳的性能方面的主观视觉效果和定量评价。

INTRODUCTION

高空间分辨率和高光谱分辨率遥感图像的获取是一个难点。为了弥补这一缺陷,许多卫星同时携带多光谱和全色传感器,以获得低空间分辨率的多光谱图像和高空间分辨率的全色图像。自然地,高分辨率多光谱(HRMS)可以通过融合LRMS和PAN来产生。研究人员已经提出了许多全色锐化方法,其主要可以分为三种类型:组分替换(CS)、多分辨率分析(MRA)和基于模型的方法。基于CS的方法主要将PAN作为表示空间细节的组件。然后,从LRMS提取的另一个空间细节分量被PAN替换以获得HRMS。典型的基于CS的方法包括强度-色调-饱和度(IHS)变换、主成分分析(PCA)、GramSchmidt (GS)和Brovey变换。一般来说,基于CS的方法具有最丰富的空间细节,几乎和PAN一样多。然而,由于替换的分量可能会在一定程度上影响融合图像的光谱,基于CS的方法遭受明显的光谱失真。为了减少频谱失真,已经提出了一些算法,例如频带相关空间细节(BDSD)注入,部分替换CS(PRACS)和Gram-Schmidt自适应(GSA)变换。
基于MRA的方法主要是将MS和PAN分解为高频和低频分量,然后设计不同的融合规则分别对高频和低频分量进行融合。最后通过逆变换得到融合图像。基于MRA的方法主要包括小波变换、离散小波变换、拉普拉斯金字塔、超越小波(例如,剪切波、轮廓波)和基于匹配调制传递函数(MTF)的高斯滤波器的广义LP(GLP)。与基于CS的融合方法相比,基于MRA的融合方法在一定程度上可以减轻融合图像的光谱失真,但在空间细节增强方面并不理想
基于模型的方法将泛锐化任务视为一个逆问题,可以通过最小化具有先验约束的损失函数来解决。基于模型的方法主要包括稀疏表示和深度学习算法。Yang等人首先提出了一种稀疏表示泛锐化方法,该方法假设HR图像和LR图像对于不同的过完备字典具有相同的稀疏系数,并且HR和LR图像字典可以通过字典训练获得。Zhu等人直接使用PAN和下采样PAN作为过完备字典,融合图像的视觉效果得到了改善,但在图像的某些部分丢失了一些空间信息。基于稀疏表示的方法鲁棒性强,可以获得更好的融合性能,然而,它是不容易找到一个最佳的变换基,以获得最稀疏的表示的变换基。
大多数基于深度学习的方法都来自超分辨率(SR)重建。SR主要是建立LR-HR图像对,并使LR图像学习到HR图像的映射。基于SR的第一个泛锐化工作之一是泛锐化CNN(PNN)模型,其仅包含3个卷积层。此后,大量的相关算法被研究,其中一些改进了网络结构,如深化网络,使用剩余网络,使用密集块等等。此外,为了提高频谱和空间质量,已经提出了几种网络结构,例如双流融合网络,双向金字塔网络,编码器-解码器网络和多尺度CNN 。
由于缺乏HR地面实况,基于SR思想的那些泛锐化方法的常见解决方案是遵循Wald协议,使用退化图像作为LR图像,并且原始图像用作HR图像。这可能导致预测的HR图像频谱失真或空间纹理增强不足。为了避免模拟训练数据的退化,许多学者致力于无监督算法的发展。有的采用博弈论的生成对抗网络(GAN)来生成HRMS。Ma等人在GAN的基础上提出了一种称为Pan-GAN的无监督方法,其中生成器分别与光谱鉴别器和空间鉴别器建立对抗博弈,以保留融合图像的丰富光谱和空间信息。Zhou等人开发了一种名为PercepPan的方法,其中网络结构由生成器,重建器和鉴别器组成。PercepPan基于自动编码器和感知损失,不需要退化图像进行训练。Qu等人提出了一种基于自注意机制的泛锐化方法来估计空间变化细节提取和注入函数。Guo等人提出了一种基于模糊核学习的泛锐化方法,该方法可以以无监督的方式学习PAN和MS之间的空间和光谱模糊核。Ni等人开发了一种基于双流CNN的全色锐化方法,该方法结合了两个可学习的退化模块,可以适应复杂的模拟和真实的情况。Zhou等人采用双流生成器从PAN和MS图像中提取模态特定特征,并在特征域中融合提取的特征以重建融合图像。Wang等人开发了一种基于GAN的多尺度全色锐化方法,其中设计了一个多尺度密集生成器网络,从原始图像中提取特征,以生成HRMS图像。此外,另一组研究人员利用MS、PAN和融合图像之间的关系来设计空间约束和光谱一致性。例如,Xiong采用无参考质量评价函数作为损失函数来计算融合图像的光谱损失和空间损失。
近年来,为了提高网络的性能,提高网络的频谱和空间质量,越来越多的研究者关注于模型的损失函数,并考虑了大量的损失函数。例如,将L-1范数惩罚(参数稀疏惩罚)和L-2范数惩罚(权重衰减惩罚)添加到原始损失函数以改善网络的性能。此外,Xu等人提出了一种基于图像结构相似度的空间损失函数,以增强融合过程中空间信息的保留。在空间损失函数中,提取局部亮度、对比度和结构对比度来构造函数,评价融合图像与参考图像之间的结构相关性。受图像质量评价函数的启发,文献受图像质量评价函数的启发,文献[49]、[50]、[51]、[52]将光谱或空间评价指标应用于损失函数,取得了令人满意的效果。此外,为了捕捉融合图像和参考图像之间的感知差异,基于GAN的方法利用感知损失来提取高级语义特征,使得生成的图像可以很好地保留高频信息。将光谱或空间评价指标应用于损失函数,取得了令人满意的效果。此外,为了捕捉融合图像和参考图像之间的感知差异,基于GAN的方法利用感知损失来提取高级语义特征,使得生成的图像可以很好地保留高频信息。
为了克服缺乏真实性的缺点,提出了一种新的无监督注意力泛锐化网络(UAPNet)。无监督网络旨在将MS和PAN直接融合,利用无监督网络将原来的MS和PAN直接馈入网络中生成HRMS,而无需对训练数据进行退化处理。此外,为了更好地保留PAN的空间纹理信息,设计了一种基于空间纹理注意块的PAN高频。在空间纹理注意块中,采用高通滤波器提取PAN的高频分量。PAN的高频分量在梯度变化剧烈的部分(例如,边缘、纹理),而在接近0的部分梯度变化不明显。利用PAN的高频分量作为掩模可以有效地增强融合图像的空间细节。此外,为了保持融合图像良好的光谱信息,我们进一步设计了一个由两个空间损失函数和两个光谱损失函数组成的损失函数,分别在空间域和频率域计算融合图像的光谱损失和空间损失。在频域中计算的损失函数主要用于生成未完成的HRMS,并控制生成HRMS的亮度范围与输入图像一致。在空间域计算的损失函数主要用于对网络模型进行微调,使融合后的图像具有丰富的空间信息,同时频谱失真较小。我们的主要贡献可概括如下。
1)我们设计了一个无监督的注意力泛锐化网络,称为UAP-Net,它可以训练原始的MS和PAN图像,并避免使退化的模拟数据。所提出的UAP-Net是完全通用的,可用于多种多源遥感图像融合模型。
2)提出了一种基于PAN高频分量的空间注意块,使融合后的图像在保持良好的光谱信息的同时具有丰富的空间细节。
3)我们进一步提出了一个有效的混合损失函数计算在空间和频率域。所提出的损失函数优化无监督网络,以提高全色锐化结果的性能。
在这里插入图片描述

PROPOSED FUSION FRAMEWORK

Overview

提出的UAP-Net旨在通过融合PAN和LRMS在没有地面实况(GT)的情况下生成HRMS。设m∈ R w × h × C R^{w×h×C} Rw×h×C和P∈ R W × H × 1 R^{W×H×1} RW×H×1分别表示输入LRMS图像和输入PAN图像。W和H表示PAN的宽度和高度,w和h表示MS的宽度和高度。通常,PAN与MS的空间分辨率比为W/w = H/h = 4。C是MS的光谱带的数目。因此,所需的融合HRMS图像记为M∈ R W × H × C R^{W×H×C} RW×H×C
图1示出了所提出的用于全色锐化的无监督框架的概述。该网络主要由基于残差的特征提取块(Res-block)和空间纹理注意块(STAB)两个模块组成。首先,LRMS m被上采样到m↑∈ R W × H × C R^{W×H×C} RW×H×C,其分辨率与PAN相同。然后,我们连接上采样的LRMS m ↑和原始PAN P作为训练输入T ∈ R W × H × ( C + 1 ) R^{W×H×(C+1)} RW×H×(C+1) 。接下来,使用高通滤波器来获得PAN的高频信息分量Php R W × H × 1 R^{W×H×1} RW×H×1。最后,T和Php被馈送到一系列的Res-block和STAB中以生成HRMS。由于所提出的方法是无监督的,没有参考图像的网络输出,进一步提出了一种新的混合损失函数。所设计的损耗函数包括两个空间损耗和两个谱损耗,分别在空域和频域测量融合后的HRMS图像。

Spatial Texture Attention Block (STAB)

该网络主要由特征提取块和注意力块组成。一般来说,增加网络的宽度和深度可以很好地提高其性能。深度网络通常比浅网络好,但简单地增加网络的深度会导致梯度分散或梯度爆炸。因此,提出了残差网络来解决上述问题。为了使网络能够提取不同层次的特征,改善网络退化问题,使网络更容易优化,我们采用残差网络作为特征提取块。
图2(a)示出了残差网络的结构。由于批量归一化层将拉伸图像的颜色和对比度,导致输出图像变差,因此去除批量归一化层。残差块具有两个卷积层,其后是整流线性单元(ReLU)函数层,卷积核的大小为3 × 3,并且在每个卷积层中使用32个滤波器。是逐像素加法运算。
现有的注意机制大多是通过神经网络的操作产生一个mask。将mask上的值视为权重,对需要注意的点给予更多的权重。由于没有直接监督这些mask的产生,很难解释注意力模型学到了什么。与现有的空间注意模块不同,本文提出了空间注意模块来增强融合图像的空间纹理信息。图2(b)示出了所提出的空间注意力模块的架构。首先,利用PAN的高频信息分量作为权值,由于PAN的高频图像在边缘和纹理部分表现出较高的值,而在亮度变化较小的区域接近于0。使用Php作为空间注意力的权重可以确保它只增强空间细节,也使所提出的STAB更直观和解释性。⊗是逐像素乘法运算。
STAB跟随残差块并且用于增强由残差块提取的特征的空间细节。在所提出的架构中,五个残差块和五个STAB用于融合MS和PAN。
在这里插入图片描述

Hybrid Loss Function

为了在全尺度图像上训练所提出的网络,如图3所示的一种新颖的混合损失函数。在这里插入图片描述
设计损失函数公式为:
在这里插入图片描述
损失函数包含四项,包括两个空间损失函数和两个谱损失函数。ω1、ω2、ω3和ω4是用于平衡这些损失项的贡献的权重。采用lossspatial1度量融合图像的空间损失,其核心是通用图像质量指数(UIQI)。UIQI的表述为:在这里插入图片描述
其中x是输入图像,y是参考图像,σxy是x和y的协方差,σx和σy分别是x和y的方差,x-和y-分别是x和y的平均值。公式中的第一项是x和y之间的相关系数,其范围为[-1,1]。根据Cauchy-Schwartz不等式,第二项和第三项的范围是[0,1]。因此,UIQI的动态范围是[1,1]。当输入图像和参考图像的所有像素相等时,即,x = y并且UIQI取最佳值1。UIQI越接近1,融合图像的空间细节损失越小。然后,lossspatial1公式为:在这里插入图片描述
其中,F是网络输出的融合图像,Pn是堆叠n次的PAN,并且n是融合图像的频带数。通过应用该空间损失函数,融合图像的每个波段的空间纹理信息尽可能接近PAN。
采用lossspectral1测量融合图像的光谱损失,其核心是光谱角映射(SAM)。SAM公式为:在这里插入图片描述
SAM测量x和y之间的光谱信息的相似度。该值越小,网络输出的频谱失真越小,最佳SAM值为0。由于缺乏GT来评估融合图像的光谱失真程度,一种可行的方法是利用Wald算法将融合图像退化到原始MS尺寸,然后计算退化后的融合图像与原始MS之间的光谱损耗。基于此,lossspectral1公式为:

在这里插入图片描述
当仅使用lossspaceal1和lossspectal1时,融合结果具有丰富的空间细节和较小的频谱失真。这是不理想的,并且仍然存在一些缺点,将影响网络训练和融合结果的质量。首先,UIQI使融合图像的每个波段尽可能接近PAN,这可以为融合图像提供良好的空间细节。然而,随着每个频带趋于PAN,频谱失真将不可避免地发生(在极限情况下,融合图像中的每个频带将是PAN)。第二,UIQI和SAM的计算都包含分母。在初始训练中,很容易分母为0,导致Nan损失。第三,UIQI和SAM的小值并不完全等同于融合图像的轻微空间和光谱失真。例如,将图像A的每个像素值放大2倍以得到图像B,然后计算图像A和图像B的UIQi和SAM值。显然,图像A和图像B的UIQi和SAM值都很小,但其他客观质量评价指标可能会受到图像A和图像B之间的不同范围的影响。此外,由于图像A和图像B之间的范围不同,数据显示期间的颜色合成和图像拉伸也会影响视觉效果。
为了使融合结果具有更好的视觉效果,更好的质量评价指标,并使网络易于训练。我们设计了一对在频域计算的损失函数作为上述损失函数的补充。所设计的补充损失函数为,在这里插入图片描述
图像的高频信息对应于急剧变化的部分,即图像的边缘、纹理和细节。lossspatial2计算灰度融合图像和PAN的高频分量的均方误差(MSE),以使融合图像的空间纹理尽可能类似于PAN。上采样的MS可以被视为理想融合图像的分量,以去除高频信息。采用lossspectral2来减小融合图像的低频分量与上采样MS之间的均方误差,以保证融合图像的频谱信息尽可能接近MS。由于在lossspatial2和lossspectral2中使用了MSE,融合图像的亮度范围与输入图像的亮度范围一致

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/956800.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Qt xml解析之QXmlStreamReader

文章目录 背景QXmlStreamReader简单介绍使用QXmlStreamReader添加头文件<QXmlStreamReader>toString()toInt()完整代码 背景 项目中遇到需要解析某个方法返回的xml字符串&#xff0c;奈何C/C中没有原生的方法可供调用&#xff0c;只能使用第三方库&#xff0c;搜了一圈资…

OpenCV之filter2D函数

函数原型&#xff1a; CV_EXPORTS_W void filter2D(InputArray src,OutputArray dst,int ddepth,InputArray kernel,Point anchorPoint(-1,-1),double delta0,int borderTypeBORDER_DEFAULT); src: 原图像&#xff1b; dst&#xff1a;输出图像 &#xff0c;和输入的图像具有…

优秀的ui设计作品(合集)

UI设计师需要了解的九个Tips 1.图片类APP排版突破 规则是死的&#xff0c;人是活的。很多时候&#xff0c;如果需求是比较宽要尝试突破原则&#xff0c;用一些另类的排版方式&#xff0c;其实也是做好设计的本质。在图片类app中&#xff0c;错落一些的排版会使你的作品更有魅力…

Ubuntu系统安装VirtualBox后无发安装“增强功能”的解决办法

Ubuntu系统安装VirtualBox后&#xff0c; 在设备选项中点击曾倩功能没有反应&#xff0c;也不能是用多动和剪切板功能&#xff0c;解决办法如下 1. 安装linux-image Terminal执行: sudo apt-get install --reinstall linux-image-$(uname -r) 2. 安装virtualbox-guest-x11 …

9.Redis-zset

zset zset 有序集合 -> 升序常用命令zaddzcardzcountzrangezrevrange -> reverse 逆序zrangebyscorezpopmaxzpopminbzpopmax / bzpopminzrankzrevrankzscorezremzremrangebyrankzremrangebyscorezincrby集合间操作zinter -> 交集zunion -> 并集zdiff -> 差集zin…

0202hdfs的shell操作-hadoop-大数据学习

文章目录 1 进程启停管理2 文件系统操作命令2.1 HDFS文件系统基本信息2.2 介绍2.3 创建文件夹2.4 查看指定文件夹下的内容2.5 上传文件到HDFS2.6 查看HDFS文件内容2.7 下载HDFS文件2.8 HDFS数据删除操作 3 HDFS客户端-jetbrians产品插件3.1 Big Data Tools 安装3.2 配置windows…

睿趣科技:开抖音小店挣钱吗到底

在当今数字化时代&#xff0c;社交媒体平台成为了创业者们寻找商机和赚钱的新途径。而抖音作为一款风靡全球的短视频分享平台&#xff0c;自然也成为了许多人开设小店、进行创业的选择之一。那么&#xff0c;开抖音小店能否真正实现盈利&#xff0c;成为了一个备受关注的话题。…

并发编程的故事——共享模型之内存

共享模型之内存 文章目录 共享模型之内存一、JVM内存抽象模型二、可见性三、指令重排序 一、JVM内存抽象模型 主要就是把cpu下面的缓存、内存、磁盘等抽象成主存和工作内存 体现在 可见性 原子性 有序性 二、可见性 出现的问题 t线程如果频繁读取一个静态变量&#xff0c;那…

Android安卓实战项目(12)—关于身体分析,BMI计算,喝水提醒,食物卡路里计算APP【支持中英文切换】生活助手类APP(源码在文末)

Android安卓实战项目&#xff08;12&#xff09;—关于身体分析&#xff0c;BMI计算&#xff0c;喝水提醒&#xff0c;食物卡路里计算APP【支持中英文切换】生活助手类APP&#xff08;源码在文末&#x1f415;&#x1f415;&#x1f415;&#xff09; 一.项目运行介绍 B站演示…

第8章 字符输入/输出和输入验证

本章介绍以下内容&#xff1a; 更详细地介绍输入、输出以及缓冲输入和无缓冲输入的区别 如何通过键盘模拟文件结尾条件 如何使用重定向把程序和文件相连接 创建更友好的用户界面 在涉及计算机的话题时&#xff0c;我们经常会提到输入&#xff08;input&#xff09;和输出&#…

Facebook登录SDK

一、Facebook SDK接入 官方文档&#xff1a;https://developers.facebook.com/docs/facebook-login/android 按照流程填写完成 1、选择新建应用 如果已经创建了应用就点【搜索你的应用】&#xff0c;忽略2、3步骤 2、选择【允许用户用自己的Facebook账户登录】 3、填写应用…

简析vue文件编译——AST

简介 首先了解一个概念AST&#xff08;abstract syntax tree&#xff09;抽象语法树&#xff0c;按照大多数教程中的描述&#xff0c;这是一种源代码的抽象语法结构树&#xff0c;树上的每个节点都表示源代码中的一种结构&#xff0c;将源码中的各种嵌套括号等形式&#xff0c…

Android安卓实战项目(13)---记账APP详细记录每天的收入和支出并且分类统计【生活助手类APP】强烈推荐自己也在用!!!(源码在文末)

Android安卓实战项目&#xff08;13&#xff09;—记账APP详细记录每天的收入和支出并且分类统计【生活助手类APP】强烈推荐自己也在用&#xff01;&#xff01;&#xff01;&#xff08;源码在文末&#x1f415;&#x1f415;&#x1f415;&#xff09; 一.项目运行介绍 B站…

antd实现年日输入框联动

效果: 1、默认显示年&#xff0c;日期区间默认显示今年2023——2024 年份显示前5年后5年 2、如果选择了月份&#xff0c;日期区间显示从1月份到12月份 部分代码: (react 使用class类组件)

Lee滤波python实现(还包括frost等滤波)

Lee滤波按定义实现&#xff1a; from scipy.ndimage.filters import uniform_filter from scipy.ndimage.measurements import variancedef lee_filter(img, size):img_mean uniform_filter(img, (size, size))img_sqr_mean uniform_filter(img**2, (size, size))img_varian…

最小生成树 -prim算法

一般无向图建图稠密图-prim算法稀疏图-kruskal算法 prim : 加点法 1.先随机选一个点&#xff0c;加入集合 &#xff0c;之后寻找最短的距离的点加入集合&#xff0c;行程最小生成树。 2.注意最小生成树是不能有回路的&#xff0c; 所以可以把回路设置成最大值&#xff0c;即假装…

idea使用maven时的java.lang.IllegalArgumentException: Malformed \uxxxx encoding问题解决

idea使用maven时的java.lang.IllegalArgumentException: Malformed \uxxxx encoding问题解决 欢迎使用Markdown编辑器1、使用maven clean install -X会提示报错日志2、在Poperties.java文件的这一行打上断点3、maven debug进行调试4、运行到断点位置后&#xff0c;查看报错char…

贝锐蒲公英异地组网方案,如何阻断网络安全威胁?

随着混合云和移动办公的普及&#xff0c;企业网络面临着越来越复杂的安全威胁环境。 大型企业有足够的能力和预算&#xff0c;构建覆盖全部个性化需求的定制化网络安全方案。 但对于广大中小企业来说&#xff0c;由于实际业务发展情况&#xff0c;他们难以在部署周期、预算成本…

Redis数据结构应用场景及原理分析

目录 一、Redis介绍 二、应用场景 2.1 String应用场景 2.2 Hash应用场景 2.3 List应用场景 2.4 Set应用场景 2.5 Zset应用场景 一、Redis介绍 单线程多路复用底层数据结构&#xff1a;全局哈希表&#xff08;key-value&#xff09; 二、应用场景 2.1 String应用…

安装centos7修改网关时出现ifconfig命令找不到的解决方法

系列文章专栏 学习以来遇到的bug/问题专栏 文章目录 系列文章专栏 一 问题描述 二 解决方法 2.1 原因分析 前言 本文主要介绍安装centos7修改网关时出现ifconfig命令找不到的解决方法 一 问题描述 安装centos7修改网关时出现ifconfig命令找不到的情况 二 解决方法 2…