【监督-非监督组合:全色锐化】

news2024/12/25 3:18:36

Supervised-unsupervised combined deep convolutional neural networks for high-fidelity pansharpening

(监督-非监督组合深度卷积神经网络实现高保真全色锐化)
深度学习全色锐化方法因其优异的性能成为近年来的研究热点,基于Wald协议的卷积神经网络全色锐化方法(即,在较粗的降低的分辨率尺度上学习的网络到较细的全分辨率的一般采用)在该研究领域中已经占主导地位很长时间。然而,尺度不变假设可能不够精确,无法充分利用原始全色(PAN)和多光谱(MS)图像在全分辨率下的空间和光谱信息。针对这一问题,提出了一种监督-非监督组合融合网络 (SUFNet) 用于高保真全色锐化。首先,综合考虑参考标签图像网络的鲁棒性,结合多尺度机制、扩张卷积和跳跃连接,提出了一种基于Wald协议的有监督网络SMDSNet。然后,提出了一种无需真实的高空间分辨率(HR)MS标记图像的无监督空间光谱补偿网络(USSCNet),以提高SMDSNet的空间和光谱保真度。在不同卫星数据集上进行的降分辨率和全分辨率实验的定性和定量结果验证了该方法的有效性。此外,USSCNet还可以作为其他全色锐化方法的通用空间谱补偿框架。

介绍

由于卫星成像系统的局限性和其他因素的影响,遥感卫星必须在空间分辨率和光谱分辨率之间进行权衡。相应地,大多数卫星提供高空间分辨率(HR)全色(PAN)图像和高光谱分辨率但相对较低空间分辨率(LR)的多光谱(MS)图像。全色锐化的目的是利用全色图像的高空间优势和质谱图像的光谱优势互补来获得高分辨率质谱图像。到目前为止,研究人员已经开发了多种全色锐化方法,大致可以分为四类:基于组件替换(CS)的方法、基于多分辨率分析(MRA)的方法、基于变分优化(VO)的方法和基于深度学习(DL)的方法。
基于CS和MRA的方法是从传统或一般理解的角度发展起来的。传统意义上,基于压缩感知方法的主要过程包括正投影变换、压缩感知和逆投影变换。具体地,通过在正投影变换之后替换MS在不同域中的空间分量,然后应用逆变换,来获得融合的HR-MS图像。基于MRA的方法的第一步是将MS图像和PAN图像分解为不同的尺度和分辨率,然后采用一定的融合策略对不同分辨率的图像进行融合。基于VO的方法将融合过程视为逆问题,其中基于稀疏表示理论或贝叶斯理论,利用先验正则化约束来构造变分融合能量泛函。通过使用迭代优化算法最小化能量函数来重建全色锐化图像(例如,梯度下降)。与基于CS和MRA的方法相比,基于VO的方法通常具有更好的空间和光谱质量。然而,大多数基于VO的方法是基于线性关系的假设,这可能不能准确地表示融合图像和观测值之间的复杂关系。

基于DL的全色锐化方法近年来受到越来越多的关注,该方法依赖于大规模数据集学习理想融合后的HR-MS图像与观测值之间的非线性关系。据我们所知,Huang等人提出了第一种基于DL的全色锐化方法,该方法通过深度神经网络从HR/ LR全色图像中学习非线性关系。随后,Masi等人提出了一种基于卷积神经网络(CNN)的全色锐化方法(PNN),其通过类似于超分辨率CNN的结构的三层CNN来实现。Zhong等人提出了一种两阶段图像融合算法,该算法基于CNN对MS图像进行超分辨率处理,并采用Gram-Schmidt模型对增强后的MS和PAN图像进行融合。
然而,上述基于DL模型的全色锐化方法仅采用了三层卷积,通常不能充分利用DL模型强大的非线性表示能力。因此,需要开发更深层次的网络来改善DL模型的性能。特别是Yuan等人提出了一种多尺度多深度卷积神经网络(MSDCNN),它将多尺度提取和多深度共享引入到CNN结构中,以提高融合性能。Wei等人提出了一种具有双流网络的耦合多尺度卷积(CMC)模型,该模型采用多尺度非对称卷积来分别提取PAN图像和MS图像的特征。Zhang等人在传统方法和CNN结构的基础上,引入了双向金字塔网络(BDPN)来解决全色锐化问题,将从PAN图像中提取的多层次细节特征注入到上采样的MS图像中,重建全色锐化图像。受残差网络成功的启发,Yang等人引入了泛锐化深度网络(PanNet),该网络在高通域中训练网络以保持空间,并将上采样MS图像添加到网络输出以保持光谱。Deng等人提出了一个详细的注入网络(FusionNet),并引入了三个带有残差网络的网络来提高融合性能。Wei等人引入了使用深度残差的深度神经网络(DRPNN)以获得高质量的融合结果,这允许网络学习更深的特征以增强模型的非线性能力。Scarpa等人提出了一种目标自适应的基于神经网络的全色锐化方法(TAPNN),并引入了一种目标自适应的使用模态,该方法在MS和PAN图像之间的失配方面也具有良好的性能。Liu等人提出了一种双流融合网络(TFNet),通过更深的残差网络在特征层面融合MS和PAN图像。除了上述基于CNN的工作外,还有一些基于GANs的工作。Liu等人提出了一种基于GAN的深度神经网络用于全色锐化(PSGAN),这是首次尝试使用GAN生成高质量全色锐化图像。Shao等人提出了一种将自动编码器与条件GAN相结合的深层神经网络(RED-cGAN),该网络使用两分支网络提取空间和光谱信息,并通过自动编码器结构生成全色锐化图像。Ma等人提出了一种基于GAN(Pan-GAN)的无监督全色锐化框架,该框架采用两个不带地面真实值的鉴别器分别保留光谱和空间信息。
总体而言,迄今为止,基于神经网络的全色锐化方法,特别是基于Wald协议的监督方法在该领域占据了主导地位。然而,大多数基于DL的有监督方法都是以原始MS图像作为伪地面真值,在降低的分辨率下进行网络训练,然后将训练好的模型直接应用于原始PAN和MS图像,得到全分辨率下的融合图像。一方面,直接采用由粗到细训练的模型可能不太准确,并且可能导致一些尺度相关的问题。由于PAN和MS图像之间空间分辨率的巨大差异,尺度不变假设不成立。另一方面,基于Wald协议的DL融合方法未能充分利用原始全色和MS图像在全分辨率下的空间和光谱信息,导致融合结果中空间和光谱信息的丢失。
为了克服上述问题,本文提出了一种监督-非监督组合融合网络(SUFNet)来实现高保真全色锐化。首先,在综合考虑参考标签图像网络鲁棒性的基础上,构造了一种基于Wald协议的监督网络。然后将训练好的有监督网络应用于原始PAN和MS图像以获得初步融合图像。其次,提出了一种有趣的无监督空间-光谱补偿网络,以改善初步融合图像的空间细节和光谱保真度。最后,通过有监督-无监督组合网络得到高保真的融合图像。

贡献

1)提出了一种基于监督-非监督融合网络(SUFNet)的高保真全色锐化方法,与其他基于DL的深度网络技术相比,该方法能够充分利用全色图像的空间细节和质谱的光谱信息。
2)对于该监督网络,设计了两种多尺度机制,分别使用普通卷积和膨胀卷积来充分提取PAN图像的空间信息。此外,在卷积网络中,局部和全局跳跃连接分别用于防止图像丢失空间细节和光谱信息。
3)综合考虑有监督网络中可能存在的空间和光谱损失,提出了一种有趣的无监督空间-光谱补偿网络(USSCNet)。设计了多尺度残差模块和长跳跃连接注入缺失的空间细节进行空间谱增强,设计了两个尺度的谱损失进行谱补偿。此外,USSCNet还可以扩展到其他全色锐化融合方法中,进一步提高融合的保真度。

方法

本文提出了一种用于高保真全色锐化的监督-非监督组合融合网络(SUFNet),如图1所示。请添加图片描述
首先,考虑到真实的HR-MS参考图像不可用于网络训练,提出了一种基于Wald协议的有监督融合网络(即对原始PAN和MS图像进行空间退化生成训练样本,并将原始MS作为网络训练的ground truth)。该方法综合考虑了多尺度机制、膨胀卷积和跳跃连接。然后,将训练好的模型应用于原PAN和MS图像的全分辨率融合。在此基础上,综合考虑降分辨率训练数据集与全分辨率测试图像之间空间分辨率尺度差异可能导致的信息损失,提出了一种新颖的无监督空间-光谱补偿网络(USSCNet),以改善空间细节和光谱保真度。在USSCNet中,MS到PAN网络(MSTPNet)被设计用于将MS图像转换为PAN图像以改善空间细节。
为了便于理解,将尺寸为w × h × B的原始MS图像表示为MS,w和h分别为MS图像的宽度和高度,B表示MS条带的数量。将尺寸为W × H × 1的高分辨率PAN图像表示为PAN,W和H分别为PAN图像的宽度和高度。为方便起见,表1中列出了一些重要的缩略语。请添加图片描述

Supervised fusion network (SMDSNet)

为了充分利用PAN图像中的空间细节和MS图像中的光谱信息,我们提出了一种使用多尺度机制、扩张卷积和跳跃连接的监督网络(SMDSNet),如图2所示。请添加图片描述
网络中使用了两种不同的多尺度机制,以提高对各种复杂场景特征提取的鲁棒性。在第一种多尺度机制中,多尺度卷积单元包含三个具有不同核大小的卷积运算。在第二种多尺度机制中,利用扩张卷积以相同的参数和计算来扩大感受野。此外,受DenseNet结构的启发,采用跳跃连接避免特征信息的丢失,将前一层的特征信息转移到当前层以保持特征信息,避免或减少消失梯度问题。
损失函数可表示为:在这里插入图片描述

Unsupervised spatial-spectral compensation network (USSCNet)

提出了一种无监督空间谱补偿网络(USSCNet)来补偿SMDSNet中的信息损失,如图3所示。请添加图片描述
首先通过SMDSNet得到初步的全分辨率融合结果(FMS),然后利用预训练的MSTPNet将FMS转换为伪PAN图像。SMDSNet在全分辨率下丢失的空间细节是通过从原始PAN图像中减去伪PAN图像获得的。然后将丢失的空间细节注入到FMS中,得到最终的融合结果。然后将丢失的空间细节注入到FMS中,得到最终的融合结果。

MSTPNet

为了获得SMDSNet输出中丢失的空间细节,设计了一个称为MSTPNet的网络,将MS图像映射到单波段伪PAN,如图4所示。请添加图片描述
映射关系可以用公式表示为:
请添加图片描述

其中FMS是SMDSNet在全分辨率下的融合结果。原始MS图像和对应的降采样PAN图像分别作为输入和地面真实值来训练MSTPNet。
损失函数可以用公式表示为:在这里插入图片描述
SSIM是结构相似性指数度量,MS表示原始MS图像, P A N ( D ) PAN^{(D)} PAN(D)表示下采样PAN图像。fMSTP(⋅)的最优解是通过最小化Eq.(3)中定义的Adam优化损耗函数来实现的。

Multiscale residuals module

为了实现空间细节保留和感受野扩大之间的平衡,多尺度残差模块被设计为完全提取多上下文特征信息,如图5所示。请添加图片描述
光谱保护,获得的FMS SMDSNet直接添加到输出的无损的信息传播。此外,跳过连接是用来防止信息丢失的过程中网络传播和USSCNet实施更有效的培训。

Unsupervised loss function

分别设计空间损失函数和光谱损失函数,以保持PAN图像的空间结构和MS图像的光谱信息,用于无监督训练。特别地,使用预训练的MSTPNet将MS图像映射到用于空间损失函数的单波段伪PAN图像。在光谱损失函数方面,设计了一种新的两尺度一致性光谱损失函数,以保持网络输出与MS图像之间相似的光谱信息。损失函数可描述如下:在这里插入图片描述

Spatial constraints

利用MSTPNet可以建立MS图像与单波段伪PAN图像之间的映射关系,也可以将USSCNet获得的HRMS图像转换为伪PAN图像。这样,USSCNet的输出和原始PAN图像之间的空间相似性可以被约束。为了进一步确保亮度、对比度和结构的相似性,我们将SSIM和MSE添加到空间约束,如下所述:在这里插入图片描述
在这里插入图片描述

Spectral consistency

设计了两个尺度的光谱损失,以确保USSCNet的输出在光谱上与原始MS图像相似,而不损失高频信息。我们首先将HR-MS下采样到与MS相同的分辨率以获得下采样的HR-MS,表示为 H R M S ( D ) HRMS^{(D)} HRMS(D),然后将 H R M S ( D ) HRMS^{(D)} HRMS(D)与对准的MS进行比较以计算光谱一致性损失:在这里插入图片描述
然而,如果仅在下采样版本中设计频谱一致性,则会出现频谱失真。通过观察发现,重采样后的质谱图像与模糊后的HR-MS图像在光谱和空间信息上是一致的。因此,使用高斯滤波器模糊HR-MS图像,然后用上采样的MS图像约束HR-MS图像以实现光谱信息的高保真度。上采样尺度下的频谱损失函数可以描述如下:
请添加图片描述
其中 M S ( U ) MS^{(U)} MS(U)表示原始MS图像的上采样版本,GS(⋅)表示高斯滤波操作。最终的光谱损失函数可以描述如下:在这里插入图片描述
与不考虑训练和测试阶段规模差异造成的信息丢失问题的监督方法相比,USSCNet采用无监督方式弥补监督方法中的信息丢失。此外,USSCNet还可以扩展到其他全色锐化方法,进一步提高图像的保真度。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/126737.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

GBASE合芯科技打造“国产芯片+数据库”国产替代解决方案

数据库的重要性 数据库是国产化基础软件的重要部分,是信息系统的核心。我国信息技术软硬件底层标准、架构、产品、以及生态体系被外国把控,这些上游核心技术遭遇限制严重影响了我国关键科技和产业的发展。2018年,中兴通讯被列入美国实体清单…

2022/12/29总结

今天AC了一道题目: P1825 [USACO11OPEN]Corn Maze S (1条消息) P1825 [USACO11OPEN]Corn Maze S_lxh0113的博客-CSDN博客 然后下面是学到的知识: 之前学习算法的时候总是牵扯到图,但是关于图的一些知识并没有了解。下面是有关图的基础知识…

区块链技术的官方材料整理

引自:区块链白皮书(2018年)、区块链白皮书(2020年)、中国区块链技术和应用发展白皮书、可信区块链赋能数字政府应用指南 区块链的概念 定义:区块链(Blockchain)是一种由多方共同维…

如何在 SwiftUI macOS 应用程序中显示和隐藏边栏

用户可以通过在边缘周围拖动来调整侧边栏的大小。 如果他们将它拖得足够远,侧边栏将关闭,并且无法将其设置回来。 本文将告诉您如何通过添加其他选项来显示和隐藏边栏来缓解此问题。 侧边栏一旦折叠,就无法恢复。 拖动左边缘会调整窗口大小,而不是将侧边栏带回来。 有两种…

力扣 1764. 通过连接另一个数组的子数组得到一个数组

题目 给你一个长度为 n 的二维整数数组 groups ,同时给你一个整数数组 nums 。 你是否可以从 nums 中选出 n 个 不相交 的子数组,使得第 i 个子数组与 groups[i] (下标从 0 开始)完全相同,且如果 i > 0 &#xff…

【大型电商项目开发】订单功能实现(拦截器、feign丢失请求头、接口幂等性)-55

一:订单概念 1.1 订单中心 电商系统涉及到 3 流,分别时信息流,资金流,物流,而订单系统作为中枢将三者有机的集合起来。订单模块是电商系统的枢纽,在订单这个环节上需求获取多个模块的数据和信息&#xff0…

多线程问题(三)

目录 一、线程安全的单例模式 1、饿汉模式 2、懒汉模式 二、阻塞队列 三、定时器 1、标准库中定时器的使用用法 2、模拟实现定时器 a、首先需要创建出一个专门的类来表示schedule中的任务(TimerTask) b、使用合适的数据结构组织任务 c、…

Servlet基础教程 (保姆级教学)

Servlet基础教程一、Servlet 是什么二、第一个 Servlet 程序2.1 创建项目2.2 引入依赖2.3 创建目录2.4 编写代码2.5 打包程序2.6 部署程序2.7 验证程序三、更方便的部署方式3.1 安装 Smart Tomcat 插件3.2 配置 Smart Tomcat 插件四、常见的访问出错4.1 出现 4044.2 出现 4054.…

【jrebel and xrebel问题记录】激活时出现LS client not configued

教程目录问题描述所使用的环境和版本解决过程手动下载jrebel结束语问题描述 笔者在重装另一台电脑的时候又遇到了这个安装jrebel and xrebel进行激活的问题 但是我在网上找了很多的办法(其实都是相同的办法,只是在尝试别人不同的用于激活的服务器&#…

【Java编程进阶】方法初识

推荐学习专栏:Java 编程进阶之路【从入门到精通】 文章目录1. Java 方法初识2. 方法的创建与使用3. 方法的分类3.1 无参无返回值3.2 无参带返回值3.3 有参无返回值3.4 有参带返回值4. 递归方法5. 总结1. Java 方法初识 方法是组合在一起来执行操作语句的集合&#…

k8s收集日志

k8s收集日志 一.收集控制台日志 采用fluentdeskibana来做 所需要的文件可以在这里找 https://github.com/kubernetes/kubernetes/tree/v1.23.0/cluster/addons/fluentd-elasticsearch1.创建目录并下载所需文件 cd /root/k8s/yaml/efk [rootworker1 efk]# ll total 44 -rw-…

绝缘子红外图像检测项目(TF2)

目录 1. 项目背景 2. 图像数据集介绍 labelimg的安装流程: 1. 打开Anaconda Prompt(Anaconda3) 2. 创建一个新环境来安装labelimg 3. 激活新创建的环境labelimg 4.输入 5.输入labelimg 即可运行 3. 模型介绍 4. 模型性能测试 1. 项目…

Linux学习笔记——Linux实用操作(二)

04、Linux实用操作 4.6、IP地址、主机名 4.6.1、IP地址、主机名 学习目标: 掌握什么是IP地址掌握什么是主机名掌握什么是域名解析 4.6.1.1、IP地址 1、每一台联网的电脑都会有一个地址,用于和其它计算机进行通讯。 IP地址主要有2个版本&#xff0…

2023上半年软考高级-信息系统项目管理师【名师授课班】

信息系统项目管理师是全国计算机技术与软件专业技术资格(水平)考试(简称软考)项目之一,是由国家人力资源和社会保障部、工业和信息化部共同组织的国家级考试,既属于国家职业资格考试,又是职称资…

2022年圣诞节 | matlab实现炫酷的圣诞树

*2022年圣诞节到来啦,很高兴这次我们又能一起度过~ 这里的部分代码已经在网上出现过,做了部分优化。是matlab版本。 一、内容介绍 这段代码是一个生成3D圣诞树的Matlab函数。运行该函数时,它使用圆柱函数创建圣诞树的 3D 表面,对…

【一】微服务技术栈导学

微服务技术栈导学什么是微服务?微服务技术栈注册中心配置中心服务网关分布式缓存分布式搜索消息队列分布式日志服务&系统监控和链路追踪自动化部署微服务技术栈包含知识点学习路线知识内容来自于黑马程序员视频教学和百度百科。博主仅作笔记整理便于回顾学习。如…

Android设计模式详解之适配器模式

前言 适配器模式在Android开发中使用率很高,如ListView、RecyclerView; 定义:适配器模式把一个类的接口变换成客户端所期待的另一个接口,从而使原本因接口不匹配而无法在一起工作的两个类能够在一起工作; 使用场景&…

2023年加密行业会更难吗?欧科云链研究院“七大趋势预测”

回望2022,加密行业遭遇了种种不可控因素而导致的艰难险阻,也在变革与发展中孕育着生机与活力。 这一年,我们亲眼目睹了Luna暴雷,三箭资本、FTX这些曾经被认为“大而不倒”的机构接连倒下,市场信心严重受挫;…

登陆港股市场,阳光保险的 “价值锚点”

不确定性环境里,信心比黄金还重要。 最近,利好信号频频出现在保险行业,资本信心不断加固。上个月月底,个人养老金制度启动实施,市场迅速传来喝彩声。这不仅将加快推动养老保险作为第三支柱的壮大,而且还为…

ARM体系架构中的存储系统

在计算机系统当中,数据的存储是以字节为单位的,每个地址单元当中都可以存放一个字节的数据,每个字节为8bit。在C语言中编译器为char型的数据分配了一个字节的存储空间,为long型的数据分配了4个字节的存储空间,为int型的…