【双向传输ConvLSTM网络:Pan-Sharpening】

news2024/11/24 22:58:20

D2TNet: A ConvLSTM Network With Dual-Direction Transfer for Pan-Sharpening

(D2TNet:用于泛锐化的双向传输ConvLSTM网络)

在本文中,我们提出了一种有效的卷积长短期记忆(ConvLSTM)网络,具有双向传输的泛锐化,称为D2TNet。我们设计了一个特殊结构的ConvLSTM网络,允许双向通信,包括多尺度信息和多级别信息。一方面,由于空间信息对尺度的敏感性和光谱信息对水平的敏感性,提取多尺度、多层次的信息,便于更充分地利用源图像。另一方面,利用ConvLSTM捕获多尺度信息和多层次信息之间的强依赖关系。此外,我们还引入了多尺度损失,使不同尺度之间相互促进,从而产生更接近地面真实的高分辨率多光谱图像。

INTRODUCTION

由于卫星强大的地面测量能力,其传感器捕获的遥感图像包含了丰富的地面信息。低分辨率多光谱(LRMS)图像和全色(PAN)图像是两种常见的捕获方式。前者具有高光谱分辨率而低空间分辨率的特点,后者则具有相反的特点。为了满足一些实际应用的需要(如土地调查、环境监测和目标检测),pansharpening方法将捕获的LRMS图像和PAN图像融合在一起,产生理想的高分辨率多光谱(HRMS)图像。因为生成的HRMS图像中具有优良的特性,泛锐化已成为遥感图像处理领域的研究热点。
在过去的几十年里,泛锐领域受到了越来越多的关注。人们提出了各种传统的方法来解决泛锐化问题。一般来说,传统的泛锐化方法大致可分为四类:基于组件替换(component substitution, CS)的方法、基于多分辨率分析(multiresolution analysis, MRA)的方法、基于CS/MRA混合的方法和基于模型的方法。由于地物的复杂性和不同传感器捕获的光谱特征的多样性,传统方法的手工设计使得原始图像与目标HRMS图像之间难以建立联系。
幸运的是,在过去的几年里,由于神经网络强大的特征提取能力和非线性,深度学习已经成为人们关注的焦点,并被引入到各种各样的任务中,包括图像融合。基于深度学习的泛锐化方法可以分为基于卷积神经网络(CNN)的方法和基于生成对抗网络(GAN)的方法。大多数基于cnn的方法构建网络来提取特征,融合特征,重构HRMS。编解码器网络、密集卷积网络和残差卷积网络是常用的网络结构。在此基础上,基于GAN的方法引入一个生成器和一个鉴别器,通过它们之间的最小-最大博弈实现融合过程,不存在真值。基于CNN的方法和基于GAN的方法在经过大量数据训练后,都能够从源图像到目标图像建立更加鲁棒的非线性映射,从而摆脱传统方法的局限性,达到最先进的性能。
尽管目前基于深度学习的泛锐化算法已经取得了令人印象深刻的成果,但仍有一些紧迫的问题需要解决。一方面,以往的作品大多是将原始尺寸的LRMS和PAN图像直接输入到网络中。然而,不同传感器捕获的不同地物特征存在较大差异。因此,不同尺度的图像可以包含部分不重叠的信息。考虑多尺度信息,增强它们之间的交互作用,可以更好地利用源图像的多尺度信息,从而使融合结果包含更多的特征信息。另一方面,虽然一些泛锐化方法考虑了多尺度信息,但它们往往通过密集块或Resblocks来关联不同尺度和不同层次的信息。然而,不同尺度、不同层次的信息存在很强的依赖性。不加区分地传递信息会导致无效或冗余信息的增加,同时降低有效信息的地位。如何正确传递信息是一个值得思考的问题。在这里插入图片描述

为了继承深度学习的优势并解决上述问题,我们提出了一种有效的双向迁移泛锐化方法,称为D2TNet。具体来说,双向传递包括多尺度、多层次的信息交互。结合卷积长短期记忆(ConvLSTM)在处理长期信息依赖方面的优势,设计了一个如图1所示的八字形卷积长短期记忆网络,更好地解决双向信息交互问题。这种特殊的结构利用ConvLSTM中的三个门来实现不同尺度和层次之间的长期信息交互。它可以更充分地利用原始信息,从而获得更丰富的空间细节和更真实的光谱特征。除了八字形的ConvLSTM结构外,我们还在总损失函数中引入了三尺度的信息损失,使得生成的HRMS图像空间和光谱分布更接近地面真实值。
我们的贡献可以总结如下
1)提出了一种基于特定ConvLSTM结构的有效信息双向传递泛锐化方法,实现了不同尺度和层次间的长期信息交互,从而更充分地利用了原始信息,获得了更丰富的空间细节和更真实的光谱特征。
2)引入了一种包含三尺度损失的新型损失函数,增强了融合结果与地面真值的一致性。
3)进行了广泛的实验,以验证我们的D2TNet在具有高效率的同时从最先进的方法中脱颖而出。

RELATED WORK

Deep-Learning-Based Pan-Sharpening Methods

近年来,随着深度学习在图像处理领域的发展,基于深度学习的泛锐化方法越来越受欢迎。这些方法大致可以分为基于CNN的方法和基于GAN的方法。Masi等人受到基于CNN的图像超分辨率处理方法SRCNN的启发,引入PNN解决泛锐化问题,这是第一个基于CNN的泛锐化方法。它将插值后的LRMS和原始PAN图像叠加在一起,并将它们作为输入生成HRMS图像。PNN网络结构简单,效率高。此外,Liu等提出了利用特征提取能力的TFNet的CNN。它构建了一个编码器-解码器网络来实现特征提取、特征融合和重构过程。Xu等提出了以空间信息和光谱信息为重点的SDPNet。具体来说,设计了空间编解码器和光谱编解码器来选择两幅原始图像之间唯一的特征映射。此外,Wang等介绍了基于ConvLSTM的MPNet。它利用原有的ConvLSTM将LRMS和PAN图像在不同层次上进行特征融合,而没有充分利用ConvLSTM来驱动融合后的图像包含更有效的信息。除了上述方法外,还有一些基于多尺度特征的方法。Wang等提出了MSDRN,它是一种多尺度深度残差网络。它将拼接的原始图像下采样到不同的尺度,并通过上卷积和拼接将它们连接起来。Xu等提出了一种名为CPNet的多尺度网络。首先对PAN图像进行2次和4次降采样,并对LRMS进行相应次数的上采样,得到3组不同尺度的输入。在我们的方法中,我们遵循在CPNet中获得多尺度图像的方法。然而,他们将不同尺度的图像联系起来的方式是“pixel shuffle”,这是一种主观的人类决定,会导致信息丢失的风险。之后,Jin等人提出了一种新的泛锐化方法,利用拉普拉斯金字塔将图像分离到不同的尺度。对于每个尺度,设计一个融合CNN,得到融合结果。然而,它仅通过共享参数来关联多尺度特征,这种联系显得很弱,不足以充分利用多尺度特征。此外,上述方法中的多级信息传递都是通过稠密块或Resblocks来实现的,忽略了浅层和深层之间的关系。
与基于CNN的方法不同,基于GAN的方法通过生成器和鉴别器之间的对抗过程来实现融合。Liu等提出了PSGAN,首次将GAN引入到pansharpening中。设计了一个融合PAN和MS图像的生成器,并利用鉴别器来减小融合图像与地面真实之间的差距。之后,Shao等人采用残差编码器-解码器网络提出了RED-cGAN。条件鉴别器的设计可以进一步补充最终结果中的空间信息。此外,Ma等人提出了使用双鉴别器的Pan-GAN,这是一种没有接地真值的无监督方法。双重鉴别器使结果看起来既像PAN图像又像LRMS图像,从而既具有PAN图像的空间信息又具有LRMS图像的光谱信息。
在上述方法中,没有利用两幅原始图像之间的多尺度和多水平信息或没有适当关联,它们中的任何一种都可能导致光谱畸变或空间畸变。本文提出了一种考虑多尺度、多层次有效信息通信的新方法,使原始信息得到更充分的利用。

Convolutional Long Short-Term Memory

长短期记忆(LSTM)是一种擅长处理长序列记忆问题的网络。与普通网络结构相比,LSTM通过增加三个门,即输入门、输出门和遗忘门,改变了内部网络结构。输入门对两个元素(包括前一个时间戳的输出和当前时间戳的输入)进行非线性变换,以获得新的输入。遗忘门根据前一个时间戳和当前时间戳的状态选择性地更新状态向量。输出门根据遗忘门控制当前时间戳的输出。
当时间数据为三维图像时,普通LSTM难以描述点间复杂的空间特征。为了更好地描述图像之间的时空关系,引入了ConvLSTM。它最早由Xingjian等人提出,作者通过实验验证了ConvLSTM在获取时空关系方面优于LSTM。
由于ConvLSTM在传递图像信息方面的成功,它被广泛地应用于图像处理领域,包括图像分类、图像分割等。只有Wang等引入了基于ConvLSTM的MPNet来解决泛锐化问题。然而,他们利用原有的ConvLSTM对LRMS和PAN图像进行了不同层次的特征融合,并没有充分利用ConvLSTM来驱动融合后的图像包含更有效的信息。由于ConvLSTM可以合理地筛选有用的信息并将其传递到下一个时间戳,因此我们利用它来增强多尺度和多层次之间的信息通信。

PROPOSED METHOD

Problem Formulation

一方面,有必要提取不同层次的分层特征,因为它们有助于更全面地表示原始信息。此外,CNN提取的深层低频特征可以看作是对浅层高频特征的进一步提取;深层对浅层有很强的依赖性。因此,我们设计了多层ConvLSTM来捕捉它们之间的差异,从而学习更准确的层次光谱特征。另一方面,由于不同尺度的空间细节和光谱特征存在差异,关联多尺度信息有利于保持更丰富的空间细节和更真实的光谱特征。此外,低规模信息和高规模信息也是基于同样的原因相互依赖的。因此,我们还设计了多尺度ConvLSTM来关联多尺度特征,以保持更丰富的空间细节和更真实的光谱特征。
因此,为了更好地利用原始信息,有效地与多尺度、多层次信息交互,我们利用ConvLSTM在信息传输方面的优异性能,提出了一种通过ConvLSTM网络(D2TNet)双向(多尺度、多层次)传输的pansharpening方法。
整个框架如图2所示。生成多尺度图像以获取层次信息。具体来说,对LRMS图像进行上采样,得到LRMS↑2和LRMS↑4。同样,对PAN图像进行下采样,得到PAN↓2和PAN↓4。将三组相同尺度的图像进行串联,分别送入三流(上、中、下)网络,如图2所示。在这里插入图片描述

为了实现我们的目标,我们设计了八字形的ConvLSTM网络来连接不同尺度和不同层次的信息。为了向ConvLSTM网络提供相同类型的特征,我们让卷积层在ConvLSTM之前共享参数。此外,由于我们的损失函数利用了三流网络的所有乘积,最后的卷积层也共享参数,以保证中间和底部的流网络有助于生成HRMS。

Network Architectures

最终确定的网络结构如图2所示。顶流网络的网络参数如图3所示。
在这里插入图片描述
事实上,在顶部、中间和底部流网络中,相应的卷积层具有相同数量的输入或输出通道,只是它们的规模大小不同。简单地说,我们只给出了顶流网络的网络参数
Conv(·)中的三个参数分别表示内核大小、输入通道数和输出通道数。除最后一层使用tanh外,所有卷积层的激活函数都是漏整流线性单元(ReLU)(lrelu) 。ConvLSTM(·)中的三个参数分别表示单元数量、第一个单元的输入通道和最后一个单元的输出通道。更具体地说,每个单元具有相同的输入通道32和相同的输出通道32,这使得它易于在多尺度和多电平之间传输状态。此外,由于学习效率的优势,残差网络在实施过程中被充分利用。在这里插入图片描述

对于ConvLSTM各单元,其内部网络架构如图4所示。计算过程可表述如下:在这里插入图片描述
其中·表示乘法,*表示卷积。
在我们的方法中,Xt表示该单元的输入,Ct−1、Ht−1、Ct和Ht分别表示最后一个单元的状态、最后一个单元的输出、这个单元的状态和这个单元的输出。当这个单位是第一个单位时,我们设Ct−1和Ht−1都为零,这也称为初始态。从图2中,我们发现一个单元有可能有两个输入状态,例如,ConvLSTM1的单元5;它不仅接收从unit2传入的状态,还接收从unit4传入的状态。在这种情况下,unit4首先被上采样到unit2的大小;然后,我们把所有的输入状态加起来得到最终的输入状态。各单元的具体操作如下(1)-(5)。首先,将Xt、Ht−1和Ct−1经过卷积积分到输入门,实现了Xt的有效信息保持在Ct中。同样地,同样的元件被输入到遗忘门以筛选从Ct−1到Ct的信息,输出门控制从Ct到Ht的信息输出量。首先,将Xt、Ht−1和Ct−1经过卷积积分到输入门,实现了Xt的有效信息保持在Ct中。同样地,同样的元件被输入到遗忘门以筛选从Ct−1到Ct的信息,输出门控制从Ct到Ht的信息输出量。

Loss Functions

我们的损失函数包含三个部分,对应于三流网络。与传统的仅对融合图像进行约束相比,这种约束更强,使最终的融合图像更接近地面真实。整个损失函数可以表示为:
在这里插入图片描述
其中Ltop、Lmiddle和Lbottom分别表示这三种流网络的损失函数。λ1和λ2被用来在(6)中的三个部分之间进行权衡。

  1. Loss Function of Top Stream Network: 对于顶部流网络,我们期望生成的HRMS尽可能接近地面真相。我们从光谱和空间两个角度约束了HRMS的生成。具体地说,我们使用结构相似度(SSIM)指数测量和Frobenius范数来约束HRMS与地面真值之间光谱信息的相似性,并使用梯度损失来约束空间细节的相似性。此外,为了进一步约束特征,我们将得到的HRMS降采样到LRMS大小,并强制其特征信息收敛。因此,确定Ltop在这里插入图片描述
    HRMS表示顶端流网络的生成图像,这也是最终结果。G表示地面真值,根据文献[31]中引入的Wald协议得到。H、W、C分别表示HRMS图像的高度、宽度和通道数。SSIM(·)表示两个元素之间的SSIM。利用ξ1和ξ2在式(7)中的四个部分之间进行权衡。
  2. Loss Functions of Middle and Bottom Stream Networks:对于中间和底部流网络,我们以与处理顶部流网络相同的方式约束它们。它们的损失函数如下所示:在这里插入图片描述
    其中,HRMS2和HRMS4分别代表中流网络和底流网络的产物。G↓2和G↓4是将接地真值降低到原始尺寸的一半或四分之一的产品。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/980784.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【ARM CoreLink 系列 3 -- CCI-550 控制器介绍 】

文章目录 CCI FamilyCCI-550 简介CCI-550 功能CCI-550 Interfaces Snoop filter 使用背景CCI-550 Snoop filter 上篇文章:ARM CoreLink 系列 2 – CCI-400 控制器简介 CCI Family CCI-550 简介 Arm CoreLink CCI-550 Cache Coherent Interconnect 扩展了 CoreLink…

sentinel加密狗使用及规则配置

Sentinel加密狗是一种硬件加密设备,用于保护软件应用程序免受未经授权的访问和复制。它可以提供软件许可管理、访问控制和数据保护等功能。下面是Sentinel加密狗的使用及规则配置的相关介绍。 Sentinel加密狗的使用 插入加密狗:将Sentinel加密狗插入计算…

用滑动条做调色板---cv2.getTrackbarPos(),cv2.creatTrackbar()

滑动轨迹栏作调色板 cv.createTrackbar(‘R’, ‘image’, 0, 255, nothing) 参数:哪个滑动轨迹栏,哪个窗口,最小值,最大值,回调函数 cv.getTrackbarPos(‘R’, ‘image’) 参数:轨迹栏名,窗口…

IMAU鸿蒙北向开发-2023年9月5日学习日志

1. 5种调试方式 1.1 Previewer 在侧边 Previewer 选项卡内可以预览Entry。 如果要单独预览组件,可以在给组件加Preview 装饰器 1.2 Local Emulator(本地模拟) 1.3 Remote Emulator(远程模拟) 使用时需要登录华为开发…

FSK解调技术的FPGA实现

本原创文章由深圳市小眼睛科技有限公司创作,版权归本公司所有,如需转载,需授权并注明出处 一、FSK信号的解调原理 FSK信号的解调也有非相干和相干两种,FSK信号可以看作是用两个频率源交替传输得到的,所以FSK的接收机由…

[构建 Vue 组件库] 小尾巴 UI 组件库 —— 横向商品卡片(仿淘宝)

文章归档于:https://www.yuque.com/u27599042/row3c6 组件库地址 npm:https://www.npmjs.com/package/xwb-ui?activeTabreadmegitee:https://gitee.com/tongchaowei/xwb-ui 下载 npm i xwb-ui配置 按需导入 import {组件名 } from xwb-…

css中flex和flex-grow的区别

设置了1个class为parent且宽度为700px的div父级元素&#xff1b; 它有3个子元素&#xff0c;分别宽高为100px&#xff1b; 其中item2的元素flex值为1&#xff0c;item3的元素flex值为2 <!DOCTYPE html> <html lang"en"> <head><style>.pare…

车船边缘网关是如何给车辆船只定位的?

随着智能交通系统的不断发展&#xff0c;车路协同成为了重要的研究方向之一。而AI边缘计算网关在这个领域中发挥着至关重要的作用。本文将重点介绍AI边缘计算网关在车路协同中的应用&#xff0c;并强调其中的重点词汇或短语。 首先&#xff0c;什么是AI边缘计算网关&#xff1…

华为数据管理——《华为数据之道》

数据分析与开发 元数据是描述数据的数据&#xff0c;用于打破业务和IT之间的语言障碍&#xff0c;帮助业务更好地理解数据。 元数据是数据中台的重要的基础设施&#xff0c;元数据治理贯彻数据产生、加工、消费的全过程&#xff0c;沉淀了数据资产&#xff0c;搭建了技术和业务…

Python实现猎人猎物优化算法(HPO)优化卷积神经网络分类模型(CNN分类算法)项目实战

说明&#xff1a;这是一个机器学习实战项目&#xff08;附带数据代码文档视频讲解&#xff09;&#xff0c;如需数据代码文档视频讲解可以直接到文章最后获取。 1.项目背景 猎人猎物优化搜索算法(Hunter–prey optimizer, HPO)是由Naruei& Keynia于2022年提出的一种最新的…

ps显示msvcp140.dll丢失的解决方法,四个解决方法分享

我想和大家分享一个关于ps显示msvcp140.dll丢失的问题以及解决方法。这个问题可能会困扰很多使用Photoshop软件的朋友&#xff0c;特别是在运行某些特定功能时&#xff0c;会出现“无法运行此程序&#xff0c;因为找不到”的错误提示。那么&#xff0c;如何解决这个问题呢&…

现在嵌入式行业工作起薪是多少呢?发展怎么样?

今天闲逛看到有位毕业大学生询问的问题&#xff0c;我就来客观讨论一下&#xff0c;其实工作方面都是起薪多少取决于你个人的学历&#xff0c;能力等背景。嵌入式岗位的就业比起其他很多工程师岗位算还不错的&#xff0c;但是不如互联网&#xff0c;这一点不用质疑。起薪多少这…

element-plus中更改分页器的文字

实现&#xff1a; main.ts 文件中增加如下代码&#xff1a; import zhCn from element-plus/es/locale/lang/zh-cn // 自定义文字&#xff08;使用默认文字不用设置&#xff09; zhCn.el.pagination.goto 跳转到 zhCn.el.pagination.pageClassifier 页 // 创建应用实例对象 c…

学校宿舍智能水电表管理系统:为节约资源保驾护航

随着科技的不断发展&#xff0c;越来越多的学校开始重视宿舍管理的智能化。其中&#xff0c;智能水电表管理系统作为一项重要的基础设施&#xff0c;已经逐渐被各大高校引入。本文将围绕学校宿舍智能水电表管理系统展开详细介绍&#xff0c;让我们一起来了解一下这个节约资源、…

[machineLearning]非监督学习unsupervised learning

1.什么是非监督学习 常见的神经网络是一种监督学习,监督学习的主要特征即为根据输入来对输出进行预测,最终会得到一个输出数值.而非监督学习的目的不在于输出,而是在于对读入的数据进行归类,选取特征,打标签,通过对于数据结构的分析来完成这些操作, 很少有最后的输出操作. 从…

搭建STM32F407的SPI-Flash(基于STM32CubeMX)

网上有不少例子&#xff0c;都对&#xff0c;但对我来说碰到几个坑&#xff0c;避免以后再犯错&#xff0c;mark下。 目标&#xff1a;通过SPI接口&#xff0c;对Nor Flash进行读写 开发板上Nor Flash 是W25Q128&#xff0c; 128Mbit&#xff0c;也就是16MB样子 CubeMx端配置…

WebClient vs HttpClient:异同对比

在 Java 开发中&#xff0c;进行网络通信是常见的需求。WebClient 和 HttpClient 是两种常用的用于发送 HTTP 请求的工具。它们都具有相似的功能&#xff0c;但在实现细节和用法上存在一些差异。本文将详细介绍 WebClient 和 HttpClient 的异同&#xff0c;帮助您选择适合您项目…

leetcode 205. 同构字符串

2023.9.6 本题维护两个映射表map&#xff0c;若发现无法对应则返回false。 代码如下&#xff1a; class Solution { public:bool isIsomorphic(string s, string t) {unordered_map<char,char> m1;unordered_map<char,char> m2;for(int i0; i<s.size(); i){//相…

信息化战略规划-CRO-SCM-应用集成-电子商务

信息化战略规划-CRO-SCM-应用集成-电子商务 信息化战略体系(重点)信息系统战略规划&#xff08;重点&#xff09;客户关系管理&#xff08;重点&#xff09;供应链管理企业应用集成电子商务 信息化战略体系(重点) 企业战略&#xff1a;目标 企业战略规划&#xff1a;实现目标的…

【EI/SCOPUS会议征稿】第二届环境遥感与地理信息技术国际学术会议(ERSGIT 2023)

第二届环境遥感与地理信息技术国际学术会议 2023 2nd International Conference on Environmental Remote Sensing and Geographic Information Technology 第二届环境遥感与地理信息技术国际学术会议&#xff08;ERSGIT 2023&#xff09;定于2023年11月10-12日在中国陕西西安…