【双向ConvLSTM Network:遥感融合】

news2024/9/24 7:20:20

D2TNet: A ConvLSTM Network With Dual-Direction Transfer for Pan-Sharpening

(D2TNet: 双向传输的卷积长短期记忆递归神经网络用于泛锐化)

本文提出了一种高效的具有双向传输的卷积长短期记忆递归神经网络(convolutional long short-term memory (ConvLSTM) )网络,称为D2TNet。我们设计了一个特殊结构的ConvLSTM网络,它允许双向通信,包括多尺度信息和多级信息。一方面,由于空间信息对尺度的敏感性和光谱信息对层次的敏感性,提取多尺度和多层次信息有利于更充分地利用源图像。另一方面,利用ConvLSTM来捕捉多尺度信息与多尺度信息之间的强相关性。此外,我们引入了多尺度损失,使得不同的尺度能够相互贡献,从而生成更接近地面真实情况的高分辨率多光谱图像。

介绍

由于卫星强大的地面测量能力,其传感器捕获的遥感图像包含了丰富的地面信息。低分辨率多光谱(LRMS)图像和全色(PAN)图像是两种常见的捕获模态。前者具有高光谱分辨率但低空间分辨率,而后者呈现相反的特征。为了满足一些实际应用的需要(如:土地勘测、环境监测和对象检测),全色锐化方法融合所捕获的LRMS图像和PAN图像以产生所需的高分辨率多光谱(HRMS)图像。由于生成的高分辨率遥感影像具有优良的特性,全色锐化已成为遥感影像处理领域的研究热点。

在过去的几十年里,泛锐化领域受到了越来越多的关注。已经提出了各种传统方法来解决全色锐化问题。一般而言,传统的全色锐化方法可以大致分为四类:基于分量替代(CS)的方法、基于多分辨率分析(MRA)的方法、基于CS/MRA混合的方法和基于模型的方法。由于地物的复杂性和不同传感器捕获的光谱特征的多样性,传统方法的手工设计使得难以在原始图像和目标HRMS图像之间建立联系。

幸运的是,在过去的几年里,由于神经网络强大的特征提取能力和非线性,深度学习已经成为人们关注的焦点,并被引入到包括图像融合在内的各种任务中。基于深度学习的全色锐化方法可以分为基于卷积神经网络(CNN)的方法和基于生成对抗网络(GAN)的方法。大多数基于神经网络的方法构建网络来提取特征,融合它们,并重建HRMS。编码器-解码器网络、密集卷积网络和剩余卷积网络是常用的网络结构。在此基础上,基于GAN的方法引入了生成器和鉴别器,通过它们之间的最小-最大博弈来实现融合过程,而不需要ground truth。基于CNN和GAN的方法都是在大数据量下训练的,能够建立从源图像到目标图像的更鲁棒的非线性映射,从而摆脱了传统方法的局限性,达到了最先进的性能。

目前基于深度学习的全色锐化算法取得了令人瞩目的效果,但仍存在一些亟待解决的问题。1)以往的研究大多将原始尺寸的LRMS和PAN图像直接输入网络。然而,不同传感器捕获的不同地物特征表现出较大的尺度差异。因此,不同尺度的图像可以包含部分不重叠的信息。考虑多尺度信息,增强多尺度信息之间的交互作用,有利于更好地利用源图像的多尺度信息,从而促进融合结果以维护更丰富的功能。
2)另一方面,尽管少数全色锐化方法考虑了多尺度信息,但它们倾向于通过dense blocks 或者 Resblocks来关联不同尺度和不同级别的信息。然而,不同尺度、不同层次的信息之间存在着很强的依赖性。不加区别地传递信息会导致无效或冗余信息的增加,同时降低有效信息的状态。如何正确传递信息是一个值得思考的问题。

为了继承深度学习的优点并科普上述问题,提出了一种高效的双向传递全色锐化方法D2TNet。具体而言,双向传递包括多尺度、多层次的信息交互。结合卷积长短期记忆递归神经网络(ConvLSTM)在处理长期信息依赖方面的优势,设计了一种八字形(eight-shaped)(如图1所示)的ConvLSTM网络,较好地解决了双向信息交互问题。
请添加图片描述

这种特殊的结构利用ConvLSTM中的三个门实现不同尺度和层次之间的长期信息交互。它能够更充分地利用原始信息,从而获得更丰富的空间细节和更逼真的光谱特征。除了八字形的ConvLSTM结构外,我们在总损失函数中引入了三尺度信息损失,这促进了空间和光谱分布更接近地面真实情况的HRMS图像的生成。

贡献

1)提出了一种基于ConvLSTM结构的有效信息双向传递全色锐化方法,使长期不同尺度之间的信息交互和水平,从而使充分利用原始信息和实现富裕的空间细节和更现实的光谱特性。
2)通过引入一种新的损失函数,包括三尺度损失,提高了融合结果与真实数据的一致性。
3)通过大量的实验,验证了本文提出的D2TNet算法在高效性的同时,还具有较好的性能。

相关工作

Deep-Learning-Based Pan-Sharpening Methods

近年来,随着深度学习在图像处理领域的发展,基于深度学习的全色锐化方法得到了广泛的应用。这些方法可大致分为基于神经网络的方法和基于遗传网络的方法。Masi等人受基于神经网络的图像超分辨率处理方法SRCNN的启发,引入PNN来解决全色锐化问题,这是第一个基于神经网络的全色锐化方法。它将插值的LRMS和原始PAN图像叠加,并将它们用作输入以生成HRMS图像。并拥有一个简单的网络,从而实现效率高。此外,Liu等人提出TFNet,利用CNN的特征提取能力。它构造一个encoder-decoder网络实现特征提取,特征融合和重建过程。Xu等人提出了SDPNet,侧重于空间信息和光谱信息。具体地说,设计了空间编解码器和频谱编解码器来选择两幅原始图像之间的唯一特征映射。此外,Wang等人引入了基于ConvLSTM的MPNet。该方法利用原有的ConvLSTM对LRMS和PAN图像进行不同层次的特征融合,但没有充分利用ConvLSTM的优势来驱动融合图像包含更多的有效信息。除上述方法外,还有一些基于多尺度特征的方法。Wang等人提出了MSDRN,这是一种多尺度深度残差网络。它将连接的原始图像降采样到不同的比例,并通过上卷积和连接将它们连接起来。Xu等人提出了一种多尺度网络,命名为CPNet。该算法首先对PAN图像进行2次和4次下采样,然后对LRMS图像进行相应次数的上采样,得到3组不同尺度的图像作为输入。在该方法中,我们遵循了CPNet中获取多尺度图像的方法。然而,它们将不同尺度的图像关联起来的方式是“pixel shuffle”,这是主观的人为决定,导致丢失信息的风险。之后,Jin等人提出了一种新颖的全色锐化方法,该方法使用拉普拉斯金字塔将图像分离到不同的尺度。针对每一尺度,设计一个融合CNN,得到融合结果。然而,它仅通过共享参数来关联多尺度特征,这种关联似乎很弱,不足以充分利用多尺度特征。此外,上述方法中的多级信息传递是通过dense blocks或者Resblocks来实现的,这忽略了浅级和深级之间的关系。

与基于神经网络的方法不同,基于遗传神经网络的方法通过生成器和鉴别器之间的对抗过程来实现融合。Liu等人提出了PSGAN,这是首次将GAN引入到全色锐化中。设计了一种融合PAN和MS图像的发生器,设计了一个融合PAN和MS图像的发生器,并利用鉴别器来缩小融合图像与ground truth之间差距。之后,Shao等人提出了使用残差编码器-解码器网络的RED-cGAN。条件判别器的设计可以进一步补充最终结果中的空间信息。此外,Ma等人提出了使用双鉴别器的Pan-GAN,这是一种无真实地面的无监督方法。双鉴别器迫使结果看起来既像PAN图像又像LRMS图像,从而拥有PAN图像的空间信息和LRMS图像的光谱信息。

在上述方法中,两幅原始图像之间的多尺度和多层次信息没有被利用或没有被适当地关联,它们中的任何一个都可能导致光谱失真或空间失真。为了充分利用原始信息,提出了一种新的多尺度、多层次信息传递方法。

Convolutional Long Short-Term Memory

长短期记忆递归神经网络(LSTM)是一个擅长处理长序列记忆问题的网络。与常规网络结构相比,LSTM改变了内部网络结构,增加了三个门:输入门、输出门和遗忘门输入门两个元素的非线性变换,包括以前的时间戳的输出和输入当前的时间戳,获取新的输入。遗忘门基于先前时间戳和当前时间戳的状态选择性地更新状态向量。输出门基于遗忘门控制当前时间戳的输出。

当时间数据为三维图像时,普通的LSTM难以描述点间复杂的空间特征。为了更好地描述图像之间的时空关系,引入了ConvLSTM。它最早由Sectraetal提出,作者通过实验验证了ConvLSTM在获取时空关系方面优于LSTM。

由于ConvLSTM在传递图像信息方面的成功,它已经被广泛地应用于图像处理领域,包括图像分类、图像分割等,只有Wang等人引入了基于ConvLSTM的MPNet来解决全色锐化问题。然而,他们利用原始的ConvLSTM在不同层次上融合LRMS和PAN图像的特征,而没有充分利用ConvLSTM来驱动融合图像包含更多有效信息。由于ConvLSTM能够合理地筛选有用信息并将其传递给下一个时间戳,因此我们利用它来增强多尺度和多层次之间的信息交流。

方法

Problem Formulation

一方面,需要提取不同层次的层次特征,因为它们有助于更全面地表示原始信息。此外,CNN提取的深层低频特征可以看作是对浅层高频特征的进一步提取;深层级对浅层级有很强的依赖性。为此,我们设计了多级ConvLSTM来捕捉它们之间的差异,从而学习更准确的层次光谱特征。另一方面,由于不同尺度下的空间细节和光谱特征存在差异,多尺度信息的关联有利于保持更丰富的空间细节和更真实的光谱特征。此外,基于同样的原因,低尺度信息和高尺度信息相互依赖。因此,我们还设计了多尺度ConvLSTM来关联多尺度特征,以保持更丰富的空间细节和更真实的光谱特征。因此,为了更好地利用原始图像信息,有效地与多尺度、多层次信息交互,本文利用ConvLSTM在信息传递方面的优异性能,提出了一种基于ConvLSTM网络(D2TNet)的多尺度、多层次双向传递的全色锐化方法。

整个框架如图2所示。产生多尺度图像以获得分层信息。具体而言,对LRMS图像进行上采样以获得LRMS↑2和LRMS↑4。类似地,PAN图像被下采样以得到PAN↓2和PAN↓4。将三组相同比例的图像连接起来,并分别送入三个流(顶部、中部和底部)网络,如图2所示。
在这里插入图片描述

为了实现我们的目标,eight-shaped的ConvLSTM网络被设计用于链接不同尺度和不同层次的信息。为了向ConvLSTM网络提供相同类型的特征,我们让ConvLSTM之前的卷积层共享参数。此外,由于我们的损失函数利用了三流网络的所有乘积,最后的卷积层也共享参数,以保证中间和底部流网络有助于HRMS的生成。

Network Architectures

上游网络如图3所示:
请添加图片描述

在顶部、中部和底部流网络中,对应的卷积层具有相同数量的输入或输出通道,并且仅在它们的尺度大小上不同。简单地说,我们只给出了上游网络的网络参数。
Conv(·)中的三个参数分别表示核大小、输入通道数和输出通道数。除了最后一层使用tanh之外,所有卷积层的激活函数都是泄漏整流线性单元(ReLU)(lrelu)。ConvLSTM(·)中的三个参数分别表示单元数、第一个单元的输入通道和最后一个单元的输出通道。更具体地,每个单元具有相同的输入通道32和相同的输出通道32,这使得其易于在多尺度和多级之间传输状态。另外,由于残差网络具有学习效率高的优点,在实现过程中充分利用了残差网络。

请添加图片描述
对于ConvLSTM的每个单元,其内部网络架构如图4所示。计算过程可表述如下:
在这里插入图片描述
其中·表示乘法,* 表示卷积。
在我们的方法中,Xt表示这个单元的输入,Ct−1、Ht−1、Ct和Ht分别是表示最后一个单元的状态、最后一个单元的输出、这个单元的状态和这个单元的输出的符号。当这个单位是第一个单位时,我们将Ct−1和Ht−1设为全零,这也称为初始状态。从图2中,我们发现单元有可能具有两个输入状态,ConvLSTM 1的单元5;它不仅接收从单元2传递的状态,而且还接收从单元4传递的状态。在这种情况下,首先将单元4上采样到单元2的大小;然后,我们将所有输入状态相加以得到最终输入状态。各单元的具体操作如下(1)-(5)。首先,Xt、Ht−1和Ct−1在卷积后被积分到输入门,这实现了从Xt保持在Ct中的有效信息。同样,相同的元素被输入到遗忘门,以筛选从Ct−1到Ct的信息,而输出门控制从Ct到Ht输出多少信息。

Loss Functions

我们的损失函数包含对应于三流网络的三个部分。与传统的仅对融合图像进行约束相比,该约束更强,使得最终的融合图像更接近真实地面。整个损失函数可表示为
请添加图片描述

其中Ltop、Lmiddle和Lbottom分别表示这三个流网络的损失函数。λ1和λ2被用来在(6)中的三个部分之间进行权衡。
1) Loss Function ofTop Stream Network:
对于上游网络,我们希望生成的HRMS尽可能接近ground truth。我们从光谱和空间角度限制HRMS的生成。具体而言,我们使用结构相似性指数(SSIM)和Frobenius范数来约束HRMS光谱信息与ground truth的相似性,并使用梯度损失来约束空间细节的相似性。此外,为了进一步约束特征,我们将获得的HRMS降采样到LRMS大小,并强制其特征信息收敛。因此,Ltop确定为在这里插入图片描述
其中||·||F表示Frobenius范数。HRMS代表了顶流网络的生成图像,也是最终结果。
G表示获得的ground truth(根据Wald协议中的规则)。H、W和C分别表示HRMS图像的高度、宽度和通道数。SSIM(·)表示两个元素之间的SSIM。ξ1和ξ2被用于在(7)中的四个部分之间获得折衷。
2) Loss Functions ofMiddle and Bottom Stream Networks:
对于中游和下游网络,我们以与处理上游网络相同的方式约束它们。其损失函数如下:
请添加图片描述

其中HRMS2和HRMS4分别表示中游和下游网络的产品。G ↓2和G ↓4是将地面真实数据下采样到原始大小的一半或四分之一的产物。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/79052.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Java Agent 探针技术

Java 中的 Agent 技术可以让我们无侵入性的去进行代理,最常用于程序调试、热部署、性能诊断分析等场景,现如今比较火热的分布式链路追踪项目Skywalking,就是通过探针技术去捕获日志,将数据上报OAP观察分析平台。 Java Agent 技术简…

Socket编程实现TCP、UDP样例

文章目录一.Socket简介二.Socket实现TCPTCP通信简介使用对象及方法简介代码实现服务端代码客户端代码三.Socket实现UDPUDP通信简介UDP程序的使用步骤代码实现服务端代码客户端代码一.Socket简介 socket套接字是通信的基石,是支持TCP/IP协议的路通信的基本操作单元.…

私企招聘:思特威社会招聘

关于我们 思特威(上海)电子科技股份有限公司 SmartSens Technology (股票简称:思特威,股票代码:688213)是一家从事CMOS图像传感器芯片产品研发、设计和销售的高新技术企业,总部设立…

pads logic 生成参考编号带分隔符以及不统计不贴元器件的BOM

1.查看BOM报告 ,这里可以通过下面的方法 Step1:点击文件 Step2: 勾选材料清单,然后点击设置 Step3:在弹出的如下窗口,选择剪切板视图 ,然后选择全选,然后复制,将数据粘贴到excel表格中即可。 2. 参考编号分隔符 …

以前不知道字节面试难在哪,现在体验到了,被虐的很惨

…(这里省略一些不清楚、不知道、忘记了之类的词藻,保留一丝尊严。) 接下来是关于redis哲学三连“是什么?为什么?怎么用?” 我把肚子里仅有的关于Redis的一滴墨水挤成了三滴,仍然没有给出他想要的。继续追问Redis的数据存储方式,操作方法…

微服务框架 SpringCloud微服务架构 微服务保护 30 初识Sentinel 30.1 雪崩问题及解决方案

微服务框架 【SpringCloudRabbitMQDockerRedis搜索分布式,系统详解springcloud微服务技术栈课程|黑马程序员Java微服务】 微服务保护 文章目录微服务框架微服务保护30 初识Sentinel30.1 雪崩问题及解决方案30.1.1 雪崩问题30.1.2 总结30 初识Sentinel 30.1 雪崩问…

类别不平衡Class-imbalance解决方法

类别不平衡是指分类任务中不同类别的训练样例数目差别很大的情况。 1、扩大数据集 2、欠采样 欠采样(under-sampling):对大类的数据样本进行采样来减少该类数据样本的个数,使其与其他类数目接近,然后再进行学习。 随…

第十四届蓝桥杯集训——JavaC组第九篇——位运算符

第十四届蓝桥杯集训——JavaC组第九篇——位运算符 目录 第十四届蓝桥杯集训——JavaC组第九篇——位运算符 值交换 异或值交换 其它位移符号&#xff1a; 这个稍微难度大一些&#xff0c;基础的有【&与、|或、^异或、<<左位移、>>右位移】。 我们一个一个…

游戏开发43课 移动游戏性能优化2

2. 资源优化 病从口入&#xff0c;资源好比是入口&#xff0c;它们若出现问题&#xff0c;会引发一连串性能问题。相反&#xff0c;资源若是优化得好&#xff0c;后面所有章节的性能都可受益。这也是把资源优化的章节提到最前的原因。 2.1 纹理优化 纹理优化的目的是让它们占…

多锦鑫能:低碳化、智能化、无人化矿山运营时代来临

全球气候变暖已经成为人类社会必须面对的重大课题&#xff0c;国际社会在推动节能减排、实现碳中和大目标上也已经达成一致意见。中国作为全球第二大经济体和负责任的大国&#xff0c;也明确向国际社会承诺&#xff0c;将在2030年实现碳达峰、2060年前实现碳中和目标。 围绕这…

[附源码]计算机毕业设计基于Vuejs的中国名茶销售平台Springboot程序

项目运行 环境配置&#xff1a; Jdk1.8 Tomcat7.0 Mysql HBuilderX&#xff08;Webstorm也行&#xff09; Eclispe&#xff08;IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持&#xff09;。 项目技术&#xff1a; SSM mybatis Maven Vue 等等组成&#xff0c;B/S模式 M…

作者推荐 | 【分布式技术专题】「架构设计方案」图解学习法总结集群模式下的各种软负载均衡策略实现及原理分析

背景介绍 在分布式系统中&#xff0c;负载均衡是非常重要的环节&#xff0c;通过负载均衡将请求派发到网络中的一个或多个节点上进行处理。 通常来说&#xff0c;负载均衡分为硬件负载均衡及软件负载均衡。硬件负载均衡&#xff0c;顾名思义&#xff0c;在服务器节点之间安装专…

功能安全软件架构

已剪辑自: https://mp.weixin.qq.com/s/pCenGTqg2Xi_t7b8ebNHMA 1. E-GAS 安全架构思想 汽车功能安全旨在把电子电气系统失效而导致的人身危害风险控制在合理范围内。下图是常见的电子电气系统硬件构成图&#xff0c;一个电子电气系统的构成要素&#xff0c;除了图中可见的硬…

均值坐标参数化(MVC Parameterization)

欢迎关注更多精彩 关注我&#xff0c;学习常用算法与数据结构&#xff0c;一题多解&#xff0c;降维打击。 均值坐标定义 均值坐标定义 v0是多边形v1v2v3...vn内的一点v_0是多边形v_1v_2v_3...v_n内的一点v0​是多边形v1​v2​v3​...vn​内的一点 就会存在均值坐标ϕi(v0)ω…

腾讯云服务器CVM快速配置购买教程,新手上云必备!

腾讯云服务器快速配置购买教程是新手必备的上云教程。主机教程网在本文中以腾讯云服务器为例&#xff0c;给大家带来一个完整的、手把手教学的服务器购买流程。助力快速完成服务器的购买、配置、以及网站的搭建&#xff0c;给新手节省宝贵的时间&#xff0c;避免采坑&#xff0…

线程相关学习记录(1)

认识线程 什么是线程 进程&#xff1a; 正常电脑中启动的某个程序应用&#xff0c;并且会获得计算机分配的资源&#xff08;cpu&#xff0c;内存&#xff0c;硬件设备&#xff09; 线程&#xff1a; 进程中为了完成某个功能&#xff0c;内部划分出的不同的资源分配单位。通常…

[附源码]Python计算机毕业设计SSM基于框架的旅游管理系统(程序+LW)

项目运行 环境配置&#xff1a; Jdk1.8 Tomcat7.0 Mysql HBuilderX&#xff08;Webstorm也行&#xff09; Eclispe&#xff08;IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持&#xff09;。 项目技术&#xff1a; SSM mybatis Maven Vue 等等组成&#xff0c;B/S模式 M…

MyBatis详细学习笔记

一、MyBatis简介 MyBatis是ORM框架&#xff0c;即对象关系映射框架。 二、搭建MyBatis 不同的MySQL版本使用的JDBC不同 com.mysql.jdbc.Driver // MySQL 5 com.mysql.cj.jdbc.Driver // MySQL 8不同版本的MySQL的url也不同 jdbc:mysql://localhost:3306/ssm // MySQL 5 jd…

神仙级Python办公自动化教程(非常详细),从零基础入门到精通,轻松玩转Excel,从看这篇开始

Excel是Office办公中使用非常频繁的一个表格制作、数据分析与图表制作的组件。随着现在数据处理量越来越大&#xff0c;日常办公中很多重复性工作耗费了广大办公人员越来越多的时间&#xff0c;那么如何才能化繁为简&#xff0c;提高办公自动化水平呢&#xff1f;借助Python中的…

【小程序】小程序中插槽使用

&#x1f4ad;&#x1f4ad; ✨&#xff1a;小程序插槽   &#x1f49f;&#xff1a;东非不开森的主页   &#x1f49c;: 没关系 天空越黑星星越亮&#x1f49c;&#x1f49c;   &#x1f338;: 如有错误或不足之处&#xff0c;希望可以指正&#xff0c;非常感谢&#x1f60…