【记忆增强深度条件展开网络】

news2025/1/17 23:10:10

Memory-augmented Deep Conditional Unfolding Network for Pan-sharpening

(面向全色锐化的记忆增强深度条件展开网络)

全色锐化旨在为遥感系统获取高分辨率的多光谱图像,基于深度学习的方法已经取得了显著的成功。然而,大多数现有的方法是在黑盒原理下设计的,缺乏足够的可解释性。另外,它们忽略了MS图像各波段的不同特征,直接将其与全色(PAN)图像拼接,导致严重的复制伪影。针对上述问题,提出了一种可解释的深度神经网络,即具有两种特定核心设计的记忆增强深度条件展开网络。首先,考虑图像的退化过程,将全色锐化问题转化为一个变分模型的最小化问题,该变分模型具有基于去噪的先验知识和非局部自回归先验知识,能够搜索长距离块之间的相似性,有利于纹理增强,提出了一种新的基于神经网络的迭代算法用于透明模型设计。其次,为了充分挖掘MS图像不同波段的潜力,将PAN图像与MS图像的各个波段相结合,有选择地提供高频细节,减轻复制伪影。

介绍

随着遥感器的快速发展,越来越多的卫星图像可用于诸如测绘服务、军事系统和环境监测等广泛的应用。卫星同时捕获多光谱(MS)和全色(PAN)图像,并且对于每种模态具有互补信息,即PAN图像具有高空间解,而MS图像包含丰富的光谱信息。为了获得高光谱和空间分辨率的图像,旨在融合MS和PAN图像的全色锐化技术已经引起了越来越多的关注。
在过去的几十年里,全色锐化领域的研究工作呈爆炸式增长,其中的重点包括基于模型和基于深度学习(DL)的方法。由于全色锐化的病态性,前者通常需要人工构造先验知识来正则化潜在的高分辨率MS图像的解空间。然而,手工制作的先验概率的表示能力有限导致不满意的性能在处理复杂的场景。此外,传统的优化方法是具有挑战性的,限制了其实际应用。灵感来自深层神经网络的成功,各种基于DL的Pan-sharpening算法已经提出。尽管现有的基于DL的全色锐化方法在特征表示和模型泛化方面表现出了优越性,但它们长期以来存在的一个问题是缺乏可解释性,因为它们大多数是在黑箱原则下设计的,没有考虑模型的合理性。因此,将领域知识与可解释的基于DL的模型相结合有望提高全色锐化性能。另外,现有的方法忽略了MS图像各波段的不同特征,直接将其与PAN图像沿着通道方向拼接,会导致严重的复制伪影。
最近,一些模型试图在图像处理社区中结合基于模型和基于DL的方法的优点。受此启发,Xu等人提出了第一个用于全色锐化的深度展开网络。它将全色锐化公式化为两个单独的优化问题,通过深度先验对PAN和低分辨率(LR)MS图像进行正则化。然而,设计的内隐先验仍然难以彻底考察其影响,跨阶段的潜力尚未得到充分挖掘。
总之,现有技术水平(SOTA)方法遭受两重问题:1)缺乏足够的可解释性,和2)忽略MS图像的每个带的不同特征。为此,结合基于模型和数据驱动的深度展开方法的优点,提出了一种可解释的深度展开网络,即记忆增强的深度条件展开网络(Memory augmented Deep Conditional Unfolding Network,MDCUN)。考虑到MS图像的退化过程,并考虑到MS图像经常包含重复结构,我们将全色锐化问题描述为一个变分模型的最小化问题,该变分模型具有两个新设计的先验项,包括基于去噪的先验项和非局部自回归先验项。前者旨在重建潜在的MS图像,后者学习长距离块之间的相似性,有利于纹理增强和减少混叠伪影。然后,利用一种新的有效的迭代算法和内置的神经网络进行透明模型设计,以进一步提高模型的可解释性。此外,为了充分挖掘MS图像不同波段的潜力,我们提出了一种波段感知PAN引导的高频信息提取模块。具体地,PAN图像与MS图像的每个带组合,选择性地提供高频细节并减轻复制伪影。此外,引入上下文记忆机制,增强了迭代阶段的容量,从而促进了信息交互。通过大量的实验验证了该方法的有效性,实验结果定性和定量地证明了该方法的优越性。

贡献

1)我们将全色锐化表示为变分模型的最小化,并在改进长距离相干性之前引入了基于去噪的先验和非局部自回归。
2)本文提出了一种可解释的深度网络,即记忆增强的深度条件展开网络,该网络综合了基于模型和数据驱动的深度条件展开方法的优点。
3)设计了一种波段感知PAN引导的高频信息提取模块,充分挖掘MS图像不同波段的潜力。此外,还引入了上下文记忆机制,以增加迭代阶段的容量,促进信息交互。
4)在不同卫星数据集上的大量实验表明,该方法以较少的参数优于现有算法。

相关工作

Classic pan-sharpening methods

经典的全色锐化方法可以分为三大类,包括分量替换(CS)、多分辨率分析(MRA)和变分优化(VO)。常见的CS方法通过特定的变换从MS图像中分离空间和光谱信息,然后用PAN图像替换分离的空间分量。典型的MRA方法补充了通过多分辨率分解技术从PAN图像提取的高频细节到上采样MS图像。VO方法因其对全色锐化的精细融合效果而备受关注。他们假设HR MS和PAN图像之间存在一定的约束或先验条件,并基于所提出的条件建立特定的优化函数,从而通过优化上述问题来很好地平衡光谱和空间质量。

Deep learning based methods

PNN利用卷积神经网络的高度非线性映射能力,使用三个卷积单元映射PAN、LR MS和HR MS图像之间的关系,与其他经典方法相比,这实现了显著的改进。受概率神经网络的启发,近年来出现了大量基于离散元的全色锐化研究。如PANNet采用了ResNet中的残差学习模块,MSDCNN 在残差连接的基础上增加了多尺度模块,SRPPNN参考了SRCNN的设计思想。观察到MS和PAN中的相同对象并不总是对准的,Li等人设计了具有特征对准模块的SIPSA-Net,该特征对准模块可以对准来自PAN和LR MS图像的特征。Wu等人利用多个并行分支将不同规模的特征集成到骨干网络中以提高性能。针对卫星图像分析,Ma等人提出了一种基于生成式对抗网络的无监督框架。此外,一些模型驱动的CNN模型出现了,如MHNet和GPPNN,这些模型类似于我们的工作,具有明确的物理意义。

Deep unfolding network

深度展开网络
深度展开网络
近年来,许多研究者尝试将领域知识与深度神经网络相结合,提出深度展开网络,利用基于模型方法的可解释性和基于学习方法的强映射能力。具体而言,深度展开网络首先将某些优化算法展开并利用深度神经网络对展开模型进行参数化,然后在大训练数据集上最小化损失函数,并以端到端的方式对参数进行优化。例如,Zhang等人将迭代收缩阈值算法转换为深度网络形式,用于图像压缩感知。为了有效解决JPEG压缩伪影去除问题,Fu等人设计了一种交替最小化算法,并将其展开到深度网络架构中。此外,深度展开网络还被提出用于图像超分辨率、图像去模糊、快照压缩感测和图像去马赛克。

方法

本文将全色锐化问题描述为一个由全色引导的MS超分辨率问题,全色锐化过程可表示为L = DKH + eh,其中,L表示通过对HR MS版本H分别执行K和D矩阵的模糊和下采样的LR MS图像,eh表示噪声。参考上述观察模型,通过求解最小化问题可以获得HR MS图像:
在这里插入图片描述
其中P表示PAN图像,并提供用于恢复HR MS图像H的补充信息。η是拉格朗日乘子,Ω(H,P)描述正则化函数。
基于遥感图像中含有丰富重复结构的特点,利用非局部自回归先验模型(NARM)得到的图像先验(N先验)约束上述优化。给定MS块,NARM在一组非局部(而不是局部)邻域上寻求其稀疏线性分解。NARM可表示为:
请添加图片描述
通过引入上述NARM,观测模型被改写为:
请添加图片描述
其中n = dk是一个新的建模错误。因此,Eq.1的最小化问题被改写为:
请添加图片描述

Optimization

在半二次分裂(HQS)的框架下,分别为H和SH引入两个辅助参数U和V,Eq.4可以公式化为无约束优化问题:
请添加图片描述
其中η1、η2、λ 1和λ2为罚参数。为了获得展开推理,Eq.5的问题可以分为以下三个子问题并交替求解:在这里插入图片描述
此外,我们使用邻近梯度投影法来解决上述三个子问题:在这里插入图片描述
其中,proΩ1(·)和proΩ2(·)是对应于罚值Ω1(·)和Ω2(·)的近端算子。与梯度相关的符号详述如下:在这里插入图片描述

Deep unfolding network

请添加图片描述
受模型驱动深度学习原理的启发,我们的深度展开网络包含K个阶段,这些阶段专门设计为与优化算法中的K次迭代相对应,如图2所示。在每个网络中,首先更新两个辅助变量(U和V),然后计算恢复图像来更新存储组件(UM emory和VM emory)。为了构造一个逐步对应的深度展开网络结构,我们将上述迭代步骤推广为特定的网络模块,包括PAN指导的条件带通MS去噪模块、非局部自回归先验模块、记忆增强信息模块和重构模块。

在图2中,HQS的第k次迭代被投射到模型的第k阶段,该阶段包括去噪模块(DM)、NARM模块和重建模块,如下所示:在这里插入图片描述
其中Down和Up分别表示空间分辨率中的下采样和上采样函数。DM和NARM分别表示去噪模块和非局部自回归先验模块。此外,可以注意到,每个去噪阶段涉及PAN图像,同时取决于先前状态。当然,去噪模块的设计需要考虑存储机制和条件服务PAN图像。具体而言,在检查第k阶段时,PAN引导模块负责更新两个辅助变量 U ( k ) U^{(k)} U(k) V ( k ) V^{(k)} V(k),而非局部自回归先验模块旨在计算NARM矩阵S以更新对应的 S H ( K ) SH^{(K)} SH(K)。存储器扩充信息模块获取输出 U ( 0 ) U^{(0)} U(0),…, U ( k − 1 ) U^{(k-1)} U(k1) V ( 0 ) V^{(0)} V(0),…, V ( k − 1 ) V^{(k-1)} V(k1)个去噪模块作为跨远程阶段的输入,以促进信息流动。重建模块对应于Eq.18来更新所恢复的 H ( K ) H^{(K)} H(K)。更新的 H ( K ) H^{(K)} H(K)被馈送到下一级,并且执行重复操作,直到级数达到K。接下来我们将详细介绍每个模块。

Non-local auto-regressive prior module

正如上文谈到的,NARM在一组非局部邻域上寻求稀疏线性分解。像素Hi可以由其非局部邻居(包括其自身)近似加权:
请添加图片描述
其中 H j H^j Hji表示Hi的第j个非局部邻居。并且 w j w^j wji通过以下优化问题求解:
在这里插入图片描述
基于确定的系数ωi,推导出Eq.2中NARM矩阵S的公式表示为:
请添加图片描述
可以通过非本地网络实现计算Eq.2中的非局部邻居之间的相似性。NARM(SH)的输出表示为:在这里插入图片描述
其中,相似性函数f(·,·)计算Hi和Hj之间的关系。NARM的体系结构如图3(a)所示。
请添加图片描述

PAN-guided band-aware MS denoise module

对于MS图像增强问题,有效地利用高通PAN图像与不同波段MS图像各波段之间的内在联系是至关重要的。如图3(b)所示,我们引入高通修正块学习高通信息,利用高通信息增强MS中各波段的空间信息,从而达到去噪的目的。
请添加图片描述
利用第k级网络 H ( K ) H^{(K)} H(K)的输出和NARM S H ( K ) SH^{(K)} SH(K)的输出,我们考虑D先验和N先验,并将PAN图像作为Eq.4中的条件。
PAN指导的频带感知MS去噪模块可由Eq.6和Eq.7指导的去噪模块(DM)来实现。Eq.6和Eq.7其中前一级DM( U ( k − 1 ) U^{(k-1)} U(k1) V ( k − 1 ) V^{(k-1)} V(k1))的输出、 H ( K ) H^{(K)} H(K)和条件P用作MDCUN的第k级的输入,如Eq.15和Eq.17所示

Memory-augmented information module

本文考虑到方程中的记忆信息,Eq.15和Eq.17充分利用模型产生的记忆信息,引入记忆组件来存储记忆信息并保持记忆信息的更新。记忆组件主要储存两种先验的记忆信息。
如图2所示,在PAN导引的带感知MS去噪模块的第k级输入中,前一级DM的输出( U ( k − 1 ) U^{(k-1)} U(k1) V ( k − 1 ) V^{(k-1)} V(k1))将被记忆成分(UM emory和VM emory)代替,因此DM的输入为记忆成分 H ( K ) H^{(K)} H(K)和条件P,因此我们有:在这里插入图片描述
将PAN引导的带感知MS去噪模块的输出 U ( k ) U^{(k)} U(k) V ( k ) V^{(k)} V(k)分别输入到两个不同的存储部件中,完成存储部件中存储信息的更新。在第k级,考虑PAN引导的频带感知MS去噪模块的两个输出 U ( k ) U^{(k)} U(k) V ( k ) V^{(k)} V(k),UM emory中的元素为{ U ( 0 ) U^{(0)} U(0),…, U ( k − 1 ) U^{(k-1)} U(k1)},并且V存储器中的元素是{ V ( 0 ) V^{(0)} V(0),…, V ( k − 1 ) V^{(k-1)} V(k1)}。

Reconstruction module

利用 H ( k ) H^{(k)} H(k) S H k SH^k SHk U k U^k Uk V k V^k Vk,我们可以根据Eq.11和Eq.14迭代地重构 H ( k + 1 ) H^{(k+1)} H(k+1)的值。分别使用卷积网络层来模拟算子(DK ) T )^T )T和DK。具体而言,DK通过网络调用降采样块(Down)进行模拟,降采样块由3×3核和64个通道的卷积层、降低空间分辨率的maxpool层和两个3 × 3核的卷积层组成,用于重新投影到原始维度,如图3(c)所示。请添加图片描述
类似地,(DK ) T )^T )T由一个称为上采样块(Up)的网络模拟,该网络由一个具有3 × 3内核和64个通道的卷积层、一个用于增加空间分辨率的上采样层和两个具有3×3内核的卷积层组成,用于重新投影到原始维度,如图3(d)所示。请添加图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/117047.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

使用iServer rest api如何实现构建巷道效果

作者:刘大 背景 在实际生产环境中,特别是在采矿,公路建设项目上,我们往往会接触下图所示的巷道,那么在Web端如何快速通过线数据构建巷道模型呢?下面我们来详细说下 使用方式 第一步: 在iServe…

反垃圾邮件系统|基于Springboot+vue 实现反垃圾邮件系统

作者主页:编程指南针 作者简介:Java领域优质创作者、CSDN博客专家 、掘金特邀作者、多年架构师设计经验、腾讯课堂常驻讲师 主要内容:Java项目、毕业设计、简历模板、学习资料、面试题库、技术互助 收藏点赞不迷路 关注作者有好处 文末获取源…

servlet(二)文件的上传

servlet实现文件的上传 文件上传是一个web应用常见的功能 比如:QQ头像,就使用了上传。 邮箱中也有附件的上传和下载功能。 OA系统中审批有附件材料的上传。 1.1前端需要有个form表单标签 methodpost请求 (因为post请求是没有长度限制,get…

Computer Graphics From Scratch - Chapter 7

系列文章目录 简介:Computer Graphics From Scratch-《从零开始的计算机图形学》简介 第一章: Computer Graphics From Scratch - Chapter 1 介绍性概念 第二章:Computer Graphics From Scratch - Chapter 2 基本光线追踪 第三章:Computer Gr…

新生儿喝奶后不要马上放回床上睡觉,为宝宝健康着想,先做1件事

看到一个问题,题主问,新生儿喝完奶能马上放回床上睡觉吗?可以吗?也许每个人都认为照顾新生儿是一件非常简单的事情,因为新生儿几乎整天都在睡觉。当他们饿的时候,他们会让他们的宝宝吃牛奶。他们吃饱了就要…

博客搭建教程(一):静态博客 GitHub + Gridea

同步blog文章 注册一个 Github 账号并创建仓库 注册Github账号 如果你没有 Github 的账号,那么可以进入 官网 开始注册(注意一下用户名的填写,如果不使用自定义域名,用户名将会是你的 Github 分配给你的域名,例如你的…

D. George and Interesting Graph(最大匹配)

Problem - 387D - Codeforces 乔治喜欢图表。最重要的是,他喜欢有趣的图。我们将假设一个有向图是有趣的,如果它符合以下标准。 该图不包含任何多弧。 有一个顶点v(我们称她为中心),这样对于图形u的任何顶点&#xff…

信息网络传播视听节目服务单位的设立与经营

一、行业准入 (一)网络视听业务准入范围 利用公共互联网(含移动互联网)向计算机、手机用户提供视听节目服务(不含交互式网络电视(IPTV)、互联网电视、专网手机电视业务)业务的&…

几个小设置让 mac 更好用

今天在 youtube 上看到一个视频[1],讲新 mac 到手后一定要做的几个设置,有几个之前我不知道的小设置,非常好用,看完马上就用上了。一些常用的就不列了,比如说设置点按、三指拖拽,不知道的可以去搜索了解&am…

【Python数据可视化】使用geoplotlib绘制地理空间数据

geoplotlib前言一、安装geoplotlib包二、读取csv数据使用1.点密度可视化2.直方图3. Voronoi图总结前言 ❤️❤️希望大家能多多点赞。❤️❤️ 需要数据集的可以评论。 Geoplotlib 是地理空间数据可视化的开源Python库,包含了大量的地理空间可视化操作&#xff0c…

131. 分割回文串

131. 分割回文串 给你一个字符串 s,请你将 s 分割成一些子串,使每个子串都是 回文串 。返回 s 所有可能的分割方案。 回文串 是正着读和反着读都一样的字符串。 示例 1: 输入:s “aab” 输出:[[“a”,“a”,“b”]…

青少年等级考试【Python通关干货】(二级)

青少年等级考试【Python通关干货】(二级)1.列表类型的概念 2.序列的通用操作 3.可变序列及列表的通用操作 4.列表的特有操作 5.元组类型的概念与操作

激活学习:一种挑战反向传播的生物启发算法

激活学习(activation learning)是一种生物启发的简单本地学习规则构建的前向无监督通用模型,它的核心是构建多层神经网络使得网络输出激活强度能反映输入的相对概率大小。并且,它在一些任务上达到并超过反向传播的表现。激活学习的概念由山东大学教授周洪…

C++11标准模板(STL)- 算法(std::adjacent_difference)

定义于头文件 <algorithm> 算法库提供大量用途的函数&#xff08;例如查找、排序、计数、操作&#xff09;&#xff0c;它们在元素范围上操作。注意范围定义为 [first, last) &#xff0c;其中 last 指代要查询或修改的最后元素的后一个元素。 计算范围内各相邻元素之间…

MyBatis 配置文件解析

MyBatis 的核心配置文件是 mybatis-config.xml。注意配置文件中节点的顺序有要求&#xff0c;必须按照下面的顺序填写节点信息&#xff1a; (properties,settings,typeAliases,typeHandlers,objectFactory,objectWrapperFactory,reflectorFactory,plugins,environments,databa…

Odoo丨如何在Odoo中修改HTML编辑工具栏?

文章目录一、前言二、渲染原理三、修改方法一、前言 在odoo中&#xff0c;当我们在页面上使用Html类型或者html的小组件的时候&#xff0c;页面渲染成如下格式&#xff0c;供用户编辑⬇ 上方有一些工具栏如背景颜色&#xff0c;字体颜色&#xff0c;字体大小&#xff0c;插入表…

【Linux04-进程概念下】不愧是操作系统,优美的设计!

前言 上期的分享让我们知道进程大概的模样&#xff0c;本期一样重要&#xff0c;能学到操作系统设计的优美&#xff0c;体会到前辈们的智慧。 #环境变量 是什么 OS提供&#xff0c;往往有特殊功能的全局变量&#xff08;/etc/profile.d是设置环境变量的目录&#xff09; [b…

React 入门:实战案例 Github搜索_axios发送请求

文章目录快速搭建 API 服务器在 Search 组件中实现 Axios 发送请求在 App 组件中管理 List 组件的用户列表状态在 List 组件中更新渲染用户列表数据优化完善完整源码最终效果&#xff1a;快速搭建 API 服务器 根据下面步骤来操作&#xff0c;就可以快速搭建一个符合本案例使用…

明年跨境电商外贸的新增量在哪里?来自专家的2个判断

明年跨境电商外贸的新增量在哪里&#xff1f;来自专家的2个判断2022年&#xff0c;外贸大环境不容易&#xff0c;外贸人也不容易。自2021年9月以来&#xff0c;海运费飙涨&#xff0c;库容一降再降。大批的货品滞留库存&#xff0c;部分卖家只好硬着头皮扛下来了高额的仓储费&a…

最佳实践 | 帮助您的游戏在斋月期间大放异彩

作者 / Google Play 游戏业务发展经理 Nimrod Levy世界各地的开发者都发现&#xff0c;在斋月期间&#xff0c;许多庆祝这个神圣月份的国家/地区的用户都会比平时更活跃。这是一个吸引穆斯林玩家的宝贵机会。斋月是伊斯兰历的第 9 个月。世界各地的穆斯林都会在这个月进行斋戒、…