【Bidomain建模范式:Pansharpening】

news2024/10/6 20:30:01

Bidomain Modeling Paradigm for Pansharpening

(泛锐化的Bidomain建模范式)

泛锐化是一个具有挑战性的低层次视觉任务,其目的是学习光谱信息和空间细节之间的互补表示。尽管取得了显着的进步,现有的基于深度神经网络(DNN)的泛锐化算法仍然面临着共同的局限性。1)这些方法很少考虑不同光谱带的局部特异性; 2)它们通常在空间域中提取全局细节,这忽略了与任务相关的退化,例如,MS图像的下采样过程中,也受到有限的感受野。在这项工作中,我们提出了一种新的bidomain建模范式pansharpening问题(称为BiMPan),它既考虑到局部光谱特异性和全局空间细节。更具体地说,我们首先为每个光谱带定制专用的源判别自适应卷积(SDAConv),而不是像以前的工作那样在所有波段上共享相同的内核。然后,我们设计了一种新的傅立叶全局建模模块(FGMM),它能够包含全局信息,同时有利于解开图像退化。通过将这两个功能设计中的频带感知局部特征和傅立叶全局细节相结合,我们可以融合纹理丰富而视觉上令人愉悦的高分辨率MS图像。

INTRODUCTION

卫星传感器的快速发展促进了多光谱图像在军事融合系统、变化检测、制图服务等方面的广泛应用。值得注意的是,高分辨率的空间细节和丰富的光谱信息相对于MS图像在实际应用中所期望的。然而,现有的遥感器,如World-View 3(WV 3)和QuickBird(QB),由于其物理限制,不能直接捕获高空间分辨率的MS图像。相反,他们经常观察成对的低分辨率MS图像和高分辨率全色(PAN)图像。因此,泛锐化技术被开发用于通过在空间域中超分辨低分辨率MS图像来产生高分辨率MS图像,条件是成对的PAN图像。换句话说,全色锐化尝试从PAN图像借用空间信息来增强MS图像的空间分辨率。
迄今为止,研究界已经提出了许多pansharpening方法。它们可以大致分为模型驱动方法(也称为传统方法),包括基于组件替换(CS)的方法,基于多分辨率分析(MRA)的方法,基于变分优化(VO)的方法和基于深度神经网络(DNN)的方法。随着深度学习在各种视觉任务中的成功,例如对象检测,图像分割和单图像超分辨率,已经提出了主要基于卷积神经网络(CNN)的爆炸性DNN方法用于泛锐化。开创性的基于DNN的泛锐化方法仅由三层卷积运算组成,其灵感来自代表性的单图像超分辨率网络SRCNN。之后,设计了更复杂的网络架构,以提高泛锐化的非线性表示能力。现有的泛锐化方法虽然取得了显著的进步,但仍存在一定的局限性。首先,他们很少关注每个光谱波段的局部特异性,而根据我们的观察,波段之间的局部差异是明显的,不应被忽视。其次,大多数基于DNN的泛锐化方法通常在空间域中进行细节提取,如图1(a)所示,由于卷积运算的属性,这不可避免地受到有限的感受野的影响。此外,MS图像的下采样过程通常不可避免地导致高频信息的丢失,这与频域紧密耦合。考虑到上述事实,我们打算开发一个新的建模框架,该框架可以考虑每个光谱带的局部特异性和全局上下文细节,如图1(b)所示。在这里插入图片描述

贡献

我们首先从4波段QB数据集中选取一个高分辨率的例子来展示不同光谱波段的差异和联系。图2(a)显示了MS图像和PAN图像各谱带的像素值,我们可以清楚地看到各谱带的像素分布变化很大。这一观察揭示了与pansharpening相关的一个重要事实,不同波段的局部空间信息是普遍不同的。在这里插入图片描述
虽然先前的工作尝试设计内容自适应卷积核来区别处理输入图像的不同区域,但它们通常在所有频带上共享相同的自适应核,这忽略了每个频带的局部特异性。此外,由Sobel算子滤波的MS图像的梯度统计与PAN图像的梯度统计相似,如图2(b)所示。这意味着所有波段和PAN图像之间的相关性在全局细节上是相似的。换句话说,理想的融合高分辨率MS(HRMS)图像应与PAN图像在全局细节方面尽可能一致。目前,泛锐化研究界通常采用多尺度网络或基于变换的方法来提取空间域中的全局结构。然而,他们遭受有限的感受野,并忽略了与退化过程相关的图像先验。
基于以上分析,我们考虑为每个频段定制专门的自适应核(即源区分自适应卷积,简称SDAConv),而不是在所有频段共享相同的核。所提出的SDAConv能够聚焦于每个波段的局部特异性,这有利于生成更逼真和内容丰富的HRMS图像。此外,我们打算利用傅立叶域全局建模能力和丰富的图像先验的性质提取全局细节。具体来说,我们借鉴现有全局建模范式的思想,提出了一种新的傅立叶全局建模模块(FGMM),它巧妙地将傅立叶域的这些先天优势融入到全局建模规则中。通过将每个光谱带的局部特征和全局细节相结合,我们可以预测出所需的HRMS图像。总之,这项工作的贡献可以概括为以下几个方面:
1)我们提出了一种新的泛锐化双域模型范例,它通过两个功能设计实现了HRMS图像的局部-全局表示学习,即,频带感知局部特异性建模分支和傅立叶全局细节重建分支。
2)与以前的工作不同,我们为每个光谱带定制了专门的自适应卷积核,因为各个光谱带之间存在局部差异,而不是在所有波段补丁中共享相同的核。此外,借鉴现有全局建模范式的思想,提出了一种新的傅立叶全局建模模块,巧妙地将傅立叶域的固有优势融入到全局建模规则中。

RELATEDWORKS

Adaptive Convolution Techniques. 标准卷积受到其固有的空间不变性的影响,这导致在一些像素级视觉任务中性能有限,例如,单个图像超分辨率和全色锐化。近年来,自适应卷积技术由于其灵活性在计算机视觉研究界引起了广泛关注,其中根据输入内容调整采样位置和/或核值。对于全色锐化任务,一些代表性的自适应卷积技术也已被提出,并显示出良好的性能相比,标准卷积。在[14]中,研究人员首先设计了一种新的自适应卷积,包括局部内容和全局谐波基,称为LAGConv,它可以有效地利用局部特异性并整合所涉及图像块的全局信息。受LAGConv的启发,Lu等人提出了一种由几个自适应特征学习块组成的轻量级泛锐化网络。在[23]中,考虑输入源图像的独特属性来设计所谓的源自适应判别核,其由两个分量组成,即,从纹理丰富的PAN图像导出的空间核和从MS图像导出的光谱核。为了解决标准卷积运算的计算成本,Chen 等人设计了一种可解释的跨度策略来生成卷积核,它只学习两个导航核,然后将它们扩展到所有通道。
Fourier Based DNN Networks. 在低水平视觉任务中,现有的大多数基于DNN的方法都是为了学习空间域中输入和输出之间的非线性映射,这不可避免地受到有限感受野的影响。近年来,傅立叶域因其独特的图像先验和全局建模属性而备受关注。在[25]中,研究人员试图解决傅立叶域中的微光图像增强问题。Mao等人在级联网络中嵌入一种新颖的Res FFT-RELU块用于图像去模糊,该块学习空间频率双域表示以提取核级和像素级特征。同样,[27]和[28]采用类似的方法来处理相关问题。在文[29]中,作者首先从傅立叶域的角度探讨了常用的空间降采样/上采样操作,并设计了一种即插即用的傅立叶UP算子,该算子能够对全局依赖关系进行建模,从而打破了空间算子的普遍局限性。在全色锐化方面,已经提出了结合空频双域信息重建HRMS图像的一些代表性工作。

METHODOLOGY

Overall Architecture

我们的主要目标是探索一种有效的建模范式,用于基于上述事实的全色锐化,它可以产生纹理丰富,同时视觉上令人愉悦的HRMS图像。为此,我们试图考虑到每个光谱带的局部特异性和全局上下文细节。具体而言,我们设计了两个核心设计,即,频带感知局部特异性建模分支和傅立叶全局细节重建分支。我们首先介绍了我们的框架的总体管道,然后我们详细介绍了两个功能分支的详细结构。
Overall Pipeline. 在这里插入图片描述
图3概述了我们的方法的整体架构。对于上分支,采用c个平行子分支来关注每个频带的局部特异性,其中c表示谱带的数目。给定一个上采样的MS图像M ∈ R H × W × c R^{H×W×c} RH×W×c,我们首先将其分成c个单波段。然后,我们将每个波段与一个PAN图像P配对发送到相应的子分支以提取其局部特征。具体来说,我们先应用卷积层以及ReLU函数来提取输入波段和PAN图像的浅层特征。之后,我们将获得的波段特征 F s p e F^{spe} Fspei和PAN特征 F s p a F^{spa} Fspa 连接起来作为相应子分支的输入数据,以提取局部信息。最后,对所有子分支的输出进行综合,得到局部特征
此外,我们设计了一个新的傅立叶全局建模模块(FGMM)来构造下面的分支。对于一对输入图像,即,上采样的MS图像M和PAN图像P,我们首先沿着光谱维度复制P。然后,通过从P中减去每个频带来获得M的高频内容,其被用作重建全局细节的输入数据。最后,我们将获得的局部特征和全局细节相结合,并将上采样的MS图像相加以产生超分辨率MS图像

Band-Aware Local Specificity Modeling Branch

Source-Discriminative Adaptive Convolution.
与现有的自适应卷积技术不同,现有的自适应卷积技术通常使用包括所有频带的特定图像块来生成内核。为了探索每个频带的局部唯一性,我们设计了一种新的自适应卷积操作,表示为源判别自适应卷积(SDAConv),其内核是根据与PAN图像耦合的每个MS频带的局部补丁生成的,如图4所示。
在这里插入图片描述
不失一般性,我们以一个单一的波段为例,介绍核生成过程中提出的SDAConv。实际上,核生成过程旨在获得权重矩阵W R k × k × C   i n   R^{k×k×C~in~} Rk×k×C in ,其中k和Cin分别表示与输入局部块相对应的通道的大小和数量。具体地说,给定一个输入补丁k×k×Cin,它首先通过一个层卷积层投影到低层特征。接下来,我们应用空间调制和光谱调制来处理提取的浅层特征。然后,我们进一步将这两个模块的输出联合以生成期望权重矩阵 WΩ,其可以被说明如下:在这里插入图片描述
之后,我们在一组候选核K ∈ R C   o u t   × k × k × C   i n   R^{C~out~×k×k×C~in~} RC out ×k×k×C in 上执行该权重矩阵WΩ,以生成自适应核。最后,我们可以将获得的自适应卷积核应用于输入补丁的特征图。简而言之,它们可以用公式表示如下:在这里插入图片描述
Band-aware Local Specificity Modeling Branch.
我们的波段感知局部特异性建模(BLSM)分支由c个子分支组成,其中c是对应于MS图像的谱带的数目。所有子分支采用相同的结构,该结构包含多个级联的SDAConv块,但是由于源输入的不同而不共享参数,即,不同谱带的质谱图像。此外,所有分支机构的成果通过合并模块进行整合。整个过程可以用数学表示如下:在这里插入图片描述

Fourier Global Detail Reconstruction Branch

在全色锐化任务中,提取精确的全局细节是一个流行而又具有挑战性的问题。大多数现有的方法通常在空间域中解决这个问题,这忽略了MS图像的退化,并且需要很高的计算成本。近年来,傅立叶域得到了研究界的广泛关注。一方面,傅立叶变换能够捕获关于MS图像的下采样过程的图像先验。另一方面,傅立叶域由于其固有的全局属性而将这种空间中的每个像素与所有空间像素相关联。因此,我们试图从现有的全局建模范式中借用这些想法,例如,[31-33],探索在傅立叶域进行相似设计,以重构全局细节。
Preliminary.
给定一个图像x∈ R H × W × C R^{H × W×C} RH×W×C,我们可以使用傅里叶变换F(·)将其转换为傅里叶空间中的复分量,其数学表示如下:
在这里插入图片描述
其中u和v表示傅立叶空间中的坐标。反过来,我们可以使用傅里叶逆变换 F − 1 F^{−1} F1(·)来实现从傅立叶域到空间域的变换。此外,傅里叶空间中的𝑥的幅度和相位可以使用以下公式计算:在这里插入图片描述
Structure of the Fourier Global Modeling Module.
在这里插入图片描述
图5给出了所提出的傅立叶全局建模模块(FGMM)的详细架构,其由两个组件组成,即,傅立叶空间单元和傅立叶光谱单元。
Fourier Spatial Unit.
给定一个输入特征X ∈ R H × W × C   i n   R^{H×W×C~in~} RH×W×C in ,它将并行地通过两条路径,即,傅立叶运算和空间运算。就前者而言,首先进行傅立叶变换如下:在这里插入图片描述
其中,XR和XI分别表示真实的部分和虚数部分。之后,我们采用一个3 × 3的深度卷积层与ReLU激活函数相结合来整合空间信息,可以表示为:在这里插入图片描述
其中,DW(·)表示深度卷积。然后,我们通过逆傅立叶变换将获得的SR和SI变换回空间域,如下所示:在这里插入图片描述
此外,我们还采用了一个空间路径来补充空间结构信息,其中输入特征直接输入到一个3 × 3的深度卷积层,然后是ReLU激活函数,可以写为:在这里插入图片描述
接下来,我们通过高效的半实例归一化(HIN)块[34]融合傅立叶特征ZF和空间特征ZS,表示如下:
在这里插入图片描述
𝐻𝑆(·)表示使用HIN块集成空间信息,U是输出特征。
Fourier Spectral Unit.
与傅立叶空间积分类似,我们采用类似的设计,即,傅里叶调制路径和空间调制路径,实现傅里叶频谱调整,其中3 × 3深度卷积被逐点卷积代替。首先,利用傅里叶变换将来自傅里叶空间积分的输出分量U分解为真实的分量和虚分量,即,𝑈𝑅和 𝑈𝐼。然后,我们采用逐点卷积层,然后使用ReLU非线性激活来执行傅立叶通道调整。具体而言,该程序可表述如下:在这里插入图片描述
其中,MLP(·)表示逐点卷积,CF是傅立叶通道调整的输出。
之后,我们通过HIN模块整合频率路径和空间路径的结果,以输出傅立叶全局建模模块(FGMM)的最终结果,其数学表达式如下:在这里插入图片描述
其中,CS是来自空间信道调制的输出。𝐻𝐶(·)表示使用HIN块调整信道信息,而Out是所提出的FGMM的结果。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1352154.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

JVM内存模型理解

1、首先理解下什么是 jvm 内存模型? jvm内存模型定义了Java虚拟机运行时如何组织和管理内存,规定了各个内存区域的作用、结构和交互方式,以及线程间的内存可见性、内存操作的原子性等行为,以支持Java程序的执行,即一种…

以角色为基础的软件开发团队建设

角色抽象作为一种载体,可以很好地进行软件工程知识体系和企业知识地图的组织,满足企业知识体系持续改进的需要,因此角色团队组建和建设也可以作为软件工程实施方法之一。 软件开发项目立项时,重要工作之一就是开发团队的组建&…

Spring Security 6.x 系列(13)—— 会话管理及源码分析(一)

一、会话概念 在实现会话管理之前,我们还是先来了解一下协议和会话的概念,连协议和会话都不知道是啥,还谈啥管理。 1.1 http 协议 因为我们现在的会话,基本上都是基于HTTP协议的,所以在讲解会话之前,我再…

openmediavault(OMV) (26)网络(1)ddns-go

简介 "ddns-go" 是一个动态域名解析(Dynamic DNS)工具,用于更新域名的IP地址。它可以自动检测你的公共IP地址,并将其更新到指定的域名解析服务商,以确保你的域名始终与最新的IP地址相匹配。 安装 hub.docker.com上下载ddns-go镜像 配置compose文件 --- versio…

使用 Process Explorer 和 Windbg 排查软件线程堵塞案例分享

目录 1、问题说明 2、线程堵塞的可能原因分析 3、使用Windbg和Process Explorer确定线程中发生了死循环 4、根据Windbg中显示的函数调用堆栈去查看源码,找到问题 4.1、在Windbg定位发生死循环的函数的方法 4.2、在Windbg中查看变量的值去辅助分析 4.3、是循环…

ModStartCMS v7.9.0 内容推荐支持,用户授权升级

ModStart 是一个基于 Laravel 模块化极速开发框架。模块市场拥有丰富的功能应用,支持后台一键快速安装,让开发者能快的实现业务功能开发。 系统完全开源,基于 Apache 2.0 开源协议,免费且不限制商业使用。 功能特性 丰富的模块市…

CMake入门教程【基础篇】HelloCMake

文章目录 概述核心实现代码示例使用技巧注意事项 总结 概述 CMake是一个强大的跨平台构建系统,广泛用于C和C项目。它使用简单的配置文件来生成标准的构建文件,从而使得构建过程跨平台且易于管理。本教程将通过一个“Hello World”示例(命名为…

必看 | 如何用「八爪鱼RPA」搬迁旧帮助中心站点到「HelpLook」?

对于工具类产品而言,帮助中心的搭建是非常重要的:一个好用的帮助中心,不仅可以帮助用户快速找到所需内容,提升用户的满意度;还可以减轻客服人员的压力,为公司节约大量的人力资源。 以八爪鱼采集器的帮助中心…

【Leetcode】466. 统计重复个数

文章目录 题目思路代码 题目 466. 统计重复个数 思路 题目要求找出一个最大整数 m,使得经过 n2 个字符串 s2 组成的字符串能够被经过 n1 个字符串 s1 组成的字符串完全包含的次数。使用动态规划来记录每个位置匹配的情况,并通过循环节的分析来计算最…

安全数据交换系统:有效提升网间文件交换能力

各级政府部门和金融、能源、电力这些行业,以及一些大中型企业组织,为了保护内部的重要数据不外泄,普遍都采用了多网络并行的方式,也是做了网络隔离划分,不同的网络拥有不同的密级以及人员权限。然后再通过安全数据交换…

C++Qt6 哈夫曼编码求解 数据结构课程设计 | JorbanS

一、 问题描述 在进行程序设计时,通常给每一个字符标记一个单独的代码来表示一组字符,即编码。在进行二进制编码时,假设所有的代码都等长,那么表示 n 个不同的字符需要 位,称为等长编码。如果每个字符的使用频率相等&…

系列七、Ribbon

一、Ribbon 1.1、概述 Ribbon是基于Netflix Ribbon实现的一套客户端负载均衡的工具,是Netflix发布的一款开源项目,其主要功能是提供客户端的软件负载均衡算法和服务调用,Ribbon客户端组件提供一系列完善的配置项,例如&#xff1a…

免费证书Let’s Encrypt

免费SSL证书是一种用于保护网站数据传输安全的加密技术。它能够确保用户与网站之间的信息传输是加密的,防止被黑客窃取或篡改。随着网络安全意识的提高,越来越多的网站开始使用SSL证书来保护用户的隐私和数据安全。 在过去,SSL证书需要购买才…

OpenAI官方发布ChatGPT 提示词指南,六大策略让你玩转大语言模型!

OpenAI前段时间官方放出了自己的提示工程指南,从大模型小白到开发者,都可以从中消化出不少营养。看看全世界最懂大模型的人,是怎么写提示词的。官方给出了6 个大提示策略: 1、清晰的指令: 告诉AI你具体想要什么。比如…

ElasticSearch的DSL查询语法解析

Elasticsearch提供了基于ISON的DSL (Domain Specific Lanquage)来定义查询。 目录 一、常见查询类型 二、DSLQuery基本语法 三、全文检索查询 3.1 match查询:会对用户输入内容分词,常用于搜索框搜索 ,语法: 3.2 multi match…

RK3568 学习笔记 : 解决 linux_sdk 编译 python 版本报错问题

前言 最近买了 【正点原子】 的 RK3568 开发板,下载了 开发板的资料,包括 Linux SDK,这个 Linux SDK 占用的空间比较大,扩展了一下 VM 虚拟机 ubuntu 20.04 的硬盘空间,编译才正常通过。 编译 RK3568 Linux SDK 时&am…

STM32存储左右互搏 SPI总线读写FRAM MB85RS2M

STM32存储左右互搏 SPI总线读写FRAM MB85RS2M 在中低容量存储领域,除了FLASH的使用,,还有铁电存储器FRAM的使用,相对于FLASH,FRAM写操作时不需要预擦除,所以执行写操作时可以达到更高的速度,其…

Postgresql源码(119)PL/pgSQL中ExprContext的生命周期

前言 在PL/pgSQL语言中,执行任何SQL都需要通过SPI调用SQL层解析执行,例如在SQL层执行表达式的入口: static bool exec_eval_simple_expr(PLpgSQL_execstate *estate,PLpgSQL_expr *expr,Datum *result,bool *isNull,Oid *rettype,int32 *re…

RK3568驱动指南|第九篇 设备模型-第95章 创建属性文件并实现读写功能实验1

瑞芯微RK3568芯片是一款定位中高端的通用型SOC,采用22nm制程工艺,搭载一颗四核Cortex-A55处理器和Mali G52 2EE 图形处理器。RK3568 支持4K 解码和 1080P 编码,支持SATA/PCIE/USB3.0 外围接口。RK3568内置独立NPU,可用于轻量级人工…

《PySpark大数据分析实战》-23.Pandas介绍DataFrame介绍

📋 博主简介 💖 作者简介:大家好,我是wux_labs。😜 热衷于各种主流技术,热爱数据科学、机器学习、云计算、人工智能。 通过了TiDB数据库专员(PCTA)、TiDB数据库专家(PCTP…