【互信息驱动:可逆神经网络】

news2025/1/19 14:18:33

Mutual Information-driven Pan-sharpening

(互信息驱动的全色锐化)

全色锐化的目的是综合纹理丰富的全色图像和多光谱图像的互补信息,生成纹理丰富的多光谱图像。尽管已有的全色锐化方法取得了显著的进步,但它们并没有明确地加强PAN和MS图像两种模态之间的互补信息学习。这导致信息冗余没有得到很好的处理,进一步限制了这些方法的性能。针对上述问题,提出了一种基于互信息驱动的泛锐化框架。具体地说,首先将PAN和MS图像分别投影到模态感知特征空间,然后对它们施加互信息最小化以明确地鼓励互补信息学习。这种操作能够减少信息冗余,提高模型性能。在多个卫星数据集上的实验结果表明,该算法在定性和定量上均优于现有方法,对真实场景具有较强的泛化能力。

介绍

随着遥感技术的飞速发展,爆炸物卫星图像被广泛应用于军事、环境监测、测绘等领域。由于物理条件的限制,卫星通常同时捕获多光谱(MS)和全色(PAN)传感器以获得互补信息。MS图像具有较高的光谱分辨率,但空间分辨率有限; PAN图像具有丰富的空间信息,但光谱分辨率较低。为了获得高光谱和高空间分辨率的遥感影像,融合MS和PAN影像的全色锐化技术受到了影像处理界和遥感界的广泛关注。
作为融合任务,已经开发了具有两种主要融合策略的相当多的全色锐化方法:1)图像级融合和2)特征级融合。如图1(a)所示,第一类在将MS和PAN图像馈送到网络之前沿着信道维度直接连接MS和PAN图像。请添加图片描述
由于没有明确地进行跨模态融合,因此“input fusion”策略在研究互补信息方面受到限制,从而导致不令人满意的性能。
第二类尝试从PAN和MS图像中独立提取模态感知特征,然后在特征空间中进行信息融合,如图1(b)所示。请添加图片描述
尽管取得了令人鼓舞的进展,但仍存在以下问题。由于PAN和MS图像以不同的模态捕获相同的场景,因此它们包含共享信息以及独特特征,如图3所示。在这里插入图片描述
然而,现有的全色锐化方法并没有明确地执行PAN和MS图像两种模态之间的互补信息学习,从而导致学习特征的冗余和所谓的复制伪影。针对现有方法的局限性,本文通过加强互补特征学习和减少信息冗余来提高全色锐化的性能。
请添加图片描述
如图1(c)所示,我们提出了一种新的级联方式的互信息驱动全色锐化框架,详细流程如图4所示。请添加图片描述
该算法首先将MS和PAN图像分别送入两个独立的卷积分支获取模态感知特征,然后对它们施加互信息最小化,以促进互补信息由浅入深的学习。具体地,将所获得的模态感知特征进一步转换为低维特征向量以计算互信息,其中,后一级特征向量是根据以下两种方式获得的:1)特征向量计算中的当前层模态特征和2)前一层直接处理特征。这种操作能够减少信息冗余,如图2所示。请添加图片描述
在获得精细特征后,设计了一个后融合模块,通过配置有效的可逆神经网络将其投影回期望的MS图像。在多个卫星数据集上的实验结果表明,该算法在定性和定量上均优于现有方法,对真实场景具有较强的泛化能力。

贡献

1)我们设计了一种新的级联互信息最小化全色锐化框架。据我们所知,这是第一次尝试明确鼓励MS和PAN模态之间的多模态学习。该模型减少了全色锐化过程中的信息冗余,减轻了全色锐化过程中的伪影。
2)在多个卫星数据集上的大量实验结果表明,该算法相对于现有算法具有较好的性能。在真实世界全分辨率卫星场景中也验证了该算法的泛化能力。

相关工作

Classic Pan-sharpening methods

近年来,人们提出了许多经典的全色锐化方法,试图将低分辨率多光谱(LR-MS)图像与全色图像融合,得到高分辨率多光谱(HRMS)图像。常用的划分方法是将经典全色锐化方法分为以下几类:基于组件替换(CS)的方法、基于多分辨率分析(MRA)的方法和基于变分优化(VO)的方法。CS方法的核心思想是用从PAN图像中提取的分量替换LR-MS图像的空间分量。但是,由于高频细节被注入到变换域中,因此在实际使用中经常存在频率混叠问题。此外,也有一些混合方法将CS方法和MRA方法相结合,试图利用两者的优势互补。在最近的过去,许多VO方法已经作为它们在全色锐化领域的良好表现而出现。这些方法被设计成通过某些先验约束或假设来找到最优函数。然而,如何选择合适的先验约束和合理的假设是VO方法面临的巨大挑战。

Deep learning based methods

目前,随着基于深度学习(Deep learning,DL)的方法在高光谱图像和遥感图像领域的成功,DL方法也开始应用于全色锐化,并取得了很大的进步。著名的DL方法称为PNN,其基于三层卷积神经网络。随后,PANNet在训练过程中引入高通滤波域以保留空间信息。MSDCNN考虑到了多尺度的问题,在网络中加入多尺度模块来提升性能。此外,在SRCNN的基础上,Cai等人将超分辨率方法应用于全色锐化。上述网络都是基于残差块设计的,残差块限制了浅层网络特征的重用。Wang等采用U型网络解决了这一问题。此外,WSDFNet通过自适应跳跃加权器将浅层特征传播到深层。此外,还有一些基于生成对抗模型的网络,如Pan-GAN。像GPPNN这样的用于全色锐化的模型驱动深度网络提高了模型的可解释性,但性能有所下降。

Mutual information

InfoMax原则激发了爆炸性表征学习研究者的工作,他们最大化交互信息以实现有效表征。有研究人员提供了关于三个折叠上的连接和应用方向的经验证据:1)同一图像的全局特征和局部特征,2)同一场景上不同图像模态的多个视图,以及3)数据的顺序分量。此后,Zhang 等人引入互信息最小化来明确鼓励RGB图像和深度数据之间的多模态信息学习。Sanghi 等人最大化3D对象及其几何变换版本之间的互信息,以改进表示。然而,在全色锐化任务中自然存在信息冗余,并导致所谓的复制伪影。为此,我们引入了两模态PAN和MS图像之间的互信息最小化来鼓励多模态学习。

方法

我们将PAN图像表示为P ∈ R H × W × 1 R^{H×W×1} RH×W×1,其对应的MS图像首先以与M ∈ R H × W × C R^{H×W×C} RH×W×C相同的空间分辨率P进行上采样。

Model architecture

请添加图片描述

如图4所示,我们提出的方法由三个模块组成:PAN和MS图像的模态感知特征提取、互信息约束和基于可逆神经网络(Invertible neural networks (INN))的后融合模块。
Modality-aware feature extraction. 首先采用两个独立的特征提取分支,以核大小为3 × 3的卷积层为基本成分,将PAN和MS图像从浅到深投影到模态感知特征映射上。具体地,这些特征被表示为P1、P2、、、PK和M1、M2、、、MK分别进行比较。两者都配备了H ×W × C的尺寸。假设两个分支分别表示为fp和fm,则该过程可写为
请添加图片描述
Mutual information.
参照上述PAN特征P1、P2、、、PK和MS特征M1、M2、、、MK,我们首先将它们转换成低维特征向量以准备互信息。具体地说,首先将第一层特征P1和M1分别送入一个核大小为3 × 3的卷积层(信道维为 P 1 P^1 P1T M 1 M^1 M1T),然后再送入两个全连通层(全连通层接收上述整形后的特征),得到低维特征向量Ep1和Em1
请添加图片描述
其中C3、FCs分别表示核大小为3×3的卷积层和全连通层。在后一层特征方面,以第i层为例,特征向量是通过组合先前的中间特征变换 P i − 1   T  、 P^{i−1}~T~、 Pi1 T M^{i−1}T和当前的模态特征Pi、Mi而获得的。1)Pi和Mi被馈送到用于信道缩减的两个不同的卷积层; 2)减少特征与先前的中间特征 P i − 1   T  和 P^{i−1}~T~和 Pi1 T M^{i−1}T相加;3)所获得的特征进一步通过卷积层和两个全连通层,以生成低维特征向量Epi和Emi在这里插入图片描述
其中C3表示核大小为3 × 3的卷积,采用非共享权重方式。最后,给定PAN图像的模态感知特征向量Ep1,Ep2,,,EpK和MS图像的Em1、Em2、、、EmK,我们引入互信息最小化来加强两个模态的互补信息学习,从而减少信息冗余。
在信息论中,互信息旨在测量通过观察一些其他随机变量Emi获得的关于随机变量Epi的信息量,反之亦然在这里插入图片描述
其中H(.)表示熵,i ∈ [1,K],其中K为特征提取的级数,H(Emi),H(Epi)表示边缘熵,H(Epi,Emi)和H(Emi,Epi)是联合熵,H(Epi|Emi)和H(Emi|Epi)是条件熵。然后,对上述方程进行积分,我们可以得出
请添加图片描述
在此基础上,我们引入了Kullback-Leibler散度(KL)来计算熵
在这里插入图片描述
INN block.
通过互信息最小化,减少了模态特征的冗余度。其次,设计了一种有效的基于可逆神经网络的后融合模块。基本组件是前人所提出的耦合层,并堆叠以有效融合在细化模态特征之上,从而投射回预期MS图像。深入到耦合层,卷积模块由半实例归一化模块实现。

Optimization

请添加图片描述
如图4所示,总损失函数由两部分组成:一个用于通过L1损失重建地面实况MS图像,另一个用于减少两个模态之间的信息冗余,写为:

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/116699.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

动态圣诞树-HTML

<!DOCTYPE HTML PUBLIC> <html> <head> <title>圣诞树</title> <meta charset"utf-8" > <style> html, body { width: 100%; height: 100%; margin: 0; padding: 0; border: 0; } div { margin: 0; padding: 0; border: 0…

docker高级篇:实战-自己开发的微服务怎么在docker上面运行?

通过前面的一系列学习,我们已经知道怎么制作dockerfile了。那么,本篇文章,咱们就把自己写的spring boot的demo项目,部署在docker上面。 案例目标: 我们自己开发的微服务怎么在docker上面运行呢? 1:通过IDEA新建一个普通的微服务模块 2:通过dockerfile发布微服务部署…

通过 api 和 keycloak 理解OIDC认证

参考资料 通过Keycloak API理解OAuth2与OpenID Connect 什么是keycloak如何在nodejs中使用它 如何通过 OIDC 协议实现单点登录&#xff1f; https://jwt.io/#encoded-jwt OIDC认证的简单demo 单点登录&#xff08;Single Sign On&#xff09;是目前比较流行的企业业务整合…

cut与分层抽样(Stratified Sampling)

个人觉得&#xff0c; 把分层抽样称为“分类采样”会更贴切一些。通常最基本的采样手段是&#xff1a;随机抽样&#xff0c;但是在很多场景下&#xff0c;随机抽样是有问题的&#xff0c;举一个简单的例子&#xff1a;如果现在要发起一个啤酒品牌知名度的调查问卷&#xff0c;我…

二、let进阶、const、全部变量与顶层对象

二、let进阶、const、全部变量与顶层对象 一、let进阶 let创建了块级作用域&#xff0c;每次循环时内部的块级作用域都会去访问外层块级作用域中的变量i&#xff0c;而外层块级作用域中的变量i都不同&#xff0c;所以打印0-9&#xff1b;类似于闭包&#xff1a;内部函数返回到…

MySQL【Primary key】主键约束

关键字: [ primary key ] 作用&#xff1a;用来唯一标识表中的一行记录 特点&#xff1a;1.唯一性约束非空约束 唯一且为空 唯一性约束&#xff1a;不允许出现重复值 非空约束&#xff1a;不允许出现空值&#xff0c;但不是 NULL 2.一个表最多只能有一个主键约束&#x…

35岁之后软件测试工程师靠什么养家?我还能继续做测试。

35岁真是一个焦虑的年龄&#xff0c;我一个在北京软件测试的朋友从一个大公司裸辞以后&#xff0c;年前应聘到了一家小公司做技术总监&#xff0c;因为疫情的爆发&#xff0c;公司倒闭了&#xff0c;他失业了。为了养家我这个朋友不得不冒着被病毒感染的危险开始送外卖。作为一…

Springboot整合Liquibase初始化数据库

一、前言 liquibase是一个数据库变更的版本控制工具。项目中通过liquibase解析用户编写的liquibase的配置文件,生成sql语句&#xff0c;并执行和记录。执行是根据记录确定sql语句是否曾经执行过&#xff0c;和配置文件里的预判断语句确定sql是否执行。 本篇文章给大家介绍spr…

RabbitMQ浏览器UI插件

Awesome RabbitMQ Management 该插件中文意思是"很棒的 RabbitMQ 管理",是对原生RabbitMQ的UI图形界面进行增强的一款插件。 可在Google Chrome商店中下载安装 概述 原文介绍 Awesome RabbitMQ Management RabbitMQ queues view can become unusable with many qu…

微服务 Spring Boot Mybatis-Plus 整合 EasyPOI 实现 Excel 一对多 导入

文章目录⛄引言一、EasyPOI 实现Excel 的一对多导入 -- 代码实现⛅需求说明⚡核心源码实现二、Easy POI 实现一对多导入 -- 测试三、效果图展示⛵小结⛄引言 Excel导入 是 开发中 很常用的 功能 &#xff0c;本篇讲解 如何使用 Spring Boot MyBatis -Plus 整合 EasyPOI 实现E…

2023年淘宝天猫年货节超级红包哪里领?

2023年淘宝天猫年货节超级红包哪里领? 姐妹们在淘宝年货节活动就就就要开始预热模式了&#xff0c;时间是12月27日中午12点&#xff0c;大家最爱的项目一定是领取超级红包了。这不&#xff0c;2023年的年货节就要开启了。但是&#xff0c;很多小伙伴还不知道&#xff0c;淘宝…

<生产者、消费者问题>——《Linux》

目录 1. 生产者消费者模型 1.1 为何要使用生产者消费者模型 1.2 生产者消费者模型优点 2.基于BlockingQueue的生产者消费者模型 2.1 BlockingQueue 2.2 C queue模拟阻塞队列的生产消费模型 3.POSIX信号量 4.基于环形队列的生产消费模型 后记&#xff1a;●由于作者水平…

windows中docker修改镜像与容器存放目录(不想放c盘)

查看状态 wsl --list -v 先退出docker deskop 查看状态 wsl --list -v 关闭wsl wsl --shutdown docker的镜像与容器存放目录在此处 新建一个你想要存放的目录&#xff0c;比如我存到H盘这个地方 分别将c盘那两个文件夹&#xff08;data和distro&#xff09;的内容打包压缩到H盘…

php使用redis进行消息发布订阅

php使用redis进行消息发布订阅前置条件消费者订阅subscribe.php生产者发送消息publish.php执行消费者订阅&#xff0c;开始阻塞获取消息执行生产者&#xff0c;开始发送消息查看消费者终端前置条件 已经安装了php的redis扩展 消费者订阅subscribe.php <?php ini_set(def…

【Java基础】Java日志—什么是日志?什么是Log4j?Log4j入门案例及配置

目录 一、什么是日志&#xff1f; 二、为什么会有日志&#xff1f; 四、入门案例&#xff1a;Log4j日志信息输出到控制台 步骤与实现&#xff1a; 步骤1&#xff1a;拷贝坐标 步骤2&#xff1a;拷贝配置文件 log4j.properties 步骤3&#xff1a;编写测试类 写到最后 &…

TensorRt(3)mnist示例中的C++ API

目前sample中mnist提供了至少caffe、onnx的预训练模型&#xff0c;在TensorRT经过优化生成engine后再进行infer&#xff0c;两种模型的加载处理略有不同&#xff0c;做出简单api处理说明。 最后尝试使用最少的代码来实现整个流程。 文章目录1、主要的C API 定义2、minst示例2.1…

云安全类型及预防方法

恶意软件是我们必须面对的现实&#xff0c;我们每天都需要与蠕虫、病毒、间谍软件和其他行恶意软件作斗争&#xff0c;而云恶意软件是我们需要面对的又一种类别。它已经发展十多年&#xff0c;早在2011年就托管在亚马逊简单存储服务存储桶中。云安全提供商Netskope报告称&#…

springboot够用就好系列-2.基于commandfast框架的应用开发

参考web的jsoncat框架&#xff0c;实现一个控制台IO的commandfast简易框架&#xff0c;并进行使用。 目录 程序效果 实现过程 样例代码 工程文件 参考资料 程序效果 截图1.查询当前时间和用户&#xff0c;查询磁盘空间 利用commandfast框架&#xff0c;实现的2个简单功能&…

95后阿里P7晒出工资单:狠补了两眼泪汪汪,真香...

最近一哥们跟我聊天装逼&#xff0c;说他最近从阿里跳槽了&#xff0c;我问他跳出来拿了多少&#xff1f;哥们表示很得意&#xff0c;说跳槽到新公司一个月后发了工资&#xff0c;月入5万多&#xff0c;表示很满足&#xff01;这样的高薪资着实让人羡慕&#xff0c;我猜这是税后…

Redis 核心原理串讲(上),从一条请求透视高性能的本质

文章目录Redis 核心原理总览&#xff08;全局篇&#xff09;前言一、请求二、数据结构1. 有哪些&#xff1f;2. 为什么节省内存又高效&#xff1f;三、网络模型1、四种常见IO模型1.1 同步阻塞1.2 同步非阻塞1.3 IO多路复用1.4 异步IO2、事件驱动2.1 引子2.2 事件驱动模型3、Rea…