【基于感知损失的无监督泛锐化】

news2024/11/18 15:42:52

PercepPan: Towards Unsupervised Pan-Sharpening Based on Perceptual Loss

(PercepPan:基于感知损失的无监督泛锐化)

在基于神经网络的全色锐化文献中,作为地面实况标签的高分辨率多光谱图像通常是不可用的。为了解决这个问题,一种常用的方法是将原始图像降维到一个较低的分辨率空间,以便在Wald协议下进行有监督的训练。在这篇论文中,我们提出了一个无监督的全色锐化框架,称为“感知全色锐化”。该方法基于自动编码和感知损失,不需要退化训练。为了提高性能,我们还提出了一种新的训练模式,称为“先有监督预训练,然后无监督微调”,以训练无监督框架。

介绍

全色锐化通常被描述为旨在基于低分辨率多光谱(LRMS)图像和全色(PAN)对应物生成高分辨率多光谱(HRMS)图像的图像融合问题。经典的全色锐化方法包括分量替换、多分辨率分析和变分优化。
深度学习的热潮,越来越多的研究人员使用神经网络来解决pan-sharpening问题和达到不错的效果。灵感来源于图像超分辨率,Masi等人构建一个三层pan-sharpening卷积神经网络。Shao等人设设计具有两个分支的深度卷积网络,其中一个用于LRMS图像,另一个用于PAN图像。为了充分利用领域知识,Yang等人集成了一种特殊设计的结构,用于光谱和空间信息保存。为了进一步提高图像质量,Liu等人使用生成对抗网络(GAN)来构建全色锐化网络,称为PSGAN,其中双流生成器被设计为同时接收LRMS图像和PAN图像。与其他方法不同,基于(深度)神经网络的方法可以有效地提取多级抽象特征,以利用标准反向传播提高性能。
尽管取得了这些成就,但全色锐化总是遇到地面实况HRMS图像通常无法用于神经网络训练的问题。与遥感图像分类问题不同,通过人工标注不可能获得用于全色锐化的地面实况HRMS图像。因此,基于神经网络的方法通常遵循Wald协议,以将原始LRMS图像作为标签,并将原始LRMS和PAN图像降级到较低分辨率空间作为输入。这种监督学习方式将导致在较低分辨率空间中训练的全色锐化网络G’。此外,G’可以在原分辨率空间中直接求出。
是否有必要基于降级步骤在较低分辨率空间中训练全色锐化网络?本文提出了一个无监督的全色锐化框架,其中全色锐化网络G可以直接在原始分辨率空间中训练。新方法不再需要用于训练的退化步骤,而是利用辅助重建器网络R。图1说明了基于降级步骤的传统监督透视图与我们的非监督透视图之间的差异。在这里插入图片描述
为了训练无监督泛锐化框架,我们提出了一种新的训练模式,称为“先有监督预训练,再无监督微调(SPUF)“。一般而言,深度神经网络有三种成功的训练范例。第一种是“先无监督预训练,后有监督微调(UPSF)”。UPSF方法通常包含贪婪的逐层预训练阶段,并且优于随机初始化。第二个是“端到端培训(E2E)“。由于大规模标记数据集的出现,E2E方法变得越来越流行。第三种是“先有监督预训练,后有监督微调(SPSF)”。由于SPSF方法可以受益于有监督的预训练,近年来,它被应用于许多任务,如目标检测、语义分割、超分辨率等,综合实验表明,预训练通常有助于下游任务。预训练的成功以及HRMS图像的缺失激发了用于全色锐化网络训练的新颖SPUF范例。值得注意的是,本文主要关注如何在没有退化步骤的情况下以无监督方式训练全色锐化网络。

贡献

1)提出了一种新的无监督学习框架“感知全色锐化(PercepPan),”该框架不再需要退化步骤。该框架由生成器、重构器和鉴别器组成。生成器负责生成HRMS图像,重建器利用先验知识将观察模型从HRMS图像模拟为LRMS-PAN图像对,鉴别器从LRMS-PAN图像对中提取特征以计算特征损失和GAN损失。
2)采用感知损失作为目标函数。该损失由三部分组成,一部分在像素空间计算,另一部分在特征空间计算,最后一部分在GAN空间计算。混合损失有益于改善所生成的HRMS图像的感知质量。
3)采用一种新的训练模式SPUF对PercepPan进行训练。实验结果表明,SPUF算法通常优于随机初始化算法。
4)实验表明,PercepPan可以与多种不同的生成器协同工作。在QuickBird数据集上的实验表明,无监督的结果与有监督的结果具有可比性。当推广到IKONOS数据集时,类似的结论仍然成立。

Perceptual Loss

基本上,所提出的PercepPan使用感知损失来训练。感知损失主要取决于高水平特征提取(卷积)神经网络而不是图像像素值。之后引入图像超分辨率,失去了越来越多的关注。
感知损失最显著的例子是实时风格转移和图像超分辨率,其中通过欧几里得距离计算真实特征和重构特征之间的感知损失。这种损失可以在一定程度上减少高分辨率图像和低分辨率图像之间的模糊性。
感知损失也可以与GAN损失联合收割机以获得更好的性能。变分自动编码器/生成对抗网络(VAE/GAN),特征损失和GAN损失被结合用于相似性度量学习,这可以被视为感知损失的扩展。它也激发了我们对全色锐化的感知损失使用。具体而言,VAE/GAN使用三种不同的损失进行训练。第一个是先验损失KL(z = Enc(x))||zp),其约束从数据点x学习的潜在表示z遵循与从先前分布中得出的zp相同的分布;第二个是特征损失,||Di s ( 1 ) s^{(1)} s(1)(x)− Di s ( 1 ) s^{(1)} s(1)(x~Dec(z))||2 2,基于VAE/GAN中鉴别器第l层的隐藏表示;最后一个是GAN损失,log(Dis(x))+ log(1 − Dis(x~ ))+ log(1 − Dis(xp)),它可以提高图像的清晰度。这里,KL表示Kullback-Leibler散度;Enc、Dec和Dis分别表示编码器、解码器和鉴别器;x~ 和xp分别表示生成和重建的图像。
PercepPan采用了与VAE/GAN相似的损失计算方法,但也存在一些差异。PercepPan直接将HRMS图像作为潜在表示,表示的维数高于输入的维数;此外,PercepPan在像素空间中引入了损失计算,作为之前损失的替代方法。
利用GAN的感知损失的另一示例是增强型超分辨率GAN(ESRGAN),其中引入残差中残差密集块(RRDB)作为基本单元,以及相对论性生成对抗网络和感知损失。这些技巧帮助ESRGAN生成具有更好感知质量的高分辨率图像,并赢得了PIRM 2018-SR挑战赛的第一名。从数学上讲,ESRGAN可以简单地表示为在这里插入图片描述
其中x和y分别表示具有三个通道的低分辨率(LR)和高分辨率(HR)图像。图2显示了ESRGAN的发生器架构。在这里插入图片描述
除了一些小的调整,提出的PercepPan也简单地采用ESRGAN的架构作为全色锐化的生成器。具体而言,PercepPan中使用的图像是多光谱(MS)图像,其通常具有更多的通道/波段,例如IKONOS和QuickBird为4个,WorldView-2为8个,因此需要改变第一卷积层中滤波器的通道数。此外,PercepPan使用ESRGAN进行“残差学习”,而不是直接生成HR图像,在这里插入图片描述
其中,x表示MS图像,µx和σx为残差,二者的通道数与x相同。这意味着最后卷积层中的滤波器的信道数也需要改变。作为示例,图2还示出了对具有四个频带的MS图像的适应。然后,这些学习的残差将以类似风格转移的方式与PAN图像融合。
应该注意的是,该PercepPan可以配合不同的生成器。上述构造架构只是一个例子,它不是PercepPan框架的一个关键部分。

方法

Pan-Sharpening Formula

给定具有N个样本的训练数据集,{( x ( n ) x^{(n)} x(n) p ( n ) p^{(n)} p(n) y ( n ) y^{(n)} y(n))} N n=1,,其中 x ( n ) x^{(n)} x(n) R W × H × C R^{W×H×C} RW×H×C p ( n ) p^{(n)} p(n) R r W × r H R^{rW×rH} RrW×rH y ( n ) y^{(n)} y(n) R r W × r H × C R^{rW×rH×C} RrW×rH×C分别表示LRMS图像、PAN图像和HRMS图像。W、H和C分别表示LRMS图像的宽度、高度和带数,r是LRMS图像和PAN图像之间的空间分辨率比。
当地面实况HRMS图像 y ( n ) y^{(n)} y(n)已知时,全色锐化问题可被表达为以下监督学习问题:在这里插入图片描述
其中g表示全色锐化模型/生成器的集合;L是损失函数,例如像素空间中的MSELoss(均方误差损失)或L1 Loss/MAELoss(平均绝对误差损失);^y (n)表示从全色锐化生成器G ∈ g生成的HRMS图像,在这里插入图片描述
在本文中,我们引入自动编码器来处理HRMS图像的缺失。通常,自动编码器由学习输入的潜在表示的编码器和从学习的表示重构输入的解码器(或重构器)组成。它通常在像素空间中通过重建损失来训练,并且不需要任何标记。对于全色锐化,发生器G扮演编码器的角色,并且在这种情况下,潜在表示正好是融合的HRMS图像^y (n)。引入了一个额外的结构R =(Rx,Rp)来从^y (n)重建LRMS-PAN图像对,也就是说,
在这里插入图片描述
基于重建图像,损失计算可以从HRMS图像空间移动到LRMS-PAN图像对空间。因此,等式(3)可以重新表示为在这里插入图片描述
然而,仅在像素空间中计算损失可能会引入模糊,尤其是在使用MSELoss时。为了防止模糊并获得更好的感知质量,引入了混合损耗。一般来说,损失计算可表示如下:在这里插入图片描述
其中M是任意函数。当M是单位函数时,等价于仅在像素空间中的损失计算在这里插入图片描述
其中,Lpixel是MSE损耗或L1损耗。当M对于从LRMS-PAN图像对中提取特征而言更复杂时,则可以将其表示为在这里插入图片描述
其中为了清楚起见,F代替M,Lfeat是MSE损耗或L1Loss。当M是GAN 的鉴别器D时,损失可表示为
在这里插入图片描述
其中LGAN可以是BCELoss(二元交叉熵损失)。这三种损失可以代表不同抽象层次的LRMS-PAN图像对。
将等式(8)-(10)组合在一起,用于全色锐化的优化目标函数可表达如下:在这里插入图片描述
α、β和γ是控制不同损失项重要性的超参数。等式(11)可被视为感知损失的扩展,其通常用于风格转移和图像超分辨率。这就是为什么我们称这个模型为“感知泛锐化”,或者简称为PercepPan。它完全是一个无监督的学习公式,完全不需要地面实况HRMS图像。需要注意的是,本文中F是作为D的一部分实现的,而不是单独的神经网络
图3显示了PercepPan的结构,其中G、R和D都由神经网络实现。F是D的一部分,并且它被分成两个流,F =(Fx,Fp),其中Fx从LRMS图像提取特征,而Fp从PAN图像提取特征。这些特征将首先沿着通道轴连接在一起,然后由VGG型网络处理。

Network Architecture

请添加图片描述
如图3所示,提出的PercepPan由三部分组成:
1)生成器G,其将LRMS-PAN图像对(x,p)作为输入以生成HRMS图像y;
2)重建器R,将生成的HRMS图像y作为输入,以重建相应的LRMS-PAN图像对,输出分别表示为x和p;
3)鉴别器D,其将真实的/重建LRMS-PAN图像对作为输入,以计算特征损失和GAN损失。
Generator. 生成器G需要融合来自LRMS图像的光谱细节和来自PAN图像的空间细节。现有的生成器将LRMS-PAN图像对直接带入网络以提取那些细节,或者根据LRMS图像学习残差细节,可以充当G的角色。我们还尝试了根据PAN图像的具有残差学习的ESRGAN式生成器,在这里插入图片描述
残差学习受著名的风格转换方法启发,称为“自适应实例归一化(AdaIN)”。具体地,将x视为风格图像,并且ESRGAN风格生成器学习对应的风格特征µx和σx,而将p视为内容图像,并且内容特征µp和σp分别被简单地分配为零矩阵和单位矩阵。
Reconstructor. 重建器R =(Rx,Rp)旨在从所生成的HRMS图像重建LRMS-PAN图像对。它可以通过神经网络来实现。本文设计了一个浅层的R架构来模拟如何通过卫星获取LRMS-PAN图像对的观测过程。
因为LRMS图像相对于对应的HRMS图像在空间上退化,所以重建器的第一部分Rx被视为模糊和下采样的组合,在这里插入图片描述
由于PAN图像通常覆盖MS图像光谱带的所有波长,因此可通过HRMS图像带的线性组合近似PAN图像,换句话说,重建器的第二部分Rp可定义为在这里插入图片描述
Discriminator. 鉴别器D负责计算特征损失和GAN损失。
特征丢失计算需要LRMS-PAN图像对作为输入。为了同时接收不同种类的图像,D包含两个输入分支F =(Fx,Fp),其中Fx用于LRMS图像,而Fp用于PAN图像。然后将提取的特征融合在一起。
为了计算GAN损失,D进一步将这些特征发送到VGG型神经网络。对于每个输入,VGG风格的体系结构输出一个标量,它表示输入特征来自真实的数据而不是生成的特征的概率。

Initialization

初始化对于训练神经网络至关重要。最常用的策略是根据特定概率分布进行随机初始化。另一种策略是预训练初始化,其中使用来自预训练网络的权重。后者近年来被越来越多的作品所利用。
为了初始化生成器G,使用随机初始化和预训练初始化两者。对于随机初始化,使用高斯分布,表示为随机样式。对于预训练初始化,使用两个预训练神经网络,其中一个称为PSNR风格,其利用像素损失进行训练,另一个称为ESRGAN风格,其基于前者利用GAN损失进行微调。
为了初始化重建器R =(Rx,Rp),我们开发了一种新的初始化策略,称之为先验初始化,这其中使用了特定的卫星特性。一方面,模糊算子H1,H2,……,Rx中的HC通常被实现为高斯滤波器,其权重从卫星的奈奎斯特截止频率导出。另一方面,Rp中的线性权重可以根据卫星的归一化光谱响应曲线计算。这些特征参数构成初始化的先验知识,如表1所示,以供参考。这种先验知识起到了类似正则化项的作用,有助于减少^y的不确定性。
为了初始化鉴别器D,公共随机初始化就足够了,并且再次使用高斯分布
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/388857.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

C++初学笔记整理

目录 1. C关键字 2. 命名空间 1)命名空间的引入和概述 2)命名空间的定义 3)std与命名空间的使用 4).相关特性 3. C输入&输出 4. 缺省参数 1 )缺省参数概念 2)使用及分类 a.全缺省 b.部分缺省 5. 函数…

力扣-337打家劫舍III(dp)

力扣-337打家劫舍III 1、题目 337. 打家劫舍 III 小偷又发现了一个新的可行窃的地区。这个地区只有一个入口,我们称之为 root 。 除了 root 之外,每栋房子有且只有一个“父“房子与之相连。一番侦察之后,聪明的小偷意识到“这个地方的所有…

【FMCW 01】中频IF信号

FMCW信号 调频连续波(frequency modulated continuous wave,FMCW)顾名思义,就是对信号的频率进行线性调制的信号。 从时域上看,对频率的调制,就像一把连续的锯齿波。其中每一个锯齿叫做一个chirp,其持续的时间叫做ch…

Android仿微信选择图片

效果展示首先先添加用到的权限<uses-permission android:name"android.permission.INTERNET" /><!--获取手机存储卡权限--><uses-permission android:name"android.permission.READ_EXTERNAL_STORAGE"/><uses-permission android:nam…

java 包装类 万字详解(通俗易懂)

前言简介和溯源拆装箱String类和基本类型的相互转化String类和包装类型的相互转化八大包装类的常用方法汇总&#xff08;含代码演示&#xff09;一、前言 : 本节内容是我们《API-常用类》专题的最后一节了。本节内容主要讲包装类&#xff0c;内容包括但不限于包装类的诞生&…

Linux磁盘占满,如何清理磁盘空间

目录解决思路&#xff1a;先查linux磁盘为什么占满了&#xff0c;是什么导致的&#xff0c;这样才好去定位目录&#xff0c;清楚空间写者的问题是测试环境磁盘占满&#xff0c;原因是测试环境tomcat的日志都会保留&#xff0c;日志空间占用太大把linux磁盘占满&#xff0c;导致…

HTML 表单

HTML 表单和输入 HTML 表单用于收集不同类型的用户输入。 在线实例 创建文本字段 (Text field) 本例演示如何在 HTML 页面创建文本域。用户可以在文本域中写入文本。 创建密码字段 本例演示如何创建 HTML 的密码域。 &#xff08;在本页底端可以找到更多实例。&#xff09; …

信息安全与数学基础-笔记-①整数的可除性

知识目录整除素数带余除法最大公因数&#xff08;欧几里德算法&#xff09;裴蜀等式最小公倍数❀标准分解式❀标准分解式求最大公因数标准分解式求最小公倍数整除 a bq 公式表达的意思&#xff1a;b整除a&#xff0c;a可被b整除 用符号表示&#xff1a;b | a 否则&#xff1a…

【SpringMVC】SpringMVC程序开发

SpringMVC程序开发 文章目录SpringMVC程序开发:one:认识SpringMVC什么是SpringMVCMVC思想:two:获取请求参数创建SpringMVC项目建立路由连接获取请求参数获取urlEncoded格式参数获取表单标签参数获取Json格式参数获取URL中的参数上传图片获取请求信息获取请求header获取cookie创…

Linux -- 信号控制进程 Kill 命令 简引

Kill 命令 &#xff1a;给进程发送信号 &#xff1a;[rootfsw ~]# kill -l # 可以列出 当前所有的信号量 比较常用的就是 &#xff1a;1) SIGHUP 重新加载配置2) SIGINT 键盘中断^C 即 Ctrl C3) SIGQUIT 键盘退出9) SIGKILL 强制终止15) SIGTERM 终止&#xff08;正…

『OPEN3D』点云表面重建

目录 1 点云法线一致性估计 2 点云的表面重建 1 Alpha shapes reconstruction 2 Ball pivoting reconstruction 3 poisson surface reconstruction 1 点云法线一致性估计 在点云处理的章节中已经介绍使用estimate_normals来生成点云的发现信息&#xff0c;但该方法通过拟合…

业务流程测试

用例设计主要问题主要问题存在于&#xff1a;1、测试点分析&#xff1a;逻辑性不强对于整个页面功能划分不清晰&#xff1b;不同测试点归类不清晰&#xff1b;不能形成相对固定的套路&#xff0c;书写耗费大量时间...2、测试用例&#xff1a;关于&#xff0c;要细致到什么程度&…

一个供参考的计算机的学习路线

本文是介绍如何成为一个Geek&#xff0c;一个真正的计算机高手。 适合有成为IT领域技术大牛的人参考。 写给大一新生和所有向深耕IT领域的人&#xff0c;避免走一些弯路。 仅代表个人想法&#xff0c;供批判性参考。 第一门入门的必备功课-语法与算法 什么是计算机&#xff1f…

力扣sql简单篇练习(二十二)

力扣sql简单篇练习(二十二) 1 上月播放的儿童适宜电影 1.1 题目内容 1.1.1 基本题目信息 1.1.2 示例输入输出 a 示例输入 b 示例输出 1.2 示例sql语句 # Write your MySQL query statement belowSELECT titleFROM ContentWHERE kids_contentY AND content_typeMoviesAND c…

MYSQL性能分析,Explain

文章目录一、MYSQL常见瓶颈二、ExplainExplain是什么一、MYSQL常见瓶颈 CPU&#xff1a; CPU饱和IO&#xff1a;磁盘IO速度过慢。服务器的硬件性能瓶颈。 二、Explain Explain是什么 使用explain关键字可以模拟优化器执行sql查询语句&#xff0c;从而知道mysql如何处理你的…

Python 随机漫步

目录 1. 创建 RandomWalk 类 2. 选择方向 3. 绘制随机漫步图 4. 总结 本篇博客将使用 Python 来生成随机漫步数据&#xff0c;在使用 Matplotlib 以引人注目的方式将这些数据呈现出来。 随机漫步 是这样行走得到的路径&#xff1a;每次行走都是完全随机的、没有明确…

跨域问题以及Ajax和Axios的区别

文章目录1. 同源策略2. 同源策略案例3. 什么是跨域4. 跨域解决方法4.1 Ajax的jsonp4.2 CORS方式4.3 Nginx 反向代理5. Axios 和 Ajax 的区别6. Axios 和 Ajax 的区别及优缺点6.1 Ajax&#xff1a;6.1.1 什么是Ajax6.1.2 Ajax的原理6.1.3 核心对象6.1.4 Ajax优缺点6.1.4.1 优点&…

大白话+画图 从源码角度一步步搞懂ArrayList和LinkedList的使用

1.说说ArrayList 1.基本原理 ArrayList&#xff0c;原理就是底层基于数组来实现。 01.基本原理&#xff1a; 数组的长度是固定的&#xff0c;java里面数组都是定长数组&#xff0c;比如数组大小设置为100&#xff0c;此时你不停的往ArrayList里面塞入这个数据&#xff0c;此…

Warshall算法求传递闭包及Python编程的实现

弗洛伊德算法-Floyd(Floyd-Warshall)-求多源最短路径&#xff0c;求传递闭包 Floyd算法又称为插点法&#xff0c;是一种利用动态规划的思想寻找给定的加权图中多源点之间最短路径的算法&#xff0c; 与Dijkstra算法类似。该算法名称以创始人之一、1978年图灵奖获得者、斯坦福大…

minikube搭建Kubernetes环境

前言 Kubernetes 一般都运行在大规模的计算集群上&#xff0c;管理很严格&#xff0c;Kubernetes 充分考虑到了这方面的需求&#xff0c;提供了一些快速搭建 Kubernetes 环境的工具。 minikube 它是一个“迷你”版本的 Kubernetes&#xff0c;自从 2016 年发布以来一直在积极地…