【配准图像】

news2024/9/17 8:51:26

MU-Net: A MULTISCALE UNSUPERVISED NETWORK FOR REMOTE SENSING IMAGE REGISTRATION

(MU-Net:一种多尺度无监督遥感图像配准网络)

多传感器或多模态图像对的配准是许多遥感应用的基础性任务。为了实现高精度、低成本的遥感图像配准,提出了一种多尺度无监督网络(MU-Net)。MU-Net无需昂贵的地面实况标签,直接学习从图像对到其变换参数的端到端映射。MU-Net通过在多个尺度上叠加多个深度神经网络模型,实现了由scoarse-to-fine的配准流水线,避免了反向传播算法陷入局部极值,抵抗了图像的严重失真。此外,基于结构相似性设计了一种新的损失函数范式,使得MU-Net能够适用于各种类型的多模态图像。

介绍

遥感图像配准(Remote sensing image registration (RSIR))的目的是通过对应性检测获取图像间的几何变换参数(transformation parameters (TPs) )。RSIR是一项前期工作,它直接影响后续工作的性能,如图像融合、变化检测和变形监测等。从传统技术到深度学习(DL)技术,遥感界已经开发出许多令人鼓舞的图像配准方法。
传统的方法一般可以分为两类:基于特征的方法和基于区域的方法(Ma等人,2021年)。基于特征的方法从两幅图像中提取显著的和可重复的特征,并建立它们的对应关系。尺度不变特征变换(SIFT)是其中的代表,在SIFT的基础上提出了很多算法,如加速鲁棒特征(SURF)、定向FAST和旋转BRIEF(ORB)等。这些类SIFT方法适用于从单模态图像中提取可重复特征,但对于具有辐射变化的多模态图像(如光学-SAR图像对)则很脆弱。为了提高对辐射测量差异的鲁棒性,提出了一些局部特征描述符,例如辐射变化不敏感特征变换(RIFT)。总的来说,基于特征的方法的主要挑战是提取高度可重复的和不同的特征并正确地匹配它们。

基于区域的方法通常采用模板方案并通过评估图像的相似性来检测对应性。一些广泛使用的相似性度量是差平方和(SSD)、归一化互相关(NCC)和互信息(MI)。上述度量的性能很容易受到辐射度变化的影响。基于区域的方法的最新研究是将结构特征集成到相似性度量中以应对辐射度变化。虽然基于结构特征的区域配准方法能够有效地处理辐射变化,但在配准之前需要消除图像间明显的几何畸变。这需要手动选择控制点或需要具有地理参考信息的图像,使得基于区域的方法受到限制。总的来说,基于区域的方法的主要局限性在于它们不能有效地处理具有大几何失真的图像。
这两类传统方法分别存在上述缺点。此外,它们通常包括集成通过手工而不是自动学习提取的特征或局部描述符的匹配过程。由于在特征提取、描述和匹配过程中没有信息反馈,这些方法缺乏深层语义信息。当图像源改变时,这些手工制作的特征通常需要重新设计以保持匹配性能。因此,传统的方法往往难以处理几何失真和多模态图像之间的辐射差异。
近年来,越来越多的研究聚焦于数字图书馆。DL方法在一定程度上可以解决传统方法的缺点。一般来说,DL方法可以分为两类:集成学习方法和端到端学习方法。

集成学习方法通常集成深度神经网络(DNN)转化为传统的方法,并从自动学习的特征映射中提取特征描述符。传统的关键点检测、特征描述、模板滑动等操作都是在自学习的特征图上进行,而不是在原始图像或手工艺品特征图上进行。一些研究将SIFT描述符与DNN相结合,或将多方向梯度特征放入DNN。然而,这些集成学习方法无法匹配几何失真较大的图像,并且仍然需要针对不同的数据设计特定的DNN。与传统方法相比,计算复杂度增加了许多倍,但配准效果并没有明显改善。

端到端学习方法旨在直接预测TP。根据优化器是否需要地面实况TP,端到端学习方法可以被分为有监督的端到端学习方法(此后称为有监督的方法)和无监督的端到端学习方法(此后称为无监督的方法),其共同架构分别如图1(a)和(b)所示。请添加图片描述
如图1(a)所示,监督方法在训练过程中最大限度地减少了预测TP和地面真实TP之间的差异。相关研究包括深度图像单应性估计网络(DHN)、多尺度深度图像单应性估计网络(MHN)和深卢卡斯-卡纳德特征图(DLKFM)。然而,监督方法的网络需要通过大量具有地面真实TP的图像来训练。一个很大的挑战是,真正的标签是昂贵的,很难在RSIR获得。这种局限性使得监督方法难以在实践中得到广泛应用。
无监督方法在训练过程中优化图像之间的相似性,并且不需要地面真实TP,如图1(b)所示。近年来,无监督配准方法在医学图像配准中得到了广泛的应用,它解决了在没有真实可信点的情况下,网络训练效率不高的问题。相关的杰作包括VoxelMorph,以及深度学习图像配准框架(DLIR)。然而,由于以下原因,直接将相关方法应用于RSIR可能并不合适。首先,现有方法不能有效处理噪声和非线性辐射差异,这使得这些方法容易受到多模态RSIR的影响。其次,这些方法在图像配准之前需要对图像进行粗配准,而在RSIR中,消除几何失真是目标而不是预处理步骤。当图像具有显著的几何和辐射差异时,这些方法通常遭受较大的配准误差。
一般来说,在没有地面真值TP的情况下,目前还缺乏能够有效同时处理图像间大的几何畸变和辐射差异的方法,而我们的工作填补了这一空白。我们提出了一种多尺度无监督网络(MU-Net),它是一种从输入图像对到其TP的端到端映射方案。我们堆叠了几个DNN模型,用于从coarse-to-fine的配准管道,每个DNN模型代表在单个尺度上执行的工作流。在每个尺度上,通过优化图像之间的相似性来训练相应的DNN,从而避免了对地面真实TP的需要。首先,每个DNN模型被单独地和连续地训练以初始化网络权值。其次,将所有DNN模型级联堆叠形成联合配准流水线,并对联合配准流水线的参数进行联合训练,输出最终的TP。此外,该方法基于图像的结构特征而非图像的灰度特征来评价图像对的相似性,适用于多模态RSIR。

贡献

1)我们提出一个配准网络与无监督学习,这是一个端到端的图像的映射方案对转换参数。
2)该算法将多个DNN模型在多个尺度上叠加,形成由粗到精的配准流水线,避免了陷入局部极值,并能抵抗大范围的图像失真。
3)设计了一种新的基于结构相似度的损失函数模型,使得配准网络适用于各种类型的多模态图像。

方法

在这一部分中,详细阐述了所提出的用于RSIR的MU-Net,该MU-Net将图像通过多个尺度上的多个设计的DNN结构来回归TP,然后校正传感图像以与参考图像对齐。由于通过评估两幅图像的结构特征描述符的相似性来直接优化TP,因此MU-Net是完全无监督的。在本文中,我们选择仿射TP作为预测映射的形式,并且MU-Net可以集成其他形式。详情如下所示。

Problem Formulation

假设有一对图像f & m要对准。一个是具有每个像素的正确地理坐标的参考图像f,另一个是具有几何失真的感测图像m。 为了校正m,目标是找到一组TPsμ。在传统的图像配准中,通过最大化某个相似性度量Sim来直接优化μ:在这里插入图片描述
在无监督配准方法中,μ通过设计的DNN F回归:
请添加图片描述
因此,μ是间接优化的,因为它是通过最大化Sim直接优化的θ:
请添加图片描述

在MU-Net中,F被定义为一个由coarse-to-fine的堆叠式配准流水线,在训练过程中优化其权值和偏差参数θ。

Multiscale Workflow

MU-Net执行从coarse-to-fine的多尺度策略。具体来说,将三个DNN模型级联叠加,将不同下采样率的图像输入MU-Net,如图2所示。
请添加图片描述

首先,尺度为1的DNN模型执行输入图像f和m之间的初始和全局对准。具体地,f & m通过1/4的比例因子下采样,然后输入到第一DNN模型以评估初始TP μ1。随后,将μ1应用于空间Transformer网络(Spatial Transformer Network (STN)),并校正原始感测图像m以产生第一校正感测图像Tμ1(m)。

其次,尺度为2的DNN模型在f和Tμ1(m)之间执行残差对齐。具体而言,f & Tμ1(m)通过1/2的比例因子进行下采样,然后输入到第二个DNN模型以评估残差TP Δμ1,将其积分到μ1以产生第二个TP μ2。并且μ2被施加到STN,并且校正原始感测图像m以产生第二校正感测图像Tμ2(m)

第三,尺度为3的DNN模型还在f和Tμ2(m)之间进行了更详细的比对。具体而言,将f和Tμ2(m)直接输入第三个DNN模型,以评估残余TP Δμ2,将其积分到μ2,以产生最终TP μ3。将μ3应用于STN并校正原始感测图像m以产生最终校正感测图像Tμ3(m),从而实现图像配准。

DNN Architecture on Each Scale

在本节中,我们将介绍每种规模的DNN架构。为了提取深层语义信息并找到端到端TP映射,我们利用通道注意机制和深度残差网络,以形成DNN架构。前者能自适应地调整各通道的权值。后者保证了深层语义信息不会随着网络的深化而减少。

我们将深度残差(Deep Residual (DR))ConvBlock定义为添加残差网络的普通卷积块,而(Squeeze Excitation and Deep Residual)SE-DR ConvBlock是集成了信道注意机制的DR ConvBlock。图3描述了第三个尺度上的DNN架构。输入图像对应该具有相同的大小,如果不具有相同的大小,则通常采用补零或裁剪。两幅图像在通道方向上连接,然后分别通过一系列7×7和一系列5×5的ConvBlock。这两条路径通过上采样和跨步连接连接在一起,然后是几个3×3 ConvBlock。在前向传播过程中,图像尺寸减小,通道加深,有利于提取深层语义信息。在经过最后一个ConvBlock后,深层语义信息通过两个完全连接层直接映射到TP。
在这里插入图片描述
第一和第二尺度上的DNN架构类似于第三尺度上的DNN架构。不同之处在于,输入图像经过了下采样,因此图像的初始尺寸变为128×128像素或256×256像素,而不是512×512像素。因此,我们为每个路由减少了两个SE-DR ConvBlock,同时将通道的最大数量保持在32,这形成了第一尺度上的DNN架构。类似地,我们减少了每个路由的SE-DR ConvBlock,并将通道的最大数量维持在64,这形成了第二尺度上的DNN架构。

Unsupervised Training

在MU-Net中,三个DNN模型以级联方式堆叠,形成从粗到精的配准流水线。因此,训练过程包括初始化和联合训练两部分。

在第一阶段,为了初始化网络权重,每个DNN模型被单独地和连续地训练,以基于图像结构相似性最小化相应的损失:Losssim(f,m,μ1),Losssim(f,m,μ2)和Losssim(f,m,μ3)。第一模型被训练用于粗略对准。在第一模型的权重固定的情况下,连续训练第二模型以微调比对。最后,训练第三模型e以进一步校正对准,同时冻结第一和第二模型的权重。

在第二阶段,所有堆叠DNN模型的权重被解冻以可更新。并且MU-Net中的每个DNN模型被联合训练以在多个尺度上协作地最小化总损失,其被定义为:在这里插入图片描述
支持参考图像与经TP及其空间变换校正的感测图像达到最佳相似度。类似地,支持感测图像以实现与通过逆空间变换包裹的参考图像的最佳相似性。为了提高TPs μ的可靠性,我们对坐标映射Tμ的矩阵求逆:在这里插入图片描述
其中 T μ − 1 Tμ^ {-1} Tμ1表示坐标映射的逆矩阵。因此,相似性损失函数定义为:在这里插入图片描述
对于多模态的RSIR,如光学SAR图像,由于辐射差异,其像素强度不能直接用于相似性评价。考虑到多模态图像之间保留了结构特征,我们使用结构描述子代替强度来计算相似性度量值。对于收敛损失函数,我们主要采用了一种快速和鲁棒的结构描述符,称为定向梯度的信道特征(CFOG)。如图6所示,CFOG首先提取多方向梯度,然后构建方向直方图。基于方向直方图,卷积运算由三维类高斯核执行,该核收集相邻像素的方向梯度。因此,生成了3-D结构特征图。
我们在结构特征图A和B上对Sim(A,B)采用相似性度量NCC。NCC通过搜索最大值的位置来确定两个结构特征图之间的对应关系,其可以计算为:在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/68714.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

彻底搞懂JS原型与原型链

说到JavaScript的原型和原型链,相关文章已有不少,但是大都晦涩难懂。本文将换一个角度出发,先理解原型和原型链是什么,有什么作用,再去分析那些令人头疼的关系。 一、引用类型皆为对象 原型和原型链都是来源于对象而…

浅谈Linux内核编程规范与代码风格

1 缩进 Tab的宽度是八个字符,因此缩进的宽度也是八个字符。有些异教徒想让缩进变成四个字符,甚至是两个字符的宽度,这些人和那些把 PI 定义为 3 的人是一个路子的。 注意:缩进的全部意义在于清晰地定义语句块的开始与结束&#…

《MongoDB》Mongo Shell中的基本操作-删除操作一览

前端博主,热衷各种前端向的骚操作,经常想到哪就写到哪,如果有感兴趣的技术和前端效果可以留言~博主看到后会去代替大家踩坑的~ 主页: oliver尹的主页 格言: 跌倒了爬起来就好~ 来个关注吧,点个赞…

分布式事务,单JVM进程与多数据库,分布式事务技术选型,0-1过程,代码全。

由于很多小白程序员在单一JVM进程配合多数据库的架构环境中,总是考虑一主多从的mysql集群环境。还不知道mysql集群数据库按照表纵向分割以后,也是可以走数据库使用事务的。那么这里使用到的就是分布式事务,XA协议。现在大部分主流的数据库都支持XA协议。这里不用太多废话,直…

【Web智能聊天客服】之JavaScript、jQuery、AJAX讲解及实例(超详细必看 附源码)

觉得有帮助请点赞关注收藏~~~ 一、JavaScript基础 Javascript是网页编程语言&#xff0c;决定网页元素的动作。HTML页面中通过<script></script>指定Javascript内容&#xff0c;通过//或者 /* */执行代码的备注功能&#xff0c;并且区分大小写。 1&#xff1a;变…

《视觉SLAM十四讲》示例程序编译报错处理(上)

高翔博士《视觉SLAM十四讲》这本书中的代码很不错&#xff0c;适合初学者。可惜有一些可能因为版本的问题会报错&#xff0c;本文总结一下我遇到的问题。 在slambook2/3rdparty文件夹git submodule update&#xff0c;这个版本是和书中的版本一致的。但我已经重新安装了新版Ei…

Webpack中的高级特性

自从webpack4以后&#xff0c;官方帮我们集成了很多特性&#xff0c;比如在生产模式下代码压缩自动开启等&#xff0c;这篇文章我们一起来探讨一下webpack给我们提供的高级特性助力开发。 探索webpack的高级特性 特性&#xff1a;treeShaking 顾名思义treeShaking&#xff0…

C++ Reference: Standard C++ Library reference: Containers: deque: deque: swap

C官网参考里链接&#xff1a;https://cplusplus.com/reference/deque/deque/swap-free/ 函数模板 <deque> std::swap (deque) template <class T, class Alloc> void swap (deque<T,Alloc>& x, deque<T,Alloc>& y); 交换两个双端队列容器的…

【ESP32调试-快速入门】

文章目录ESP32调试一. 环境搭建二. 运行OpenOCD1. 烧入blink2. 找到芯片型号对应的脚本文件&#xff0c;并运行脚本命令三. 运行GDBESP32调试 一. 环境搭建 ESP_IDF环境搭建 二. 运行OpenOCD 1. 烧入blink 如&#xff1a;安装环境中的examples中的blink 路劲&#xff1a;安装…

华为机试 - 探索地块建立

目录 题目描述 输入描述 输出描述 用例 题目解析 算法源码 题目描述 给一块n*m的地块&#xff0c;相当于n*m的二维数组&#xff0c;每个元素的值表示这个小地块的发电量&#xff1b; 求在这块地上建立正方形的边长为c的发电站&#xff0c;发电量满足目标电量k的地块数量…

汽车保养app开发,扩充汽车服务市场发展商机

从汽车市场规模来看&#xff0c;从2017年开始始终保持增长的发展趋势&#xff0c;在2021年市场规模达到140877.18亿元。互联网时代发展下&#xff0c;汽车后市场大力推广电子商务&#xff0c;将互联网技术与汽车保养服务相结合是汽车服务行业强大的必由之路。二者的结合可以让消…

centos7下搭建rabbitmq的开发环境

我们在项目开发的时候都不可避免的会有异步化的问题,比较好的解决方案就是使用消息队列,可供选择的队列产品也有很多,比如轻量级的redis, 当然还有重量级的专业产品rabbitmq,rabbitmq好就好在是用erlang(二郎神)开发的,它那天生的OTP并行计算框架,轻而易举的进程间通…

阿里云ssl免费证书申请

目录为什么申请SSL证书SSL证书申请支持的域名类型ssl免费证书申请过程为什么申请SSL证书 由于web服务部署需要使用https安全协议&#xff0c;因此需要申请相应域名的SSL证书用于部署。测试阶段&#xff0c;为节省成本&#xff0c;使用阿里云提供的免费SSL证书。 SSL证书申请支…

在Web服务器(IIS)上安装SSL证书并绑定网站

以windows server 2016为例 一、安装中间证书 1.下载中间证书文件 如果是RSA加密算法类的&#xff0c;下载此处。 如果是ECC加密算法类的&#xff0c;下载此处。 2.安装 双击下载好的文件进行安装&#xff0c;注意&#xff0c;安装过程中&#xff0c;存储位置要设”为本地…

搜题接口系统

搜题接口系统 本平台优点&#xff1a; 多题库查题、独立后台、响应速度快、全网平台可查、功能最全&#xff01; 1.想要给自己的公众号获得查题接口&#xff0c;只需要两步&#xff01; 2.题库&#xff1a; 题库&#xff1a;题库后台&#xff08;点击跳转&#xff09; 题库…

分类预测 | MATLAB实现ELM极限学习机多特征分类预测(二分类)

分类预测 | MATLAB实现ELM极限学习机多特征分类预测(二分类) 目录 分类预测 | MATLAB实现ELM极限学习机多特征分类预测(二分类)效果一览基本介绍程序设计学习总结参考资料效果一览 训练集正确率Accuracy = 89%(445/500) 测试集正确率Accuracy = 86.9565%(60/69) 基本介绍 MATLA…

加载器、反射、xml、DTD、schema、注解、单元测试

一、什么是类加载器 类加载器 类加载器&#xff1a;负责将.class文件&#xff08;存储的物理文件&#xff09;加载在到内存中 类加载的过程 类加载时机 类在什么时候会被加载到内存中呢&#xff1f; 类加载时机 创建类的实例&#xff08;对象&#xff09;调用类的类方法 访问…

微服务自动化【idea插件一键部署】

目录​​​​​​​ 1. Docker结合Idea插件使用 2. 私服搭建 registry 3. 私有仓库的使用 4. idea一键项目部署单独Docker镜像 5. idea一键项目部署Docker标记镜像【私库】 1. Docker结合Idea插件使用 1. 修改Docker服务文件,注释掉"ExecStart"这一行&#x…

火爆的超级人工智能ChatGPT,唯独鄙视中国人

ChatGPT你听说了吗&#xff1f;如果ChatGPT你还没有听说&#xff0c;作为一名程序员&#xff0c;那可能你就out了。使用ChatGPT受阻&#xff0c;为什么不让我们用&#xff1f;它是一款神器&#xff0c;很有意思&#xff0c;当前被大家众星捧月&#xff0c;初次用起来确实很神奇…

微服务框架 SpringCloud微服务架构 22 DSL 查询语法 22.5 相关性算分

微服务框架 【SpringCloudRabbitMQDockerRedis搜索分布式&#xff0c;系统详解springcloud微服务技术栈课程|黑马程序员Java微服务】 SpringCloud微服务架构 文章目录微服务框架SpringCloud微服务架构22 DSL 查询语法22.5 相关性算分22.5.1 复合查询22.5.2 相关性算分22.5.3 …