【配准和融合相互作用,交互】

news2025/1/23 13:04:25

RFNet: Unsupervised Network for Mutually Reinforcing Multi-modal Image Registration and Fusion

(RFNet:一种互增强的多模态图像配准与融合的无监督网络)
本文提出了一种在相互增强的框架RFNet中实现多模态图像配准与融合的新方法。我们以由*coarse-to-fine(粗到精)*的方式处理配准。本文首次将图像融合的反馈信息作为配准精度的提高因素,而不是将二者作为两个独立的问题来处理。精细配准的结果也提高了融合性能。具体地,对于图像配准,我们解决了定义适用于多模态图像的配准度量和促进网络收敛的瓶颈。在coarse、fine两个阶段分别基于图像平移和图像融合定义度量。通过设计的度量和基于可变形卷积的网络来促进收敛。在图像融合方面,我们着重于纹理的保持,这不仅增加了融合结果的信息量和质量,而且改善了融合结果的反馈。通过对全局视差较大的多模态图像、局部失准图像和对准图像的配准和融合实验,验证了该方法的配准和融合性能。

介绍

多模态图像融合的目的是将不同成像模态的信息融合在一起,生成一幅信息丰富、质量高的图像。由于融合后的图像能够通过融合互补信息来全面描述场景,因此图像融合在安防、遥感、临床治疗等领域具有广泛的应用前景。由于多模态图像来自不同的设备/传感器,不可避免地会由于位置、角度等的偏差而产生视差,然而几乎所有的融合方法都没有考虑视差。在融合发生之前,它们需要精确的配准,如图1(a)所示。
请添加图片描述

不幸的是,不同模态之间的多样性对提高配准精度提出了巨大的挑战,仍然导致预配准图像中的减轻的未对准。当配准和融合是分开的问题时,现有的融合方法必须"tolerate"而不是"fight"预配准未对准。因此,多模态图像配准与融合成为图像融合实际应用中迫切需要解决的问题。
同时,在现有的独立分支中,图像融合是配准的下游任务,不能提供反馈以提高配准精度。然而,考虑到融合图像的特性,图像融合可以反向消除未对准。首先,融合图像整合来自两种模态的信息。当融合图像与任一源图像配准时,减轻的模态多样性降低了配准的难度。第二,融合图像中的未对准无疑导致更多但重复的显著结构,即,密集梯度。通过比较,精确配准鼓励梯度的稀疏。因此,融合结果的梯度稀疏性可以作为一个标准,以反馈的方式提高配准精度,而不丢失源图像中的场景信息。第三,融合后的图像保留了单幅图像中明显的显著结构,并在融合过程中丢弃了一些多余和无用的信息。减少了冗余信息对图像配准的负面影响。当图像融合有助于消除未对准时,更精确对准的数据进一步促进融合结果。结果,这两个任务可以以这种方式相互加强,如图1(b)所示。请添加图片描述
具体每个任务的单个解决方案,图像配准和融合有自己的瓶颈。图像配准,难点在于开发适当的配准指标或综合评价方法自适应数据,以及确保设计配准限制应通过梯度下降对深度网络优化是实用的。图像融合的一般目的是使融合图像呈现最多的信息,部分由梯度表示。此外,如上所述,融合图像的梯度在消除未对准中起关键作用。结合这两个方面,融合方法应致力于纹理信息的保留,这既符合融合目标,也符合图像融合对图像配准的反馈作用。
为了解决先前工作的局限性和未探索的问题,我们在一个相互加强的框架中探索多模态图像配准和融合。我们提出了一个无监督网络来实现它,称为RFNet。图1(b)总结了拟定的框架。配准以从coarse-to-fine 的方法进行处理。粗略阶段通过基于图像平移的评估度量来校正全局视差。coarse-registered的结果帮助生成有意义但粗糙的融合图像。图像融合和细登记集成在一个单一的网络。然后,利用融合图像的特征对网络中与变形相关的部分进行优化,以校正局部错位。最后,网络生成fine-registered和融合的图像。

贡献

1)在我们的工作中,多模态图像配准和融合问题是相互加强的。本文首次将图像融合技术应用到多模态图像配准中,通过深度神经网络来提高配准精度。
2)我们着重于设计约束以优化多模态配准性能。在coarse stage,我们应用图像平移来建立图像级评估度量。提出了一种改进的网络体系结构,以帮助网络收敛。在fine stage,基于融合结果设计度量。
3)考虑到图像融合中的纹理保留问题,采用梯度通道注意机制自适应地调整特征的通道贡献。此外,我们还设计了一个带偏置的梯度损耗。网络结构和损失函数均基于纹理丰富度。

相关工作

Multi-modal Image Registration.

传统的配准方法包括基于变换的配准方法和基于测量的配准方法。基于变换的方法将图像变换到一个公共空间,以表现出更好的一致性。他们手动分析多模态特性和设计约束以实现一致性。然而,这些方法中的优化是棘手的。基于测量的相似性度量方法旨在度量对模态变化敏感性较低的相似性。代表性方法利用互信息(mutual information (MI))、区域MI 等,其在计算上是难处理的并且不适合于梯度下降。最近,已经提出了基于深度学习的方法。例如,Wang等人使用网络来创建模态独立特征,而稀疏性的缺点仍然存在。与我们的工作最接近的是,Arar等人学习了跨模态翻译。但是翻译网络和配准网络的协同训练增加了配准网络优化的难度。在我们的工作中,我们发现将同一域中的平移图像馈入网络可以同时提高配准精度和加快收敛速度。此外,与已有的配准网络相比,由于变形卷积是指未配准图像中的变形,因此我们在网络中使用了变形卷积,以获得更高的配准精度和更强的鲁棒性。与我们的工作最相关的是,SIRF证实,如果正确组合,联合配准和融合肯定可以改善结果。然而,这项工作是在传统的矢量全变分模型中实现的,并且是针对具有限制性局部失调的遥感图像而设计的。

Multi-modal Image Fusion.

现有的融合方法是针对对准图像而定制的,而不考虑视差。传统方法关注融合本身,包括六类:基于多尺度变换、稀疏表示、子空间、显著性、混合方法等的方法。他们致力于手工设计分解方式和融合策略,而细致多样的设计使其变得越来越复杂。为了解决这个问题,提出了一些基于深度学习的方法。它们中的一些不注意纹理保持,并且一些基于生成式对抗网络的方法遭受生成虚假和模糊细节的困扰。即使一些方法涉及纹理,它们也根据图像模态而不是特定区域的实际纹理来保留纹理。在此工作中,我们采用了一种基于梯度的注意机制和一种带偏置的梯度丢失来增强纹理保持。此外,网络混合变形,这使得能够基于保留的纹理进行未对准校正。

方法

我们设计了一个无监督的网络,用于相互加强的多模态图像配准和融合,术语为RFNet。整个过程如图2所示,包括两个主要部分。在这里插入图片描述
首先,粗配准模块基于仿射变换模型(affine model)执行全局校正。然后,除了一些局部视差之外,多模态图像被粗略地对准,其中仿射模型不适用。第二,在统一的模块/网络中实现精细配准和融合,称为精细配准和融合模块(F2 M)。

Coarse Registration Module

所提出的粗配准模块的流水线如图3所示。TransNet首先将多模态图像转换到同一域(即,将Ix转化为Ix→y)。AffineNet 以Ix→y和Iy为输入,输出仿射参数,生成Ix的形变场。
请添加图片描述

Image Translation Network

TransNet旨在学习图像平移函数 T y T^y Tyx,其表示通过保留内容信息将域x中的图像Ix平移到域y。因此,我们使用编码器将Ix嵌入到内容空间中,如cx = Ex(Ix),同时去除域信息。为了确保cx包含内容信息,我们通过解码器Dx和Dy将其映射回域,如图4所示。请添加图片描述
期望将cx映射回域x的结果重构Ix,即, I r e c o n I^{recon} Ireconx = T x T^x Tx x(Ix)= Dx(Ex(Ix))。并且到域y的映射结果应该是翻译后的Ix,即,X →Y = T y T^y TyX(X)= Dy(Ex(Ix))。类似地,对于定义域y中的Iy,重建和平移的结果是 I r e c o n I^{recon} Irecony = T y T^y Ty y(Iy)和Iy→x = T x T^x Txy(Iy)。
为了鼓励编码器提取内容信息和解码器恢复域相关信息,将重构损失和转换损失定义为:
在这里插入图片描述
TransNet的最终损失函数总结为Eq.(2)其中超参数η控制权衡:在这里插入图片描述
Network Architecture.
TransNet的网络架构如补充材料所示。我们使用实例规范化而不是批规范化,因为它执行一种样式规范化。为了将不同的域映射到同一个内容空间,除了设计的损失函数之外,编码器中的最后一层和解码器中的第一层的权重是共享的。

Affine Network

仿射网络学习生成相应的仿射变换函数C。当馈入一对未对准的图像Ix→y和Iy时,它输出仿射参数paff = C(Ix→y,Iy)。根据paff,我们在一个规则的采样网格上应用paff,生成一个H × W × 2的变形场Φ。Φ表示Ix→y中所有像素的变形。数学上,变形的Ix→y表示为:
在这里插入图片描述
其中i和j表示像素的位置。Φ的两个通道分别表示垂直和水平方向的偏差。考虑到由于不同的坐标类型而可能存在一些丢失的像素值,应用重采样器S来改进此步骤。
作为描述,综合图像配准的问题被转化为变形翻译之间的相似图像 I C I^C ICx→y和源图像Iy。因此AffineNet损失函数的定义限制他们的相似之处。为便于计算温顺和弱感性照明振幅线性变化,我们使用归一化互相关(NCC)作为相似性度量。登记损失因此定义为:在这里插入图片描述
当获得最佳变形场Φ时,我们对Ix执行相同的空间变换,以根据Eq.(3)中的方式生成粗对准图像 I C I^C ICx
网络架构。AffineNet的网络架构在补充材料中报告。对于图像配准,在两个未配准的图像中,对应对象的区域可能显著移位。考虑到长距离视差,大的核尺寸和深的网络层是宽感受野所必需的以减轻该问题。因此,卷积可变形层应用于取代定期接受领域传统的卷积层。卷积可变形层增加接受字段偏移量,另外从卷积层从之前的特征图谱。因此,它是指在未配准的图像变形更高登记精度和更强的鲁棒性。

Mutually Reinforcing Fine Registration and Fusion Module (F2M)

在第一阶段,F2M实现了以纹理为中心的图像融合,这也是精配准的基础。管道如图5所示。对F2M算法中除变形块外的参数进行了优化。变形块依赖于初始化的参数来生成变形场,变形场自动趋于一致。在这种情况下,If组合 I C I^C ICx和Iy的场景信息,并且在单个图像中渲染它们的视差。损失函数定义为:
请添加图片描述
其中δ控制这两项之间的折衷。Lcontent约束图像级相似度以合并场景内容,其定义为:
请添加图片描述
由于NIR图像通常比RGB图像包含更多的纹理细节,因此γ被设置为0.5和1之间的值。
由于显著结构通常以较大梯度出现,梯度损失Lgradient定义为:
请添加图片描述

在第二个阶段,F2M实现精细配准根据融合图像的特点。在这个阶段,在这一阶段,我们固定在第一阶段优化的融合相关参数,并训练变形块。损失函数考虑以下三个方面。 1)Iy是提供参考纹理信息的固定图像。If保留 I C I^C ICx的变形梯度。正确的变形后,∇Iy和∇lf应该展示高一致性。因此,第一项限制参考信息的一致性。2)容易观察到If中的任何未对准将增加梯度的稀疏性。我们使用第二项来鼓励If的稀疏性,并惩罚应该校正的显著梯度。3)相邻像素应该具有相似的变形,这由变形场的平滑度直观地表示。否则,场景结构将被扭曲。通过引入正则化项,避免变形块产生非光滑的变形场.因此,损失函数包含以下三项:
请添加图片描述

特别是对于Lsmooth,将变形表示为Φf,Φf的一阶梯度反映了变形的突变。此外,为了避免过度平滑,使用双边滤波器来将可变权重分配给不同的一阶变化,定义为:

在这里插入图片描述
其中p是像素在If或Φf中的位置索引。R表示p的邻居的集合。pn表示该集合中的位置索引。α为系数,设为0.5。
当变形块已经被优化时,我们再次完全执行F2M的前向过程,以生成最终的对准和融合图像If
Network Architecture. 如图5所示,我们共享前三层的权重,以确保来自不同模态的特征类型的强度一致性。它避免了一个源图像中的信息相对于另一个源图像的衰减和扩散。否则,衰减和扩散会造成伪梯度稀疏,影响配准性能的提高。
请添加图片描述
由于感受野随深度的增加而增大,较深特征图中的像素对应图像中较大的区域,这不利于提高配准精度。因此,我们使用浅层特征来探测和生成空间变形。第一卷积层的非线性映射消除了 I C I^C ICx和Iy之间的像素强度差。变形块生成变形场。重采样、批量归一化和残差块用于应用于不同的变形。为了保持纹理,我们引入如图5所示的梯度通道注意块。我们聚合绝对梯度,因为它们是特征地图中信息丰富度的更好表示。通过联合使用最大池和平均池操作来聚合信息。然后,将两个分支的结果相加并馈送到两个单独的多层感知器,以生成共享的通道式注意力权重。然后,几个卷积层将特征映射回以生成If

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/59329.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

第八章 集成学习

8.1 个体与集成 集成学习通过构建并结合多个学习器来完成学习任务,有时也被称为多分类系统、基于委员会的学习等。 下图显示出集成学习的一般结构:先产生一组个体学习器,再用某种策略将它们结合起来。个体学习器通常由一个现有的学习算法从训…

Redis实战——分布式锁

目录 1 一人一单并发安全问题 2 分布式锁的原理和实现 2.1 什么是分布式锁? 2.2 分布式锁的实现 1 一人一单并发安全问题 之前一人一单的业务使用的悲观锁,在分布式系统下,是无法生效的。 理想的情况下是这样的:一个线程成功…

计算机中数的表示和运算

定点数 编程时需要确定小数点位置难以表示两个大小相差较大的数存储空间利用率低 这种用二进制来表示十进制的编码方式,叫作BCD 编码(Binary-Coded Decimal)。 浮点数 小数点的位置可以左右移动的数 规格化浮点数: IEEE 754规格化的尾数…

基于Java+Swing+Mysql实现《黄金矿工》游戏

基于JavaSwingMysq实现《黄金矿工》游戏一、系统介绍二、功能展示三、其他系统一、系统介绍 《黄金矿工》游戏是一个经典的抓金子小游戏,它可以锻炼人的反应能力。。该游戏中,可以通过“挖矿”获得积分,游戏道具:有3瓶药水&#…

cubeIDE开发, 如何结合FreeRTOS开发STM32程序

一、STM32CubeIDE使用内置的FreeRTOS 不同于STM32CubeIDE使用像RTThread这些第三方物联网系统,STM32CubeIDE在安装时就已经在MiddleWare中间件一栏直接支持了FreeRTOS操作系统。 既然STM32CubeIDE已经把FreeRTOS深度整合到了自家的系统中,所以移植及使用…

深度学习中的正则化——L1、L2 和 Dropout

正则化是一组技术,可以防止神经网络中的过度拟合,从而在面对来自问题域的全新数据时提高深度学习模型的准确性。 在本文中,我们将介绍最流行的正则化技术,称为 L1、L2 和 dropout。 文章目录1. 回顾:过拟合2.什么是正则…

【并发编程】AQS ReentrantLock 底层实现原理

一、概述 synchronized上锁机制是通过对象头来实现的,通过锁升级的过程来完成加锁。(https://blog.csdn.net/zhangting19921121/article/details/106002751) 但是synchronized锁升级的过程犹如一个黑盒,我们无法掌控。因此&…

常见的损失函数

1. 损失函数、代价函数与目标函数 损失函数(Loss Function):是定义在单个样本上的,是指一个样本的误差。   代价函数(Cost Function):是定义在整个训练集上的,是所有样本误差的平均…

07_openstack之安全组与浮动IP

目录 一、环境准备 二、浮动IP 1、浮动IP介绍 2、创建和分配浮动IP 三、安全组 1、安全组介绍 2、创建安全组 3、给云主机绑定安全组 一、环境准备 部署openstack私有云环境:02_openstack私有云部署_桂安俊kylinOS的博客-CSDN博客 创建项目和用户&#xf…

Mac电脑系统降级至10.15 Catalina(2020末代intel)

目录起因前期准备降级系统步骤&#xff08;联网&#xff09;选定开机阶段需要按的快捷键进入简化的macOS激活锁页面macOS实用工具页面抹除磁盘安装降级系统Catalina关于从U盘重装系统相关参考博客起因 这部分碎碎念可以不看> < 20年7月买mac是为了找工作&#xff0c;找到…

[附源码]计算机毕业设计校园商铺Springboot程序

项目运行 环境配置&#xff1a; Jdk1.8 Tomcat7.0 Mysql HBuilderX&#xff08;Webstorm也行&#xff09; Eclispe&#xff08;IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持&#xff09;。 项目技术&#xff1a; SSM mybatis Maven Vue 等等组成&#xff0c;B/S模式 M…

[附源码]计算机毕业设计药品仓库及预警管理系统Springboot程序

项目运行 环境配置&#xff1a; Jdk1.8 Tomcat7.0 Mysql HBuilderX&#xff08;Webstorm也行&#xff09; Eclispe&#xff08;IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持&#xff09;。 项目技术&#xff1a; SSM mybatis Maven Vue 等等组成&#xff0c;B/S模式 M…

libcef.dll文件丢失怎么办?丢失对电脑有什么影响?

提到电脑中的系统文件可能大家都是不太了解的&#xff0c;毕竟平时使用电脑的时候也接触不到那些复杂的文件&#xff0c;最多大家只会使用电脑上面的各种功能&#xff0c;不过虽然接触不到但是大家也要适当的了解一下&#xff0c;就比如libcef.dll文件丢失了就会造成电脑系统出…

Word2Vec详解

Word2Vec 基本思想&#xff1a;通过训练将每一个词映射成一个固定长度的向量&#xff0c;所有向量构成一个词向量空间&#xff0c;每一个向量&#xff08;单词)可以看作是向量空间中的一个点&#xff0c;意思越相近的单词距离越近。 如何把词转换为向量&#xff1f; 通常情况…

用Python做个学生管理系统,这不简简单单

前言 最近因为疫情&#xff0c;各大高校都开始放假了&#xff0c;要不就是回家上网课 我朋友的老师真有趣&#xff0c;硬是要我朋友做个学生管理系统打包成exe文件发给他&#xff0c;才能回家 这不就找上我来了&#xff0c;我写完就顺便发篇文章咯 准备工作 环境准备 Pyth…

Java基于springboot+vue的保健用品销售购物商城系统 前后端分离

随着人们生活水平的提高&#xff0c;人们对日常的保健工作也越来越重视&#xff0c;如何拥有一个更加健康的体魄成为当下很多人的一个追求&#xff0c;尤其是我国当下人口老龄化验证&#xff0c;老人因为身体机能的下降所以也要经常补充一些蛋白核矿物质。当下的年轻人也因为生…

【Java】ArrayList扩容规则

文章目录初始大小扩容规则总结初始大小 ArrayList的初始大小由你选定的构造函数决定&#xff0c;如果你使用无参构造函数&#xff0c;那么初始大小为0&#xff0c;是一个空数组。 而如果你选用有参数的构造函数&#xff0c;那么初始大小为你输入的大小 因此如果问你ArrayLis…

[附源码]计算机毕业设计基于springboot的4s店车辆管理系统

项目运行 环境配置&#xff1a; Jdk1.8 Tomcat7.0 Mysql HBuilderX&#xff08;Webstorm也行&#xff09; Eclispe&#xff08;IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持&#xff09;。 项目技术&#xff1a; SSM mybatis Maven Vue 等等组成&#xff0c;B/S模式 M…

货架穿梭车控制方案

穿梭车控制系统结构示意图 系统组成结构示意图穿梭车服务端模块 PLC设备输出的控制客户端4个电机动作的开关量信号 共8个开关量信号&#xff0c;PNP电路接口,接线端子Q3.0&#xff5e;Q3.7&#xff1b;每个继电器由两个开关量的值共同作用&#xff0c;其控制表如下&#xff1a…

黑马程序员课程SpringMVC听课笔记

目录 SpringMVC概述 入门案例 使用Servlet技术开发web程序流程 使用SpringMVC技术开发web程序流程 导入pom.xml文件 UserController SpringMvcConfig ServletContainersInitConfig POST请求中文乱码处理 代参数GET请求 请求参数与传递 普通参数&#xff1a;请求参数名…