【读论文】THFuse

news2024/9/30 5:22:46

【读论文】THFuse

  • 介绍
  • 网络架构
    • 多分支CNN特征提取块
    • 基于VIT的全局特征提取快
    • 图像重建块
  • 损失函数
  • 总结
  • 参考

论文: https://www.sciencedirect.com/science/article/abs/pii/S0925231223000437
如有侵权请联系博主

介绍

一篇基于CNN和VIT的关于红外可视图像融合的论文,论文中提出了两分支的CNN提取模块的方法以及常规VIT和跨通道的VIT相结合的方法来提取特征,接下来一起来看看吧。

网络架构

在这里插入图片描述
整体架构如上图所示,还是很简单明了的,大体就可以分为三块,分别是多分支CNN特征提取块,基于VIT的全局特征提取快和图像重建块,接下来我们一个个来看。

多分支CNN特征提取块

在这里插入图片描述

目前来看,虽然基于视觉的tranformer在各项任务中都获得了不错的效果,但是我们仍不能仅仅依靠tranformer来获取信息,CNN提取的局部信息也是十分重要的,因此作者在VIT模块之前仍是添加了一个CNN块。

整体的结构如上图所示,可以看到最开始有一个卷积层,主要的作用就是用来升维,图像数据被升维至16。而后处理后的数据被输入两个分支,分别是细节提取分支结构特征提取分支,依次对应图中的上下两个分支。

细节提取分支采用densenet的结构用来提取细节特征,减少了卷积过程中细节的丢失,这里采用的卷积方式是有padding的卷积即卷积之后图片大小是不会改变的,因此这一分支中没有上采样操作,避免了下采样时特征信息的丢失。

结构提取分支主要用于提取图像的结构信息,而图像的结构信息往往在更小尺度的特征信息中更加可以得以体现,因此该分支进行的卷积不采用padding的方式,并且每次卷积之后,特征信息都会减半。因为该分支输出的特征还是要和细节提取分支的特征进行拼接,因此还是需要对该分支的特征信息进行上采样至与原图同样大小,然后再与细节提取分支的特征进行拼接。

基于VIT的全局特征提取快

在这里插入图片描述
该模块还是很有意思的,首先先对两个分支生成的特征进行卷积操作,然后进入了包含了常规VIT和通道级的VIT的全局特征信息提取块中。我们熟悉的常规的VIT是先将图片划分为一个个的patch,然后每一个patch拉伸为一个向量,这些向量之间执行transformer中的操作。

而通道级的VIT则是在图像的通道间执行transformer中的操作,从而使得每一个通道中都包含其余通道中的信息

图像重建块

在这里插入图片描述
图像重建快看着有点长,其实很简单,就是将之前提取的特征一步步进行降维,最终降维至1时,就是融合图像了。

损失函数

论文中使用的损失函数可以分为两部分,第一部分就是像素级的损失,另一方面就是特征级别的损失,总体损失函数如下图所示。
在这里插入图片描述
这里先来看下像素级的损失,该损失共有三部份组成,分别用来保证目标强度信息,结构损失以及纹理信息的损失。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

强度损失和结构损失如上,就不过多描述了,是我们熟悉的公式,主要是纹理信息这里
在这里插入图片描述
这里做了一个很有趣的处理,从这看的话我觉得是有点迷迷糊糊的,但是我们可以把这个公式拆一下
把第一部分拆开
在这里插入图片描述
然后再稍稍换换位置
在这里插入图片描述
这时公式就变成了融合图像和原图像同一点上下两像素之间差值的比较,而我们知道图像中的梯度就是通过相邻像素值的差别来表述的,那我们就明白了,这个损失函数希望融合图像和原图像之间的梯度尽可能的相似,也就实现了保留梯度信息的目的。第二部分与这里同理。

作者这里也提到了该损失函数的另一作用,即抑制噪声,而我们清楚的知道出现噪声时梯度会出现明显的变化,即当融合图像中出现了原图像中本不存在的噪声,那么也会产生原图像中不存在的梯度,前面我们已经提到了该损失函数的作用就是使得融合图像和原图像之间的梯度尽可能的相似,那么从某种意义上来说也是抑制了噪声的出现。

接下来就是特征级别得损失,这一部分类似于AttentionFGAN提出的方法,这里作者采用预先训练好的VGG19来提取融合图像的特征,如下图,绿色线代表的是可视图像中的特征,红色的线代表的是融合图像中的特征,蓝色的线代表的是红外图像中的特征,作者认为纹理信息在浅层中比较突出,因此采用可视图像和融合图像中浅层特征去比较来突出纹理信息并且作者认为深层信息中的目标信息比较突出,因此采用可视图像和融合图像中深层特征来去比较来突出纹理信息。
在这里插入图片描述
特征损失函数如下
在这里插入图片描述

总结

整篇文章读下来很顺畅,有以下几个点我觉得很惊艳

  • 采用了两个分支的CNN,用于提取结构信息和细节信息
  • 首先就是用于通道级transformer
  • 采用vgg19来重新获取融合图像和原图像特征来进行比对,从而使得融合图像中有更多的信息

读完了之后,收获很多,涨了很多新知识。

其他融合图像论文解读
==》读论文专栏,快来点我呀《==

【读论文】DIVFusion: Darkness-free infrared and visible image fusion

【读论文】RFN-Nest: An end-to-end residual fusion network for infrared and visible images

【读论文】DDcGAN

【读论文】Self-supervised feature adaption for infrared and visible image fusion

【读论文】FusionGAN: A generative adversarial network for infrared and visible image fusion

【读论文】DeepFuse: A Deep Unsupervised Approach for Exposure Fusion with Extreme Exposure Image Pairs

【读论文】DenseFuse: A Fusion Approach to Infrared and Visible Images

参考

[1] THFuse: An infrared and visible image fusion network using transformer and hybrid feature extractor

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/381078.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【wpf】ItemsControl 的Binding 小技巧

ItemsControl 非常常用和好用的控件,我经常将之用于配置界面! 比如这么一个配置界面: 整体是一个ItemsControl,每个子界面就是其中的一个Item。 ItemsControl 的 ItemsSource 绑定到 ParameterInfo 的集合 public ObservableCo…

最简单的微信多开防撤回方式

微信,大家工作中生活中用的最多的一款应用;很多公司喜欢用微信来作为工作沟通的工具,官方原版只支持登陆一个微信,这对于需要在电脑上登陆多个微信账号的朋友来说肯定是极其的不方便。另外有的时候别人撤回了一些重要消息&#xf…

目前医疗器械数据库有哪些?最推荐哪些?

在英特网发达的今天,医疗器械信息查询应该是一件便捷的事情,但不知道大家有没有遇到过这种类似情况,就是在查询医疗器械信息时,如果通过百度去检索,查到的结果往往会不尽人意,比如信息陈旧、太分散、来源不…

Spring security 个人理解

改文章写的很好:https://zhuanlan.zhihu.com/p/342755411 Spring security 分为两个部分 登陆认证权限认证 登陆认证 其实就是就是登陆注册,然后获取登陆凭证的问题 操作如下 登陆账号密码,通过账号查询出用户数据,然后密码进…

如何使用DeadFinder寻找失效链接

关于DeadFinder DeadFinder是一款功能强大的链接分析工具,该工具可以帮助广大研究人员快速地寻找目标页面中的无效链接(死链)。所谓死链,即一个页面中存在的无法被连接的一条链接。这些链接如果一直保留在页面中的话,…

Hive中的高阶函数(二)

1、UDTF之explode函数 explode(array)将array列表里的每个元素生成一行; explode(map)将map里的每一对元素作为一行,其中key为一列,value为一列; 一般情况下,explode函数可以直接使用即可,也可以根据需要结…

[python入门(53)] - python中的OS模块(包) - 2

目录 ❤ OS模块和path模块(函数) ❤ os模块中操作目录以及文件的函数 ❤ os模块中遍历目录数 ❤ 一些表现形式参数 ❤ 获取在进程的控制终端上登录的用户的名称: os.getlogin() (即此时pc登录的用户名) ❤ 总结 ❤ os.listdir()…

3月4日线下讲座《项目经理五项管理锦囊》

在项目管理过程中,你是否有过因为人际关系紧张,而导致团队协作不顺畅? 项目团队内耗严重,成员之间缺乏信任冲突较多,影响士气项目质量及项目周期等问题? 为什么会导致这样的结果?如何避免踩坑&a…

TAS5411QPWPRQ1引脚图LP873220RHDRQ1汽车应用开关稳压器

8W单声道汽车类D类音频放大器:TAS5411QPWPRQ1引脚图 【概述】TAS5411-Q1是一款单声道D类音频放大器,非常适用于汽车类紧急呼叫(eCall)、远程信息处理、仪表板应用。该器件采用14.4VDC汽车电池供电,可在负载为4Ω且THDN不超过10%的情况下提供高…

MQTT的学习之Mosquitto集群搭建

文章钢要: 1、进行双服务器搭建 2、进行多服务器搭建 一、Mosquitto的分布式集群部署 如果需要做并发量很大的时候就需要考虑做集群处理,但是我在查找资料的时候发现并不多,所以整理了一下,搭建简单的Mosquitto集群模式。 首…

Win11搜索栏无法使用怎么办?

随着Windows 11的正式发布,许多用户已经升级了他们的操作系统。但是安装Win11系统之后,人们发现它有一些问题。例如,Win11搜索栏无法使用,这极大地影响了用户体验。那我们该如何解决Windows搜索栏用不了这一问题?方法1…

Matplotlib精品学习笔记002-Pyplot详解,快速绘图

Matplotlib精品学习笔记002-Pyplot详解, matplotlib.pyplot集合了一系列功能,运行起来和MATLAB相似。 每个pyplot功能都会对画布(figure)进行修改:包括创建画布,在画布上创建一个画图区,向画图…

【JVM】垃圾回收器

垃圾回收器 Serial收集器 单线程,进行垃圾收集工作时必须暂停其他所有的工作线程。STW造成了不好的用户体验。 新生代采用复制算法,老年代采用标记整理算法。 Serial Old Serial 收集器的老年代版本,它同样是一个单线程收集器。它主要有两…

FairGuard-Windows加固工具版本更新日志

FairGuard-Windows加固工具1.2.2版本更新日志: ■ 增加Unity Resources资源加密的支持; ■ 增加单独Assetbundle资源加密,并同时支持压缩包和文件夹作为输入的方式; ■ 增加对游戏原文件夹加固的支持; Windows加固方案介绍 FairGuard专为游戏量身定…

IntelliJ IDEA 安装JRebel实现热部署详细版(亲测有效)

简介 JRebel可快速实现热部署,节省了大量重启时间,提高了个人开发效率。 JRebel是一款JVM插件,它使得Java代码修改后不用重启系统,立即生效。 安装JRebel 1.file–>setting–>plugins–>在Marketplace的搜索框输入JRe…

【记录问题】RuntimeError:working outside of application context. Flask使用SQLAlchemy数据库

前提:Flask使用SQLAlchemy数据库 本质:依赖包版本不匹配 问题1:报错RuntimeError:working outside of application context. 运行程序报错,如下错误: 原因:flask-sqlalchemy 版本过高导致&am…

试题 算法训练 自行车停放

问题描述 有n辆自行车依次来到停车棚,除了第一辆自行车外,每辆自行车都会恰好停放在已经在停车棚里的某辆自行车的左边或右边。(e.g.停车棚里已经有3辆自行车,从左到右编号为:3,5,1。现在编号为2的第4辆自行车要停在5号自行车的左…

python自学之《21天学通Python》(16)——第19章 用Pillow库处理图片

Pillow是Python2.X时代比较流行的Python ImagingLibrary(简称Pillow)图像处理库的分支,并修复了一些bug。Pillow提供了对Python3的支持,为Python3解释器提供了图像处理的功能。和Pillow库一样提供了广泛的文件格式支持、高效的内部…

IDEA如何创建一个springboot项目

要想进入springboot的殿堂,你的跨进springboot的门槛,下面就是使用IDEA初始话一个简单的springboot项目。 选择Create New Project 选择Spring Initializer——>选择对应的jdk版本——>Default默认在线构建,需要联网噢 选择自己想写…

2005-2019年我国地级市国内外旅游人数和收入数据

旅游产业的发展情况是一个城市经济和文化影响力的重要指标,我们在很多研究中都会用到旅游相关的数据,之前我们介绍过1978-2020年的中国旅游统计年鉴和2022年13604条的全国A级景区数据(可以查看之前推送的文章)。 本次我们为大家介…