【论文阅读】MRFS: Mutually Reinforcing Image Fusion and Segmentation(CVPR2024)

news2024/10/2 12:36:50

MRFS: Mutually Reinforcing Image Fusion and Segmentation(CVPR2024)

背景和动机

1.特征中和缺点和低光信息丢失。

红外和可见光图像通常在强度和梯度分布方面表现出显着差异。在这种情况下,传统的固定比例的无监督损失可能会削弱有价值的特征,例如对比度,如图 2 所示。一个潜在的解决方案是在优化过程中动态优先考虑源图像中的优质特征,确保保留显着的对比度和纹理。此外,在照明条件不佳的情况下,低强度的可见图像往往会掩盖有价值的细节。在融合过程中,这些细节常常被忽视和丢弃,导致关键信息的丢失,如图2所示。从低强度区域中挖掘出更多细节将有效提高融合图像的整体质量。

2.特征有效性得分不匹配。

在传统的基于池化的注意力中,特定特征的得分通常是使用相应通道或空间位置中所有特征的统计数据来确定的。平均池化和最大池化等主流统计操作计算特定维度中特征的平均和最大响应。然而,平均池化可能会错误地将低分分配给同一空间位置或通道中被负特征包围的正特征,如图 3 (a) 所示。类似地,平均池化和最大池化都可能错误地将高分分配给被正特征包围的负特征,如图 3 (b) 所示。引入一种校正机制,通过评估每个特征对其他特征的影响来重新分配分数,这是非常可取的。

3.特征聚合不足。

在特征融合过程中,许多方法使用交叉注意力进行相互查询和嵌入,增强信息互补性[39, 51]。然而,仅仅依靠跨模态互补性是不够的,因为它没有充分利用自己的模态信息,如图4所示。在特征提取过程中引入自注意力部分解决了这个问题。然而,它并不是专门为特征融合而设计的,因此缺乏与交叉注意力的最佳兼容性。因此,在特征融合中同时考虑单模态自我强化和跨模态互补性是有益的。它们自然地创建了一个闭环,增强了聚合特征的表现力。

4.视觉和语义之间的内在一致性。

对于图像融合等低级视觉任务,人类优先考虑视觉相关特征进行感知,而在语义分割等高级任务中,机器专注于语义相关特征以进行准确决策。这就提出了一个有趣的哲学问题:机器和人类以相似的方式感知世界吗?换句话说,人类视觉所依赖的特征和机器语义所依赖特征之间是否存在一致性?可视化 SegMiF  和 EAEFNet 中用于图像融合和分割的通道特征,揭示了很强的相关性,如图 5 所示。这一观察引导我们探索视觉和语义之间的内在一致性,建立相互的关系。两项任务的强化机制。

研究方法

整体框架

 

MRFS 通过提出的 IGM-att 和 PC-Att 实现特征交互,将图像融合和语义分割任务优雅地耦合到一个统一的框架中。在图 6 中说明了总体框架。可以看出,MRFS通过n个块不断提取和细化多模态特征。

我们设计了一个 IGM-Att 模块来促进 Φvi n 和 Φir n 之间的交互。该模块采用 CNN 范式来主要强调与视觉相关的局部特征。此外,它还采用了门控机制,旨在纠正传统的基于池的注意力中的误判。

PC-Att的开发是为了进一步促进多模态特征的交互和聚合。与 IGM-Att 相比,PC-Att 更加强调需要全局理解的语义相关特征。由于综合考虑单模态自强化和跨模态相互补充,聚合特征Ωfn包含了描述场景的完整信息。

IGMAtt 的输出和源图像被送入图像融合头 F 生成融合图像。融合头采用CNN架构,融合显着信息整合和弱化信息恢复功能,从而有效增强融合图像的视觉质量。

将 PC-Att 的输出输入基于 MLP 的语义分割头 G 以获得像素级分类决策。通过图像融合和语义分割的协同优化,可以相互促进地提高它们的性能。

IGM-Att

 

IGM-Att 模块将门控机制集成到传统的基于池的注意力中以实现视觉完成,如图 7 所示。

首先,它采用传统的通道和空间注意力[33]来建模特征之间的正相关关系。

这种基于池化的注意力可能会导致特征有效性分数不匹配。为了解决这个问题,我们引入了门控机制来纠正获得的混合权重:

这种复杂的策略提高了特征重要性评估的精度,增强了有价值的特征并有效抑制了冗余特征。最后,我们使用获得的权重来细化视觉补全的特征:

PC-Att

IGM-Att 模块利用基于 CNN 的注意力,强调局部视觉特征的细化。相比之下,语义分割需要全局场景理解能力。因此,我们开发了一个用于细化语义补全的PCAtt模块,如图8所示。在PC-Att模块中,我们采用两种信息强化策略,即单模态自我强化和跨模态相互补充。该过程将红外和可见光图像中的长距离完整语义信息无缝集成到生成的融合特征中。

任务头

图像融合头。在图像融合头中采用了 CNN 架构,因为它在低级视觉任务中表现出了有效性,可以生成视觉上令人满意的图像 [15, 20]。最初,我们将弱化信息恢复的功能集成到其中。具体来说,我们应用常见的数据增强策略(例如伽玛变换、对比度拉伸)来处理 Ivi、Iir,创建正样本 f Ivi、f Iir。这些样本可以恢复由于弱反射光和低对比度而丢失的信息,为优化锚点(即融合图像 If )提供有价值的指导。其次,我们介绍了显着信息集成的功能以保留关键特征。具体来说,应用最大函数在梯度域和强度域中处理正样本,构建明确的优化目标。然后引导锚点来实现这一目标,确保保留显着的对比度和丰富的纹理。损失函数定义为:

语义分割头。

我们采用 SegFormer [34] 的 MLP 解码器作为语义分割头,因为它简单、轻量,并且可以有效理解全局场景语义。传统的交叉熵损失用于约束语义分段。

实验结果

语义分割

图像融合

消融实验

模型一:用比例策略取代显着信息整合(损失函数);模型二:省略弱化信息恢复(数据增强);模型III:用传统的基于池化的注意力替代IGM-Att ;模型IV:用基于交叉注意力的特征集成取代PC-Att; V型:去掉图像融合头;模型VI:消除语义分割头

IGM-Att 和 PC-Att 的应用增益

复杂度讨论

通过对象检测进行语义验证

结论

这项工作提出了一种用于红外和可见光图像融合和语义分割的耦合学习框架。利用视觉和语义之间的内在一致性,使这些任务相互促进,实现双重提升。首先,将弱化信息恢复和显着信息集成纳入图像融合任务,确保融合结果与人类感知一致。其次,IGM-Att 和 PC-Att 模块解决了特征有效性分数不匹配的挑战,并增强了特征聚合的充分性。级联这些模块有助于视觉相关和语义相关特征的隐式融合,从而实现学习过程中的相互指导并改进解决方案。对公共数据集的大量实验表明,我们的 MRFS 实现了视觉满意度和决策准确性。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2184414.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

NASA:ATLAS/ICESat-2 L3B 每日和每月网格极地海面高度异常 V003

目录 简介 摘要 代码 引用 网址推荐 0代码在线构建地图应用 机器学习 ATLAS/ICESat-2 L3B Daily and Monthly Gridded Polar Sea Surface Height Anomaly V003 ATLAS/ICESat-2 L3B 每日和每月网格极地海面高度异常 V003 简介 ATLAS/ICESat-2 L3B Daily and Monthly G…

Gamisodes在Sui上推出动画版《神探加杰特》

没错,大家喜爱的卡通角色《神探加杰特》将以全新可玩形式登陆Sui区块链,这要归功于Gamisodes。通过其独特技术,Gamisodes正将《神探加杰特》重新制作为互动式剧集,并在Sui上重现这一经典系列。 Gamisodes平台推出了真正互动的《神…

高精度四则运算专题

高精度X高精度加法、减法、乘法 高精度X普通精度 乘法 高精度X普通精度 除法 目录 高精度X高精度 加法 题目 要点 代码 高精度X高精度 减法 题目 要点 代码 高精度X普通精度 乘法 题目 要点 代码 高精度X高精度 乘法 要点 代码 高精度X普通精度 除法 题目 要点 代…

GESP C++四级样题卷

(满分:100 分 考试时间:90 分钟) PDF试卷及答案回复:GESPC20234 一、单选题(每题 2 分,共 30 分) 1.在 C中,指针变量的大小(单位:字节)是&#…

计算机网络-系分(5)

目录 计算机网络 DNS解析 DHCP动态主机配置协议 网络规划与设计 层次化网络设计 网络冗余设计 综合布线系统 1. 双栈技术 2. 隧道技术 3. 协议转换技术 其他网络技术 DAS(Direct Attached Storage,直连存储) NAS(Net…

《Windows PE》3.2.4节表

节表由多个节表项(IMAGE_SECTION_ HEADER)组成,每个节表项(40个字节)记录了 PE中与某个特定的节有关的信息,如节的属性、节 的大小、在文件和内存中的起始位置等。节表中节的数量由字段IMAGE_FILE_HEADER. …

vulnhub-Matrix 1靶机

vulnhub:https://www.vulnhub.com/entry/matrix-1,259/ 导入靶机,扫描IP 靶机在192.168.81.6,扫描端口 存在三个端口,有两个都是http服务,访问 80端口的网页没什么信息,31337的网页元素里有注释 ZWNobyAi…

Raft 协议解读:简化分布式一致性

文章目录 1. 分布式系统与一致性问题1.1 什么是分布式系统1.2 一致性在分布式系统中的重要性1.3 分布式一致性挑战1.4 现有一致性协议1.5 Raft 的设计目标 2. Raft 协议的背景与介绍2.1 Raft 协议的诞生背景2.2 什么是 Raft2.3 Raft 解决的一致性问题2.4 Raft 的设计原则2.5 Pa…

Oracle 数据库安装及配置

✅作者简介:2022年博客新星 第八。热爱国学的Java后端开发者,修心和技术同步精进。 🍎个人主页:Java Fans的博客 🍊个人信条:不迁怒,不贰过。小知识,大智慧。 💞当前专栏…

PCL MLS上采样(基于法向量)

目录 一、概述 1.1原理 1.2实现步骤 1.3应用场景 二、代码实现 2.1关键函数 2.1.1 可视化原始点云和上采样后的点云 2.1.2 MLS 上采样 2.2完整代码 三、实现效果 PCL点云算法汇总及实战案例汇总的目录地址链接: PCL点云算法与项目实战案例汇总&#xff0…

Redis-预热雪崩击穿穿透

预热雪崩穿透击穿 缓存预热 缓存雪崩 有这两种原因 redis key 永不过期or过期时间错开redis 缓存集群实现高可用 主从哨兵Redis Cluster开启redis持久化aof,rdb,尽快恢复集群 多缓存结合预防雪崩:本地缓存 ehcache redis 缓存服务降级&…

iPhone/iPad技巧:如何解锁锁定的 iPhone 或 iPad

“在我更新 iPhone 上的软件后,最近我遇到了iPhone 被锁定到所有者的消息,该如何解决?” 根据我们的研究,许多用户在 iOS 18 更新或恢复出厂设置后都会遇到同样的问题。只要出现问题,您就无法使用 iPhone 或 第 1 部分…

jenkins微服务

如果vim进去某个文件里,可以按键盘的向下键查阅其它部分 记得每天备份虚拟机的项目 一.在linux安装jenkins 1.上传文件 我们采用安装包的方式安装。 先用SShclient在/usr/local/下创建jenkins文件夹,然后向其中导入两个包 2.安装jenkins 再在控制…

「STL::queue」标准库适配器:priority_queue(优先队列)介绍|自定义比较运算(C++)

目录 概述 创建销毁 内部理解 构造析构 自定义比较 赋值重构 数据访问 内存管理 数据控制 Tips 概述 priority_queue 是一种C标准模板库STL中定义的一种序列容器,它允许你在运行时动态地进行堆操作。 priority_queue 可以自动管理内存,这意味…

使用阿里云试用资源快速部署web应用-dofaker为例

本文介绍使用阿里云的试用资源部署dofaker的方法,本教程主要作学习在阿里云部署web应用之用,部署好应用之后,可以在任何地点通过公网ip访问web应用。 一、创建云主机 登录阿里云账户之后,点击控制台: 点击云服务器EC…

基于SSM的大学生心理素质测评及咨询平台系统设计与实现(源码+定制+讲解)

博主介绍: ✌我是阿龙,一名专注于Java技术领域的程序员,全网拥有10W粉丝。作为CSDN特邀作者、博客专家、新星计划导师,我在计算机毕业设计开发方面积累了丰富的经验。同时,我也是掘金、华为云、阿里云、InfoQ等平台…

vscode中配置python虚拟环境

python虚拟环境作用 Python虚拟环境允许你为每个独立的项目创建一个隔离的环境,这样每个项目都可以拥有自己的一套Python安装包和依赖,不会互相影响。实际使用中,可以在vscode或pycharm中使用虚拟环境。 1.创建虚拟环境的方法: …

天呐!关于PyCharm你竟然一无所知?

PyCharm 是一种专为 Python 开发而设计的集成开发环境(IDE),由 JetBrains 开发。 以下是 PyCharm 的一些主要特点和常见的使用方法: 特点: 智能代码编辑:具有智能代码补全、语法检查、代码重构等功能&…

HISTCITE分析进阶

不可否认histcite是一个很好的文献分析的工具,他能很好的找到最重要的那几篇文章,同时也能找到研究的发文趋势、研究机构和著名的研究学者等。但是它是一个很老的软件,因而很多东西都没能跟上下载的分析。我在使用过程中,尝试做一些改变使其更好用,同时也做一些记录。 1.…

ROS学习笔记(三):VSCode集成开发环境快速安装,以及常用扩展插件配置

文章目录 前言VSCode集成开发环境1 安装VSCode2 VSCode扩展插件2.1 VSCode扩展插件模块介绍2.1 常用扩展插件配置一、语言支持类插件二、智能辅助类插件三、科学计算与数据分析类插件四、ROS开发相关插件 3 总结相关链接 前言 关于Ubuntu与ROS的常规安装,可以看这几…