DAF-Net：一种基于域自适应的双分支特征分解融合网络用于红外和可见光图像融合

news2025/7/8 7:33:12

论文 DAF-Net: A Dual-Branch Feature Decomposition Fusion Network with Domain Adaptive for Infrared and Visible Image Fusion 提出了一种新的红外和可见光图像融合方法。该方法旨在结合红外图像和可见光图像的互补信息，以提供更全面的场景理解。红外图像在低光和复杂环境中擅长捕捉热辐射，而可见光图像则保留了丰富的细节和颜色。然而，红外与可见光图像在成像原理、分辨率和光谱响应上的显著差异，给融合过程中保留关键信息带来了挑战。为了解决这些问题，本文提出了一种双分支特征分解融合网络（DAF-Net），并引入了域自适应技术，以实现不同模态间的特征对齐。

I. 引言

红外和可见光图像融合旨在结合红外和可见光两种模态的互补信息，以实现更全面的环境感知。红外图像在夜间监控和目标检测等低光环境下表现优异，而可见光图像保留了丰富的细节和色彩。这两种模态的融合能够弥补各自的局限性，从而提供更完整的环境理解。然而，由于成像原理、分辨率和光谱响应的差异，保持关键信息的一致性成为一个主要挑战。

现有的图像融合方法大致分为三类：

传统方法：如像素级或特征级融合方法，这些方法通过简单的规则进行融合，计算效率高，易于实现，但无法充分利用红外和可见光图像的互补信息，导致融合效果有限。
变换域方法：如小波变换和拉普拉斯金字塔技术，这些方法通过将图像分解为不同的频率成分来保留细节，但在重建过程中可能丢失关键的模态特定特征，难以同时保留全局结构和细节纹理。
基于深度学习的方法：近年来，深度学习方法取得了显著进展，如卷积神经网络（CNN）和生成对抗网络（GAN）。这些方法能够通过学习模态间的非线性关系，生成视觉质量更高的融合图像。然而，深度学习方法通常需要大量标注数据，这在数据稀缺时成为限制因素。此外，在保持全局结构和细节纹理方面仍然存在挑战。

II. 方法

为了更好地对齐红外和可见光图像的潜在特征空间，本文提出了一种域自适应的双分支特征分解融合网络（DAF-Net）。该方法通过引入多核最大均值差异（MK-MMD）来减少红外和可见光图像之间的分布差异，从而提高融合图像的质量。DAF-Net的基础编码器基于Restormer网络，负责捕捉全局结构信息；细节编码器基于可逆神经网络（INN），负责提取细节纹理信息。MK-MMD仅在基础编码器中应用，以确保全局特征的一致性，避免局部细节的过度对齐和模态特定信息的丢失。该结构使得DAF-Net能够在全局结构和细节保留之间取得平衡。