入选TPAMI2025！傅里叶变换+目标检测新突破！

news2025/4/22 17:02:51

今天给大家推荐一个目标检测，好发不卷的新思路：与傅里叶变换结合！

一方面，不仅能提升检测的准确性和可靠性，还能增强模型的通用性和适应性，灵活应对复杂场景。比如TPAMI25的FSD模型，便通过该方法，性能远超SOTA。CVPR24的SFS-CNet则实现了FLOPs直降75％的效果！主要在于：傅里叶变换能够分析信号的频率成分，将信号从时域转换到频域，从而提取出与目标相关而时域中难以捕捉的特征；且还能可以帮助模型区分信号和噪声在频域中的表现，抑制噪声！

另一方面，傅里叶变化能够与多种深度学习技术（CNN等）结合，方便我们根据目标任务设计模型，可发挥空间很大。且以往该思路用的还不算多！

为让大家能够紧跟前沿，掌握傅里叶变换+目标检测的主流研究思路，我给大家准备了10种创新思路和源码！

论文原文+开源代码需要的同学看文末

论文：Frequency-Guided Spatial Adaptation for Camouflaged Object Detection

内容

该论文提出了一种名为频率引导空间自适应网络（FGSA-Net）的新方法，用于伪装目标检测（COD）任务。该方法通过将预训练视觉基础模型（如Vision Transformer）的特征输入转换到频域，利用频率信息动态增强或减弱不同频率成分，从而自适应调整图像细节和轮廓特征的强度，能够突出有助于区分目标和背景的特征，并间接暗示伪装目标的位置和形状。

论文：Frequency-Spatial Entanglement Learning for Camouflaged Object Detection

内容

该论文提出了一种名为频率-空间纠缠学习（FSEL）的新方法，通过联合探索频率域和空间域的特征表示，引入了一系列精心设计的纠缠变换器模块、一个联合域感知模块、以及一个双域反向解析器，用于在频率和空间域中融合特征。ETB利用频率自注意力机制有效表征不同频率带之间的关系，并通过纠缠学习促进不同域特征之间的信息交互。

论文：Removal then Selection: A Coarse-to-Fine Fusion Perspective for RGB-Infrared Object Detection

内容

该论文提出了一种名为“去除与选择检测器（RSDet）”的新型RGB-红外（IR）目标检测方法，旨在通过一种粗到细的融合策略来提高目标检测的性能。该方法受到人类大脑处理多模态信息机制的启发，设计了两个关键模块：冗余光谱去除（RSR）模块和动态特征选择（DFS）模块。RSR模块通过在频域中过滤掉冗余信息来粗略地去除干扰信息，而DFS模块则通过动态选择不同尺度的特征来精细地融合RGB和IR模态的特征。

论文：Generalizable Fourier Augmentation for Unsupervised Video Object Segmentation

内容

该论文提出了一种名为GFA的方法，用于提高无监督视频目标分割（UVOS）模型在分布外（Out-of-Distribution, OOD）测试样本上的泛化能力。GFA通过高斯采样生成多样化的风格特征来增强训练数据，并采用指数移动平均（EMA）策略在线更新相位特征，以学习跨域不变的特征，从而提高模型的泛化能力。