遥感领域的小目标检测一直是个具有挑战性和趣味性的研究方向,同时也是顶会顶刊的常客。但不得不说,今年关于遥感小目标检测的研究热情尤其高涨,已经出现了很多非常优秀的成果。
比如SuperYOLO方法,通过融合多模态数据并执行高分辨率的目标检测,在大幅提高遥感图像中小目标的检测准确性和速度的同时,参数减少了18倍。
再比如结合顶流Mamba和YOLOv9的SOAR,在精度和效率方面都达到了SOTA,性能直接起飞,实力证明遥感小目标检测广泛的应用潜力和高精度的检测能力。
不过由于它的复杂性,遥感小目标检测还是有很多问题没有解决,但这也意味着还有不少创新空间等我们挖掘。为了方便大家找idea,我这边整理了9篇最新的遥感小目标检测论文,基本都有代码,强烈建议想发顶会的同学研读。
论文原文+开源代码需要的同学看文末
SuperYOLO: Super resolution assisted object detection in multimodal remote sensing imagery
方法:本文提出了一种名为SuperYOLO的准确且快速的遥感图像目标检测方法,通过融合多模态数据并利用辅助超分辨率学习实现对多尺度小目标的高分辨率检测,同时考虑检测准确性和计算成本,取得了优于现有模型的性能表现,具有较低的参数大小和计算代价。
创新点:
-
通过引入一个简单而灵活的超分辨率(SR)分支,实现高分辨率(HR)特征表示的学习,从而能够在仅有低分辨率(LR)输入的情况下,轻松识别广阔背景中的小物体。
-
提出了一种计算友好的像素级融合方法,以对称且紧凑的方式双向组合内部信息。与特征级融合相比,它在减少计算成本的同时不会损失准确性。
SOAR: Advancements in Small Body Object Detection for Aerial Imagery Using State Space Models and Programmable Gradients
方法:论文主要研究了在航空图像中小目标的检测,采用了SAHI框架结合YOLO v9和Vision Mamba模型,以及双向状态空间模型,有效解决了小目标被背景噪声遮挡的挑战,提高了检测精度和计算效率。
创新点:
-
了在轻量级YOLO v9架构上使用SAHI框架,该框架利用可编程梯度信息来减少在顺序特征提取过程中通常遇到的巨大信息损失。
-
采用了Vision Mamba模型,并结合了新颖的双向SSM进行有效的视觉上下文建模。这种模型结合了CNN的线性复杂度和Transformers的全局感受野,特别适用于遥感图像分类。
LR-FPN: Enhancing Remote Sensing Object Detection with Location Refined Feature Pyramid Network
方法:论文引入了一种新颖的位置细化特征金字塔网络(LR-FPN),增强了浅层位置信息的提取,并促进了细粒度上下文交互。LR-FPN通过浅层位置信息提取模块(SPIEM)和上下文交互模块(CIM),有效地利用了稳健的位置信息。
创新点:
-
介绍了一种插拔式的位置精化特征金字塔网络(LR-FPN),以增强浅层位置信息的提取,并促进细粒度的上下文交互。
-
引入了一个上下文交互模块(CIM),用于有效地处理空间和通道信息的交互。通过使用深度卷积和空洞深度卷积进行通道内的本地空间信息交互,并通过空洞深度卷积来处理非局部空间交互的挑战,有效地扩大了感受野并增强了空间信息的非局部交互。
HCF-Net: Hierarchical Context Fusion Network for Infrared Small Object Detection
方法:论文提出了一种名为HCF-Net的深度学习方法,通过多个实用模块显著提高了红外小目标检测性能。该方法包括并行化的自适应注意力模块(PPA)、维度感知选择融合模块(DASI)和多膨胀通道细化模块(MDCR)。
创新点:
-
提出了HCF-Net,这是一种从头开始训练的、层次化的上下文融合网络,用于红外小目标检测。通过多个实用模块,HCF-Net显著提高了红外小目标检测性能。
-
HCF-Net中的模块包括并行化的区域感知注意力模块(PPA)、维度感知的选择性融合模块(DASI)和多倍扩张通道细化器模块(MDCR)。这些模块通过不同的策略和技术选择,有效地解决了红外小目标检测中的困难和挑战。
关注下方《学姐带你玩AI》🚀🚀🚀
回复“遥感小目标”获取全部论文+开源代码
码字不易,欢迎大家点赞评论收藏