【CVPR红外小目标检测】红外小目标检测中的非对称上下文调制(ACM)

news2024/11/19 19:42:34

论文题目:
Asymmetric Contextual Modulation for Infrared Small Target Detection 红外小目标检测中的非对称上下文调制

红外小目标数据集

  • 目标个数分布:约90%图片中只有一个目标,约10%图片有多个目标(在稀疏/显著的方法中,可能会因全局独特的假设而被忽略)
  • 目标面积分布:约55%的目标面积占比在0.02%之内(即300300的图片中,目标像素为33)
  • 目标亮度分布:仅有35%的目标亮度是全图最亮。考虑到65%的目标具有与背景非常相似甚至更暗的亮度。

数据集:链接:https://pan.baidu.com/s/1dwLWwtlQcETiKU_4deJvUA?pwd=zwzs
    提取码:zwzs

文章目录

      • 红外小目标数据集
      • 1摘要
      • 2介绍
        • 问题:
        • 贡献:
      • 3 SIRST
      • 4 不对称的上下文调制
        • 4.1 Rethinking自上而下的注意力调节
        • 4.2 自下而上逐点注意调制
        • 4.3 非对称上下文调制模块
        • 4.4 FPN和U-Net
      • 5 实验
        • 5.1 消融实验

1摘要

首先贡献了一个具有高质量注释的开放数据集。提出了一种非对称上下文调制模块,专门用于检测红外小目标。

2介绍

问题:

1、缺乏公共数据集:深度学习需要数据。
2、最小的内在信息:SPIE将红外小目标定义为256×256图像的总空间范围小于80像素(9×9)。纹理或形状特征的缺乏使得纯粹以目标为中心的表示不足以进行可靠的检测。特别是在深度网络中,小目标很容易被复杂的环境淹没。
3、分辨率和语义学之间的矛盾:红外小目标往往淹没在复杂背景中,信杂比较低。对于网络来说,检测这些虚警较低的暗目标既需要对整个红外图像的高级语义理解,也需要精细分辨率的预测图,这是深度网络的内在矛盾,因为它们通过逐渐减弱特征大小来学习更多的语义表示。

贡献:

  提出了一种非对称上下文调制(ACM)机制,这是一种可以集成到多个主机网络中的插件模块。该方法补充了最先进自上而上的高级语义反馈路径,采用反向自下而上的上下文调制路径,将较小尺度的视觉细节编码到更深的层次,我们认为这是为红外小目标实现更好的性能的关键因素。
  这种高级和低级特征之间的相互调制以非对称的方式实现的,其中 自上而下 的调制是由传统的全局通道注意调制(GCAM)将高级大规模语义信息传播到浅层,而 自下而上的调制是通过像素级通道注意调制(PCAM)实现的,以保持和突出高级特征中的红外小目标。

  • 全局通道注意调制(GCAM):
      全局通道注意力结构可以使神经网络在训练过程中建模特征图各个通道的重要性,自动判断哪些通道上的信息为有用信息,哪些通道上的信息为噪声信息。全局通道注意力结构以SENet的通道注意力结构为基础,添加了批归一化和ReLU激活用于调整权重分布,残差结构增强了模型对强噪声和高冗余数据的处理能力。全局通道注意力模块的输入为尺寸为H×W×C的特征图X,输出为维度是1×1×C的通道权重矩阵。
  • 像素级通道注意调制(PCAM):

3 SIRST

  离群值(outlier):样本中的一个或几个观测值,它们离其他观测值较远,暗示它们可能来自不同的总体。离群点是指与其他观测值有显著差异的数据点。由于目标太小,缺乏内在特征,它们都被归为一个类别,没有进一步区分其特定类别。每个目标都通过观察它的移动顺序来确定,以确保它是一个真正的目标,而不是像素级的脉冲噪声。

3.1 数据集统计

  • 每幅图像的目标数分布如图所示,大约90%的图像只包含一个单一的目标。这一事实支持了许多模型驱动的方法,将检测任务转换为寻找最稀疏或最显著的目标。然而,应该注意的是,大约10%的图像仍然包含额外的目标,这些目标在这种独特的假设下会被忽略。
  • 其中约55%的目标只占图像面积的0.02%。给定一个300×300的图像,目标仅仅是3×3像素。一般来说,检测较小的物体需要更多的上下文信息,而红外小目标由于低对比度和背景杂乱而将这一难度推到极端程度。
  • 只有35%的目标是图像中最亮的。因此,在图像中选择最亮的像素不是一个好主意,导致检测率为0.35,误报率为65%。作为比较,本文提出的方法的检出率为0.84,误报率为0.0065%,要小10000倍。
    在这里插入图片描述

4 不对称的上下文调制

4.1 Rethinking自上而下的注意力调节

给定具有C通道和大小为H×W的特征图的低水平特征X和高水平特征Y,自上而下的注意力调节可以公式化为
在这里插入图片描述
在这里插入图片描述

随着网络的深入,这两个假设不一定适用于红外小目标,因为在高层特征中,小目标很容易被背景淹没,并且它们的特征在全球平均池中也会被削弱。

4.2 自下而上逐点注意调制

逐点通道注意力调制模块,其中每个空间位置的通道特征上下文被单独聚合.
在这里插入图片描述
在这里插入图片描述

4.3 非对称上下文调制模块

同时利用自上而下的全局注意调制和自下而上的局部注意调制,以交换多尺度上下文,从而对语义信息和空间细节进行更丰富的编码。
在这里插入图片描述

4.4 FPN和U-Net

构建新的网络,即ACM-FPN和ACM-U-Net,用于红外小目标检测任务。

在这里插入图片描述

5 实验

  选择FPN和U-Net作为主干部网络,其中ResNet-20是两者的骨干。ROC曲线IoU和所提出的nIoU被选择作为评估指标。SoftIoU作为损失函数,选择Nesterov加速梯度方法作为优化器。0.05的学习率。Bachsize=8,epoch=
300.
数据驱动的方法:
1)顶帽滤波器
2)局部对比度方法(LCM)
3)改进的LCM(ILCM)
4)局部显著性方法(LSM)
5)面核和随机游走器(FKRW)
6)基于多尺度斑块的对比度测量(MPCM)
7)红外斑块图像模型(IPI)
8)基于奇异值部分和的非负性IPI模型(NIPPS)
9)重加权红外斑块张量模型(RIPT)
10)张量核范数部分和(PSTNN)
11)非凸秩近似最小化(NRAM)

5.1 消融实验

1)下采样方案的影响
基于ACM的网络明显优于基于常规ACM的网,尤其是随着网络的深入。结果表明,针对红外小目标检测,有必要定制网络下采样方案。否则,过度的下采样将导致深层中小目标特征的丢失。
在这里插入图片描述

2)双向注意调制的影响
单向自上而下的调制模块即图中所示的TopDownLocal,以及双向调制模块,如图7所示的BiLocal。BiLocal总是比TopDownLocal表现得更好,这表明最好使用双向注意力调制,而不是仅使用自上而下的调制。

在这里插入图片描述

3)不对称注意调制的影响
通道注意力尺度为局部(BiLocal)或全局的调制方案(BiGlobal)相,ACM模块在自上而下的路径中利用全局通道注意力,并在自下而上的路径中明智地指向局部通道注意力。结果验证了所提出的非对称调制的假设,即自上而下的调制需要全局通道注意模块来处理整个图像的高级语义信息,而自下而上的调制需要逐点通道注意机制来处理低级细节。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/502508.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

网文助手。

网文助手 简述 网文助手,免费高质量小说资料网站,支持笔记本和手机端,主要有以下功能。 随机生成小说男女姓名,和尊称随机生成地域和势力名称随机生成功法秘籍、招式战技、法宝兵器、丹药和阵法随机生成妖兽、凶地、天材地宝随…

Prometheus监控报警+Grafana loki日志聚合系统

Prometheus监控报警Grafana loki日志聚合系统 参考文档 https://blog.csdn.net/m0_57480266/article/details/121190725?spm1001.2101.3001.6650.1&utm_mediumdistribute.pc_relevant.none-task-blog-2%7Edefault%7ECTRLIST%7ERate-1-121190725-blog-111992382.235%5Ev3…

二十一、线索转换3:线索的备注转化为客户联系人的备注

功能需求 3.线索的备注信息--》客户备注 4.线索的备注---》联系人备注 5.线索市场活动关系---》联系人市场活动关系 流程图 代码实现&#xff1a;线索的备注转化为客户联系人的备注 1.clueRemarkMapper /*** 根据线索id 查询备注2*/List<ClueRemark> selectInitialC…

Windows本地MySQL升级

一、删除原来的MySQL 删除 C:\Programs Files、C:\Programs Files(x86)、C:\ProgramData 中的所有MySQL目录 找到MySQL数据库中的data保存到其他位置&#xff0c;升级后可以恢复数据库数据 【备份数据】 删除注册表中MySQL的信息 计算机\HKEY_LOCAL_MACHINE\SYSTEM\ControlSet…

Py01·环境搭建

Python环境搭建 官网下载python3.7.3&#xff1a;https://www.python.org/downloads/release/python-373/ 配置系统环境变量目录&#xff1a; E:\ldtools\python3.7.3\python.exe E:\ldtools\python3.7.3\Scripts\pip.exe python.exe 运行环境 pip.exe 包管理器 安装mysql环…

TypeScript 最近各版本主要特性总结

&#xff08;在人生的道路上&#xff0c;当你的期望一个个落空的时候&#xff0c;你也要坚定&#xff0c;要沉着。——朗费罗&#xff09; TypeScript 官网 在线运行TypeScript代码 第三方中文博客 特性 typescript是javascript的超集&#xff0c;向javascript继承额外的编辑…

K8s之Namespace名称空间详解

文章目录 一、名称空间概念二、名称空间基本操作1、创建Namespace的两种方式2、Namespace资源限额 一、名称空间概念 K8s中文手册&#xff1a; K8s名称空间中文官方手册&#xff1a; Kubernetes 支持多个虚拟集群&#xff0c;它们底层依赖于同一个物理集群。 这些虚拟集群被…

UUID使用

1.UUID是什么&#xff1f; UUID 是指&#xff08;Universally Unique Identifier&#xff09;通用唯一识别码&#xff0c;128位。RFC 4122描述了具体的规范实现。 2.UUID解决问题&#xff1f; 分库分表后自增Id重复问题。 3.UUID作用&#xff1f; UUID 的目的是让分布式系…

[数据库系统] 一、创建表以及使用主键约束(educoder)

1.任务&#xff1a;在数据库中创建一个表。 2.需要掌握&#xff1a; 如何在指定数据库中创建表。 知识点&#xff1a;如何在指定数据库中创建表。 我们先来了解一下在数据库中创建表的规则&#xff1a; CREATE TABLE 表名(字段名,数据类型,字段名,数据类型,.....) 例如&…

Oracle 体系结构

文章目录 Oracle体系结构Oracle的内存结构Oracle的进程结构服务器进程后台进程可选后台进程 物理存储结构逻辑存储结构 概念&#xff1a; Oracle server由Oracle instance和Oracle database组成&#xff0c;Oracle instance由后台进程和共享内存组成&#xff0c;Oracle的实例包…

《走进对象村4》之面向对象的第一大特性——封装

文章目录 &#x1f680;文章导读1、封装的概念2、访问限定修饰符3、如何进行封装4、封装的优点&#xff1a; &#x1f680;文章导读 在本篇文章中&#xff0c;将详细的对封装进行总结&#xff0c;文章仅仅是个人的一些理解&#xff0c;如果有错误的地方&#xff0c;还望指出看完…

八岁都能懂:O(N)条件下在N个元素中找出第K小的元素

目录 1 进入情境1-1 金字塔道具1-2 感觉还不够1-3 万能筛子1-4 怎么用呢 2 代码实现2-1 伪代码描述2-2 完整实例c 3 引申3-1 完美的折半舍弃3-2 找出前K小的元素(topK方法&#xff09;3-3 O(n)效率下求中位数参考资料 1 进入情境 生日&#xff0c;朋友送了一堆弹珠&#xff0c;…

[PyTorch][chapter31][卷积]

前言&#xff1a; 卷积神经网络 是 计算机视觉里面应用非常广泛的一个模型。 卷积神经网络 成功案例 人脸识别,指纹识别等应用. 卷积的本质是图像的特征提取&#xff0c; 在冈萨雷士版本《数字图像处理》处理有专门的章节讲解 各种卷积核&#xff0c;在通讯原理里面&#xff0…

MOD09A1、MYD09A1 文件说明

总体介绍 文件全称为 MODIS Terra/Aqua Surface Reflectance 8-Day L3 Global 500 m。文件名称的示例为 “MOD09A1.A2000337.h11v05.005.2006342055602.hdf”。下载下来的 hdf 包括 13 个子数据集&#xff0c;一个 tile 包括 2400*2400 个像元。各数据集的性质如下表所示。 Sci…

51单片机基础实验1

一.51单片机 51单片机&#xff0c;也称为AT89C51&#xff0c;是一种基于Intel 8051架构的8位单片机。它是广泛应用于嵌入式系统和微控制器领域的常见芯片之一。其具有高度灵活性、可编程性和可靠性&#xff0c;因此被广泛应用于各种应用场景中。 51单片机的主要特点包括&…

三十、组播技术——IGMP、IGMP-snooping、PIM-DM、PIM-SM

文章目录 组播概述1、IP组播通信概念2、组播和单播ip地址3、组播MAC4、组播应用场景5、PIM、IGMP、IGMP-snooping 一、IGMP 协议二、PIM DM&#xff08;密集模式&#xff09;1、配置示例如下&#xff1a;2、PIM DM的局限性 三、PM SM&#xff08;稀疏模式&#xff09; 组播概述…

【python学习】基础篇-文件与系统-os 模块及 os.path 相对路径与绝对路径

在 Python 中&#xff0c;内置了os 模块及其子模块 ospath&#xff0c;用于对目录或文件进行操作。 在使用 os 模块或者 os.path 模块时&#xff0c;应首先使用 import 语句将其导入&#xff0c;然后才可以使用它们提供的函数或方法。 1、常用操作目录函数 2.相对路径与绝对路…

如何手写一个支持H.265的高清播放器

概述 音视频编解码技术在当前的互联网行业中十分热门&#xff0c;特别是高清视频播放器的开发&#xff0c;其中包括4K、8K等超高清分辨率的播放器&#xff0c;具有极高的市场需求和广泛的应用场景。H265编码技术更是实现高清视频压缩的重要手段之一。如果想要掌握音视频编解码…

微服务部署:蓝绿发布、滚动发布、灰度发布、金丝雀发布

前言 在项目迭代的过程中&#xff0c;不可避免需要上线。上线对应着部署&#xff0c;或者重新部署&#xff1b;部署对应着修改,修改则意味着风险。 1.蓝绿发布(Blue/Green Deployment) ①定义 蓝绿部署是不停老版本&#xff0c;部署新版本然后进行测试。确认OK后将流量切到新…

ADSP21489之CCES开发笔记(十一)

一、主模式固件加载&#xff1a; 1、激活SPICLK信号&#xff0c;并将SPI_FLG0_O引脚拉低。 2、将读取命令0x03和24位地址0x000000写入从设备。如图24-4所示。 图24-4 二、PCAG时钟选择与配置。 1、来源晶振 2、来源Pin脚 其中来源Pin脚配置PCAG时&#xff0c;需将PCG_CTLx1上加…