【目标检测】AGMF-Net:遥感目标检测的无注意力全局多尺度融合网络

news2024/11/10 14:25:24

《Attention-Free Global Multiscale Fusion Network for Remote Sensing Object Detection》
遥感目标检测的无注意力全局多尺度融合网络
原文:https://ieeexplore.ieee.org/document/10371366

摘要

遥感目标检测(RSOD)在复杂背景和小目标探测中面临挑战,它们相互关联,无法单独解决。为此,我们提出了一种无注意的全局多尺度融合网络(AGMF-Net)。最初,我们提出了一个空间偏差模块(SBM)来获得长期依赖关系,作为我们提出的全局信息提取模块(GIEM)的一部分。GIEM有效地捕捉了全球信息,克服了复杂背景所带来的挑战。此外,我们提出了多任务增强结构(MES)和多任务特征预处理(MFP)来增强多尺度目标的特征表示,同时消除了来自复杂背景的干扰。此外,本文还提出了一种有效的上下文解耦检测器(ECDD),为回归和分类任务提供了独特的特征,旨在提高RSOD的效率。大量的实验表明,我们提出的方法与最先进的探测器相比,取得了优越的性能。其中,AGMF-Net在光学遥感图像(DIOR)、高分辨率遥感检测(HRRSD)、西北理工大学极高分辨率-10(NWPU VHR-10)和RSOD数据集上的平均检测精度分别为73.2%、92.03%、95.21%和94.30%。

网络结构

在这里插入图片描述

GIEM(全局信息提取模块)

特征提取骨干网络由四个GIEM模块组成,能够从不同的深度提取全局语义信息。
GIEM模块结构:由多个空间偏差模块(SBM)组成,SBM将空间偏差图与卷积特征图相结合。这使得网络能够将来自空间偏差的全局知识与来自卷积特征图的局部特征结合起来,使其能够同时学习局部信息和全局信息。空间偏差捕获了更广泛的区域,而卷积特征聚焦于图像中的局部细节。

MES(多任务增强结构)

多尺度特征融合:通过 MFP(多任务特征预处理)模块和 GIEM 来增强特征表示,减少噪声干扰,为分类和定位任务提供融合的语义强特征和高分辨率特征图。
特征预处理:MFP 模块通过聚合信息(Q、K、V)来获得多尺度特征图,并使用 SBM 进行全局注意力提取,最后融合不同尺度的特征。

MSE

在这里插入图片描述

MFP

在这里插入图片描述

高效上下文解耦头(ECDD)

结构:通过 SBM 和 1×1 卷积层将输入预测特征图解耦为两个分支,分别用于分类和回归任务。
损失函数:使用变量焦点损失(VFL)来实现正负样本的不对称加权,强调正样本;使用完整交并比(CIOU)损失函数来考虑边界框的纵横比;引入距离焦点损失(DFL)函数来快速聚焦网络到目标附近的位置。
在这里插入图片描述

实验

不同数据集不同模块引入实验

baseline:DarkNet53
在这里插入图片描述

不同数据集和其他模型对比实验

在这里插入图片描述

代表性检测结果

在这里插入图片描述

RSOD数据集对比网络实验

在这里插入图片描述

不同模块可视化提取效果

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2072905.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

设计模式篇(DesignPattern - 前置知识 七大原则)(持续更新调整)

目录 前置知识 一、什么是设计模式 二、设计模式的目的 七大原则 原则一:单一职责原则 一、案例一:交通工具问题 1. 问题分析 2. 解决思路 2.1 类级别单一职责 2.2 方法级别单一职责 3. 知识小结 二、案例二:待更新 原则二&…

本·阿弗莱克在与詹妮弗·洛佩兹离婚期间与孩子塞拉菲娜共度时光

在詹妮弗洛佩兹提出离婚申请期间,本阿弗莱克被发现与塞拉菲娜阿弗莱克一起在加州观看电影。 本阿弗莱克似乎将重心放在家庭时间上,最近有人拍到他带着孩子塞拉菲娜阿弗莱克在一起。此前,他的妻子詹妮弗洛佩兹 于 8 月 20 日星期二提出离婚。 …

小黄鸟九宫格切图丨教你如何将图片九宫格切图_照片分割成9张工具

图片九宫格怎么弄?怎么把1张图片切割称九宫图?如何将一张照片切成九宫格 微博九宫图怎么做?你还不知道电脑上如何做微博九宫格图片? 今天用小黄鸟九宫格切割工具,手把手教你,搞定九宫格切图 小黄九宫格切图丨小黄鸟教你如何九宫…

如何使用ssm实现基于web的药品管理系统+vue

TOC ssm175基于web的药品管理系统vue 第1章 绪论 1.1 课题背景 互联网发展至今,无论是其理论还是技术都已经成熟,而且它广泛参与在社会中的方方面面。它让信息都可以通过网络传播,搭配信息管理工具可以很好地为人们提供服务。所以各行业&…

五、Centos7-安装Jenkins--这篇废了

克隆了一个base的虚拟机,用来安装Jenkins 2023年11月,Jenkins不支持centos7了。我们只是学习用,先看看吧。 ( 另一个人用别的操作系统安装的jenkins,可以参考 版权声明:本文为博主原创文章,…

js第五天-对象

object let obj {uname: pink,age: 18,gender: w} 增 对象名.属性新值 这个和cpp不一样&#xff0c;可以在大括号外面新增属性 <script>let obj {uname: pink,age: 18,gender: w}obj.hobby footballconsole.log(obj);</script>删 delete delete obj.gender …

Spring Boot整合MyBatis-Plus的详细讲解

MyBatis Plus&#xff08;简称MP&#xff09;是一个在MyBatis基础上进行增强的工具&#xff0c;它保留了MyBatis的所有特性&#xff0c;并通过提供额外的功能和简化操作来提高开发效率。以下是对MyBatis Plus的详细介绍&#xff1a; 一、基本概述 定义&#xff1a;MyBatis Plu…

【MATLAB学习笔记】绘图——设置次刻度线的数量、设置刻度线的宽度(粗细)和长度

目录 前言设置次刻度线数量函数示例基本绘图设置次刻度线数量函数的使用 设置刻度线的长度设置刻度线和轴线的宽度总代码总结 前言 在MATLAB中&#xff0c;将XMinorTicktrue或者YMinorTicktrue设置为true可以很方便地设置X轴或者Y轴次刻度线&#xff0c;但是次刻度线的数量是MA…

代码随想录DAY25 - 回溯算法 - 08/24

目录 非递减子序列 题干 思路和代码 递归法 递归优化 全排列 题干 思路和代码 递归法 全排列Ⅱ 题干 思路和代码 方法一&#xff1a;用集合 set 去重 方法二&#xff1a;先排序&#xff0c;再用数组去重 非递减子序列 题干 题目&#xff1a;给你一个整数数组 nu…

python动画:manim中的目标位置移动,线条末端和两条线相切的位置处理

一&#xff0c;Manim中目标的位置移动 在 Manim 中&#xff0c;shift 函数用于在三维空间或二维平面上对对象进行平移。通过 shift 方法&#xff0c;用户可以快速移动场景中的物体&#xff0c;指定移动的方向和距离。方向通常由预定义的常量&#xff08;如 UP, DOWN, LEFT, RI…

opencv-python图像增强十五:高级滤镜实现

文章目录 前言二、鲜食滤镜三、巧克力滤镜三&#xff0c;冷艳滤镜&#xff1a; 前言 在之前两个滤镜文章中介绍了六种简单的滤镜实现&#xff0c;它们大多都是由一个单独函数实现的接下来介绍五种结合了之前图像增强文章提的的算法的复合滤镜。本案例中的算法来自于文章一&…

【数学建模】TOPSIS法(优劣解距离法)

TOPSIS法&#xff08;Technique for Order Preference by Similarity to Ideal Solution&#xff0c;优劣解距离法&#xff09;是一种多准则决策分析方法&#xff0c;它基于这样一个概念&#xff1a;最理想的方案应该是距离理想解最近而距离负理想解最远的方案。以下是使用TOPS…

【React原理 - 任务调度和时间分片详解】

概述 在React15的时候&#xff0c;React使用的是从根节点往下递归的方式同步创建虚拟Dom&#xff0c;由于递归具有同步不可中断的特性&#xff0c;所以当执行长任务时(通常以60帧为标准&#xff0c;即16.6ms)就会长时间占用主线程长时间无响应&#xff0c;导致页面卡顿&#x…

如何使用Gitee管理自己的项目

如何使用Gitee管理自己的项目 前言 本地创建的工程项目不利于管理&#xff0c;电脑设备丢失损坏&#xff0c;代码就找不回来了。 并且多人同时使用一个项目工程也不方便。 国内的代码托管平台&#xff0c;Gitee为我实现了远程代码管理。 并且该平台可以设置为开源和私有两种…

公司邮箱如何建立

而建立一套完善的公司邮箱系统&#xff0c;则是实现这一目标的重要一环。本文将深入探讨公司邮箱的建立过程&#xff0c;以及其在业务中的重要性。 1. 确定邮箱域名 公司邮箱的建立首先要确定一个专属的邮箱域名。域名是公司在网络上的身份标识&#xff0c;例如&#xff0c;公…

程序猿成长之路之数据挖掘篇——Kmeans聚类算法

Kmeans 是一种可以将一个数据集按照距离&#xff08;相似度&#xff09;划分成不同类别的算法&#xff0c;它无需借助外部标记&#xff0c;因此也是一种无监督学习算法。 什么是聚类 用官方的话说聚类就是将物理或抽象对象的集合分成由类似的对象组成的多个类的过程。用自己的…

VSCode插件 live Server

普通打开 安装live Server 包含端口 说明内置了服务器

改造小蚁摄像头支持免费无限容量云储存(Samba挂载篇)

为什么要改造&#xff1f; 插卡摄像头最大的一个问题就是频繁的读写会导致内存卡寿命急速下降&#xff0c;哪怕是市面上支持NAS转存的摄像头也是先录制到SD卡里&#xff0c;然后把SD卡上的视频再转存到NAS。同样对内存卡和NAS硬盘寿命都是损耗巨大。而这类监控视频绝大多数情况…

重磅!小米将对外公开超 1000 万行的 Xiaomi Vela 开源代码

点击上方关注 “终端研发部” 设为“星标”&#xff0c;和你一起掌握更多数据库知识 如果说接下来的澎湃OS系统会带来很强的吸引力&#xff0c;那么第二个惊喜也是随之而来&#xff0c;那就是小米Vela开源大动作。 早在2017年起&#xff0c;小米就活跃于 NuttX 社区&#xff0c…

Reinforcement-Learning 2.State Value and Bellman Equation

目录 0.Outline 1.Motivating examples Motivating example 1: Why return is important? Motivating example 2: How to calculate return? 2.State value 3.Bellman equation: Derivation Deriving the Bellman equation An illustrative example Exercise 4.Be…