小目标检测顶会新思路!最新成果刷爆遥感SOTA,参数小了18倍

news2024/11/19 9:27:11

遥感领域的小目标检测一直是个具有挑战性和趣味性的研究方向,同时也是顶会顶刊的常客。但不得不说,今年关于遥感小目标检测的研究热情尤其高涨,已经出现了很多非常优秀的成果。

比如SuperYOLO方法,通过融合多模态数据并执行高分辨率的目标检测,在大幅提高遥感图像中小目标的检测准确性和速度的同时,参数减少了18倍。

再比如结合顶流Mamba和YOLOv9的SOAR,在精度和效率方面都达到了SOTA,性能直接起飞,实力证明遥感小目标检测广泛的应用潜力和高精度的检测能力。

不过由于它的复杂性,遥感小目标检测还是有很多问题没有解决,但这也意味着还有不少创新空间等我们挖掘。为了方便大家找idea,我这边整理了9篇最新的遥感小目标检测论文,基本都有代码,强烈建议想发顶会的同学研读。

论文原文+开源代码需要的同学看文末

SuperYOLO: Super resolution assisted object detection in multimodal remote sensing imagery

方法:本文提出了一种名为SuperYOLO的准确且快速的遥感图像目标检测方法,通过融合多模态数据并利用辅助超分辨率学习实现对多尺度小目标的高分辨率检测,同时考虑检测准确性和计算成本,取得了优于现有模型的性能表现,具有较低的参数大小和计算代价。

创新点:

  • 通过引入一个简单而灵活的超分辨率(SR)分支,实现高分辨率(HR)特征表示的学习,从而能够在仅有低分辨率(LR)输入的情况下,轻松识别广阔背景中的小物体。

  • 提出了一种计算友好的像素级融合方法,以对称且紧凑的方式双向组合内部信息。与特征级融合相比,它在减少计算成本的同时不会损失准确性。

SOAR: Advancements in Small Body Object Detection for Aerial Imagery Using State Space Models and Programmable Gradients

方法:论文主要研究了在航空图像中小目标的检测,采用了SAHI框架结合YOLO v9和Vision Mamba模型,以及双向状态空间模型,有效解决了小目标被背景噪声遮挡的挑战,提高了检测精度和计算效率。

创新点:

  • 了在轻量级YOLO v9架构上使用SAHI框架,该框架利用可编程梯度信息来减少在顺序特征提取过程中通常遇到的巨大信息损失。

  • 采用了Vision Mamba模型,并结合了新颖的双向SSM进行有效的视觉上下文建模。这种模型结合了CNN的线性复杂度和Transformers的全局感受野,特别适用于遥感图像分类。

LR-FPN: Enhancing Remote Sensing Object Detection with Location Refined Feature Pyramid Network

方法:论文引入了一种新颖的位置细化特征金字塔网络(LR-FPN),增强了浅层位置信息的提取,并促进了细粒度上下文交互。LR-FPN通过浅层位置信息提取模块(SPIEM)和上下文交互模块(CIM),有效地利用了稳健的位置信息。

创新点:

  • 介绍了一种插拔式的位置精化特征金字塔网络(LR-FPN),以增强浅层位置信息的提取,并促进细粒度的上下文交互。

  • 引入了一个上下文交互模块(CIM),用于有效地处理空间和通道信息的交互。通过使用深度卷积和空洞深度卷积进行通道内的本地空间信息交互,并通过空洞深度卷积来处理非局部空间交互的挑战,有效地扩大了感受野并增强了空间信息的非局部交互。

HCF-Net: Hierarchical Context Fusion Network for Infrared Small Object Detection

方法:论文提出了一种名为HCF-Net的深度学习方法,通过多个实用模块显著提高了红外小目标检测性能。该方法包括并行化的自适应注意力模块(PPA)、维度感知选择融合模块(DASI)和多膨胀通道细化模块(MDCR)。

创新点:

  • 提出了HCF-Net,这是一种从头开始训练的、层次化的上下文融合网络,用于红外小目标检测。通过多个实用模块,HCF-Net显著提高了红外小目标检测性能。

  • HCF-Net中的模块包括并行化的区域感知注意力模块(PPA)、维度感知的选择性融合模块(DASI)和多倍扩张通道细化器模块(MDCR)。这些模块通过不同的策略和技术选择,有效地解决了红外小目标检测中的困难和挑战。

关注下方《学姐带你玩AI》🚀🚀🚀

回复“遥感小目标”获取全部论文+开源代码

码字不易,欢迎大家点赞评论收藏

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2132700.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

数据库安全性控制

‍ 在当今信息化时代,数据库安全性 对于保护数据免受非法访问和损害至关重要。无论是个人数据还是企业机密,数据库安全性控制都能有效地防范潜在的威胁。本文将为你深入浅出地介绍数据库安全性控制的关键方法和机制,帮助你轻松掌握这一重要概…

vulnhub靶机:21 LTR: Scene1

下载 下载地址:https://www.vulnhub.com/entry/21ltr-scene-1,3/ 导入靶机 一直按默认的来,一直下一步 修改网卡 修改靶机和 kali 攻击机网络模式为仅主机模式 把仅主机模式的 IP 修改为 192.168.2.0 信息收集 主机发现 arp-scan -l 靶机 IP 是 192.…

Windows系统下安装Redis

文章目录 1、下载Redis安装包2、解压压缩包3、运行Redis4、Redis连接检测5、Redis相关设置5.1设置环境变量PATH5.2Redis 配置文件修改 1、下载Redis安装包 Windows版本的Redis可以在Github中下载:下载Redis 2、解压压缩包 将下载的压缩包解压到某个目录下&#…

微服务CI/CD实践(五)Jenkins Docker 自动化构建部署Java微服务

微服务CI/CD实践系列: 微服务CI/CD实践(一)环境准备及虚拟机创建 微服务CI/CD实践(二)服务器先决准备 微服务CI/CD实践(三)Jenkins部署及环境配置 微服务CI/CD实践(四)…

c++20 std::format 格式化说明

在标头<format>定义 ()功能很强大&#xff0c;它把字符串当成一个模板&#xff0c;通过传入的参数进行格式化&#xff0c;并且使用大括号‘{}’作为特殊字符代替‘%’。 1、基本用法 &#xff08;1&#xff09;不带编号&#xff0c;即“{}”&#xff08;2&#xff09;带…

学会使用西门子博途Startdrive中的测量功能

工程师在驱动调试过程中&#xff0c;往往需要对驱动系统的性能进行分析及优化&#xff0c;比如说借助于调试软件中的驱动器测量功能&#xff0c;可以得到驱动系统的阶跃响应、波特图等&#xff0c;以此为依据工程师可以调整速度控制器、电流控制器的相关参数&#xff0c;使驱动…

今天一定要彻底卸载Windows Denfender!攻略给你了

最近有小伙伴吐槽&#xff1a;明明都已经把Windows Defender关了&#xff0c;为啥它还会时不时拦截我下载的文件&#xff1f; 小白就问&#xff1a;明明是谁&#xff1f; 嗯…… 肯定有小伙伴遇到同样的问题&#xff0c;Windows Defender已经关了&#xff0c;但好像并没有完…

利用Xinstall,轻松搭建高效App运营体系

在移动互联网时代&#xff0c;App的推广和运营成为了企业发展的关键环节。然而&#xff0c;随着流量红利的逐渐消失&#xff0c;传统的推广方式已经难以满足企业快速获客的需求。在这个背景下&#xff0c;Xinstall作为一款强大的渠道推广工具&#xff0c;凭借其独特的功能和优势…

【IP协议】IP协议报头结构(上)

IP 协议报头结构 4位版本 实际上只有两个取值 4 > IPv4&#xff08;主流&#xff09;6 > IPv6 IPv2&#xff0c;IPv5 在实际中是没有的&#xff0c;可能是理论上/实验室中存在 4位首部长度 IP 协议报头也是变长的&#xff0c;因为选项个数不确定&#xff0c;所以报头长…

【达梦数据库】mysql 和达梦 tinyint 与 bit 返回值类型差异

测试环境 mysql5.7.44 达梦2024Q2季度版 前言 在mysql 中存在 tinyint&#xff08;1&#xff09;的用法来实现存储0 1 作为boolean的标识列&#xff1b;但是在达梦并不允许使用 tinyint&#xff08;1&#xff09;来定义列&#xff0c;只能使用 tinyint 即 取值范围为&#xff…

《深度学习》CUDA安装配置、pytorch库、torchvision库、torchaudio库安装

目录 一、下载CUDA 1、什么是CUDA 2、查看电脑支持版本号 3、下载CUDA包 1&#xff09;进入下列下载位置 2&#xff09;选择版本 4、安装CUDA 1&#xff09;双击这个文件&#xff0c;然后得到下列图像 2&#xff09;选择自定义安装 3&#xff09;取消选项Visual Inte…

众店绿色积分模式:引领消费新风尚,共筑商业新生态

大家好&#xff0c;我是吴军&#xff0c;目前担任一家业界知名的软件开发公司产品管理的领航者。 最近&#xff0c;市场上涌动着一股创新商业模式的新浪潮&#xff0c;它不仅为消费者编织了一张省钱的网&#xff0c;更为商家铺设了一条吸引新客与增收的道路&#xff0c;甚至平…

【智能流体力学】数值模拟中的稳态和瞬态

在流体力学和数值模拟中, 稳态 (Steady State)意味着流体的物理量(如速度、压力、温度等)不随时间变化。换句话说,在稳态模拟中,系统已经达到了平衡,任何位置上的流场特性都不再随时间发生变化。 其他教程参考:https://doc.cfd.direct/openfoam/user-guide-v12/index…

Linux环境变量详解命令行参数

&#x1f31f;目录 &#x1f4dd;1. 什么是环境变量&#xff1f;&#x1f4dd;2. 查看系统的环境变量&#x1f4dd;3. 添加环境变量&#x1f4dd;4. 环境变量用例5. 命令行参数 好雨知时节 当春乃发生 随风潜入夜 润物细无声 &#x1f4dd;1. 什么是环境变量&#xff1f; 环境…

Matlab simulink建模与仿真 第十二章(信号属性库)

参考视频&#xff1a;simulink1.1simulink简介_哔哩哔哩_bilibili 一、信号属性库中的模块概览 1、信号属性操作库 注&#xff1a;数据类型转换模块在第二章中有介绍&#xff0c;本章不再赘述&#xff1b;数据类型传播实例在本章也不进行介绍。 2、信号属性检测库 二、数据类…

OPENAI的 o1非常强-可是也被网友们玩坏了

OpenAI o1的潜力 OpenAI o1作为当前人工智能领域的先锋&#xff0c;展现了强大的推理能力和文本生成水平。其在多个标准测试中表现优异&#xff0c;甚至在某些任务上超越了人类PhD水平。这让人们对其能力充满期待。根据数据&#xff0c;o1在处理复杂语句和逻辑推理解题时&…

Qt常用控件——QTextEdit

文章目录 QTextEdit核心属性和信号同步显示示例信号示例 QTextEdit核心属性和信号 QTextEdit表示多行输入框&#xff0c;是一个富文本和markdown编辑器&#xff0c;并且能在内存超出编辑框范围时自动提供滚动条。 QPlainTexEdit是纯文本&#xff0c;QTextEdit不仅表示纯文本&a…

AI界的新宠儿:L20显卡凭什么让云服务商趋之若鹜?

NVIDIA L20 GPU 随着 AI 模型的规模和复杂度不断攀升&#xff0c;对计算能力的渴求也与日俱增。对于 C 端用户的朋友们而言&#xff0c;A 系列和 H 系列的价格过于昂贵&#xff0c;而 RTX 4090 在更高的现存需求面前也无能为力。 在这个背景下&#xff0c;一款新的 GPU 悄然崛起…

SQL入门题

作者SQL入门小白&#xff0c;此栏仅是记录一些解题过程 1、题目 用户访问表users&#xff0c;记录了用户id&#xff08;usr_id&#xff09;和访问日期&#xff08;log_date&#xff09;,求出连续3天以上访问的用户id。 2、解答过程 2.1数据准备 通过navicat创建数据&#xf…

如何将一个软件添加到开始菜单以快速打开?

以QQ音乐为例&#xff1a; 1.先找到QQMusic.exe 2.右键创建快捷方式到桌面 3.经过第二步&#xff0c;桌面上就有了QQMusic的快捷打开方式&#xff0c;以后就可以通过双击这个快捷方式打开QQMusic&#xff0c;如果想从开始菜单打开&#xff0c;还需要一些工作&#xff1a;请你…