英文论文(sci)解读复现【NO.21】一种基于空间坐标的轻量级目标检测器无人机航空图像的自注意

news2024/12/23 23:56:20
此前出了目标检测算法改进专栏,但是对于应用于什么场景,需要什么改进方法对应与自己的应用场景有效果,并且多少改进点能发什么水平的文章,为解决大家的困惑,此系列文章旨在给大家解读发表高水平学术期刊中的 SCI论文,并对相应的SCI期刊进行介绍,帮助大家解答疑惑,助力科研论文投稿。解读的系列文章,本人会进行 创新点代码复现,有需要的朋友可关注私信我获取。

一、摘要

目标检测是众多无人驾驶最广泛的应用之一飞行器(UAV)任务。由于无人机的拍摄角度和飞行高度,与一般情况下,小物体在航空图像中占很大比例,而普通物体探测器在航空图像中不是非常有效。此外,由于的计算资源无人机平台通常是有限的,普通探测器的部署有大量无人机平台上的参数很难确定。本文提出了一种轻量级的对象检测器YOLOUAVlite用于航空图像。首先,空间注意力模块和坐标注意力模块是修改并组合形成一个新的空间坐标自注意(SCSA)模块,该模块集成空间、位置和通道信息以增强对象表示。关于这个在此基础上,我们构建了一个名为CSAshuffleenet的轻量级主干,它结合了增强型Shuf fle eNet(ES)网络,具有拟议的SCSA模式。关于这个
在此基础上,我们构建了一个名为SCSAshuf fleenet的轻量级主干,它结合了增强型Shuf fle eNet(ES)网络,具有拟议的SCSA模块,以改进特征提取并减少模型大小。其次,我们提出了一种改进的特征金字塔模型,即Slim-BiFPN,其中我们构造了新的轻量级卷积块,以减少特征过程中的信息损失地图融合过程,同时减少模型权重。最后,定位损失函数为改进以提高边界框回归率,同时提高定位精度。在VisDrone-DET2021数据集上进行的大量实验表明,与YOLOv5-N基线,所提出的YOLO UAVlite将参数数量减少了25.8%,并且在mAP0.50中实现了10.9%的增益。与其他轻质探测器相比,mAP和改进了参数的数量。

二、网络模型及核心创新点

三、实验效果(部分展示)

五、实验结论

在这项研究中,提出了一种轻型探测器YOLO UAVlite来应对这一挑战航空图像中的小规模物体检测。网络结构基于在YOLOv5-N算法上,提高了对小物体的检测效果。我们修改空间和坐标的注意力,并结合它们的优势产生新的注意力,称为SCSA,它将空间、位置和通道信息集成到增强对象表示。我们提出了一个基于SACA的骨干网络ES。改进后的主干网大大提高了检测性能,尤其是对
小物体。所提出的Slim BiFPN大大简化了网络,并且SCSA对模块进行了融合,减少了信息丢失,避免了精度损失。最后,我们扩展通过优化损耗来减少小物体的损耗作用。

注:论文原文出自A Lightweight Object Detector Based on Spatial-Coordinate Self-Attention for UAV Aerial Images 本文仅用于学术分享,如有侵权,请联系后台作删文处理。

解读的系列文章,本人已进行创新点代码复现,有需要的朋友欢迎关注私信我获取

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1452961.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

leetcode hot100不同路径Ⅱ

本题和之前做的不同路径类似,区别是本题中加入了障碍,遇到障碍之后需要避开(注意,这里依旧是只能向下向右移动),那么也就是说,有障碍的点是到达不了的,并且 ,我在初始化的…

Java基于微信小程序的医院挂号小程序,附源码

博主介绍:✌程序员徐师兄、7年大厂程序员经历。全网粉丝12w、csdn博客专家、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌ 🍅文末获取源码联系🍅 👇🏻 精彩专栏推荐订阅👇…

Atmel ATSHA204应用总结

1 ACES软件安装 Atmel Crypto Evaluation Studio (ACES) https://www.microchip.com/DevelopmentTools/ProductDetails/PartNO/Atmel%20Crypto%20%20Studio%20(ACES) 2 基本概念 ACES CE:Atmel Crypto Evalution Studio Configuration Environment(基于加…

Intelij Terminal中文乱码解决

第一: (重启Intelij生效) -Dfile.encodingUTF-8 第二: (重启Intelij生效) 如果还不行,第三: 测试结果很ok:

红队打靶练习:IMF: 1

目录 信息收集 1、arp 2、nmap 3、nikto 目录探测 gobuster dirsearch WEB 信息收集 get flag1 get flag2 get flag3 SQL注入 漏洞探测 脱库 get flag4 文件上传 反弹shell 提权 get flag5 get flag6 信息收集 1、arp ┌──(root㉿ru)-[~/kali] └─# a…

使用MinIO S3存储桶备份Weaviate

Weaviate 是一个开创性的开源向量数据库,旨在通过利用机器学习模型来增强语义搜索。与依赖关键字匹配的传统搜索引擎不同,Weaviate 采用语义相似性原则。这种创新方法将各种形式的数据(文本、图像等)转换为矢量表示形式&#xff0…

怎么在jupyter notebook中运行R

文章目录 需要安装的R包将jupyter和R进行关联修改镜像(缩短包的下载时间)最终效果图 需要安装的R包 repr, IRdisplay, evaluate, crayon, pbdZMQ, devtools, uuid, digest,IRkernel使用命令 install.packages(c(repr, IRdisplay, evaluate, crayon, pbdZMQ, devto…

Javaweb之SpringBootWeb案例之AOP通知类型的详细解析

3.1 通知类型 在入门程序当中,我们已经使用了一种功能最为强大的通知类型:Around环绕通知。 Around("execution(* com.itheima.service.*.*(..))") public Object recordTime(ProceedingJoinPoint pjp) throws Throwable {//记录方法执行开始…

自动化测试:电商管理系统元素定位练习​

本次专题我们来说一下 Python中Unittest 框架的使用及如何通过HTMLTestRunner实现自动化测试报告的自动生成。案例中的代码我们仍旧使用课堂学习中部署的“电商管理系统”来实现。本次练习包括以下几个操作: l 测试用例整体结构设计 l 测试用例的实现 l 测试套的…

C++类和对象-多态->多态的基本语法、多态的原理剖析、纯虚函数和抽象类、虚析构和纯虚析构

#include<iostream> using namespace std; //多态 //动物类 class Animal { public: //Speak函数就是虚函数 //函数前面加上virtual关键字&#xff0c;变成虚函数&#xff0c;那么编译器在编译的时候就不能确定函数调用了。 virtual void speak() { …

建造者模式-Builder Pattern

原文地址:https://jaune162.blog/design-pattern/builder-pattern/ 引言 现在一般大型的业务系统中的消息通知的形式都会有多种,比如短信、站内信、钉钉通知、邮箱等形式。虽然信息内容相同,但是展现形式缺不同。如短信使用的是纯文本的形式,钉钉使用的一般是Markdown的形…

MATLAB通信系统仿真设计——基于BPSK的直接序列扩频通信系统仿真

一.实验原理 直接序列扩频&#xff0c;就是直接用高码率的扩频码序列在发端去扩展信号的频谱&#xff0c;在收端用相同的扩频码去解扩&#xff0c;把展宽的扩频信号还原成原始的基带信号。 在发端输入的信息与扩频码发生器产生的伪随机码序列&#xff08;这里使用的是m序列&am…

【C语言相关问题】C语言中关于大小写字母转换的问题

大家好&#xff0c;这里是争做图书馆扫地僧的小白。非常感谢各位的支持&#xff0c;也期待着您的关注。 目前博主有着C语言、C、linux以及数据结构的专栏&#xff0c;内容正在逐步的更新。 希望对各位朋友有所帮助同时也期望可以得到各位的支持&#xff0c;有任何问题欢迎私信与…

【解决】阿里云香港服务器怎么样?cn2性能测试

阿里云香港服务器中国香港数据中心网络线路类型BGP多线精品&#xff0c;中国电信CN2高速网络高质量、大规格BGP带宽&#xff0c;运营商精品公网直连中国内地&#xff0c;时延更低&#xff0c;优化海外回中国内地流量的公网线路&#xff0c;可以提高国际业务访问质量。阿里云服务…

会声会影2024新功能及剪辑视频步骤教程

会声会影2024的新功能主要包括&#xff1a; 全新的标题动态与特效&#xff1a;用户可以为文字标题指定进入、中场和退出的不同动态效果&#xff0c;比如闪现进入、中场弹跳和淡出退出等&#xff0c;让文字标题更具动感。此外&#xff0c;还新增了多个标题特效&#xff0c;包括…

开源数据可视化应用程序JSON Crack

什么是 JSON Crack &#xff1f; JSON Crack 是一款免费的开源数据可视化应用程序&#xff0c;能够将 JSON、YAML、XML、CSV 等数据格式可视化为交互式图表。凭借其直观且用户友好的界面&#xff0c;JSON Crack 可以轻松探索、分析和理解即使是最复杂的数据结构。无论您是从事大…

OpenCV 4基础篇| OpenCV简介

目录 1. 什么是OpenCV2. OpenCV的发展历程3. 为什么用OpenCV4. OpenCV应用领域5. OpenCV的功能模块5.1 基本模块5.2 扩展模块5.3 常用函数目录 1. 什么是OpenCV OpenCV&#xff08;Open Source Computer Vision Library&#xff09;是一个开源的计算机视觉和机器学习软件库。它…

CES 2024:NVIDIA 通过新的笔记本电脑、GPU 和工具提供生成式 AI

在 CES 2024 上&#xff0c;NVIDIA 推出了一系列硬件和软件&#xff0c;旨在释放 Windows 11 PC 上生成式 AI 的全部潜力。 在 PC 上本地运行生成式 AI 对于隐私、延迟和成本敏感型应用程序至关重要。在 CES 上&#xff0c;NVIDIA 将在整个技术堆栈中带来新的创新&#xff0c;…

Code Composer Studio (CCS) - Current and Local Revision

Code Composer Studio [CCS] - Current and Local Revision References 鼠标放在文件内的任意位置&#xff0c;鼠标右键 -> Compare With -> Local History -> Revision Time. References [1] Yongqiang Cheng, https://yongqiang.blog.csdn.net/

半导体物理基础-笔记

源内容参考&#xff1a;https://www.bilibili.com/video/BV11U4y1k7zn/?spm_id_from333.337.search-card.all.click&vd_source61654d4a6e8d7941436149dd99026962 半导体物理要解决的四个问题 载流子在哪里&#xff1b;如何获得足够多的载流子&#xff1b;载流子如何运动…