SCI论文解读复现【NO.2】基于注意机制的YOLOv5改进算法在行星图像中的应用(代码已复现)

news2024/12/28 3:05:48

        此前出了目标检测算法改进专栏,但是对于应用于什么场景,需要什么改进方法对应与自己的应用场景有效果,并且多少改进点能发什么水平的文章,为解决大家的困惑,此系列文章旨在给大家解读发表高水平学术期刊中的SCI论文,并对相应的SCI期刊进行介绍,帮助大家解答疑惑,助力科研论文投稿。解读的系列文章,本人会进行创新点代码复现,有需要的朋友可关注私信我获取。

一、摘要

应用目标检测方法从行星图像中自动检测出漂砾并分析其分布具有重要意义。这有助于选择候选着陆点和了解地质过程。本文结合注意机制对YOLOv5的目标检测方法进行了改进,设计了一种基于金字塔的行星图像中巨石检测方法。设计了一个新的特征融合层来捕捉小巨石的更浅的特征。YOLOv5中还加入了卷积块注意力模块(CBAM)和有效通道注意力网络(ECA-Net)相结合的注意力模块,以突出有助于巨石检测的信息。基于广泛用于目标检测评估的Pascal Visual Object Classes 2007(VOC2007)数据集和我们从Bennu小行星图像构建的boulder数据集,评估结果表明,改进后的YOLOv5算法在精度上提高了3.4%。该方法利用改进的YOLOv5检测方法,从大型行星影像中提取不同分辨率的多层影像,并在不同层次上检测出不同尺度的巨石。我们还将提出的方法应用于探测Bennu小行星上的巨石。本文分析并给出了Bennu小行星上巨砾的分布情况。  

二、网络模型及核心创新点

为了从行星图像中检测出多尺度的巨石,结合注意机制对YOLOv 5检测方法进行了改进。如图2所示,原始YOLOv 5架构有三项改进:(1)增加一个新的标记为绿色背景的特征融合层,以捕获更浅的小孤石特征信息;(2)将来自骨干网的特征纳入特征融合层(用红线表示),以减少小孤石的特征信息丢失;(3)在融合层中加入紫色的关注模块,突出对巨石检测有贡献的信息。

三、应用数据集

为了测试改进的YOLOv5在探测巨石方面的性能,我们利用Bennu小行星的图像构建了一个巨石数据集。Bennu小行星目前距离地球超过2亿英里。本努赤道的直径约为492米。林肯近地小行星研究小组于1999年9月11日发现了小行星Bennu。Bennu小行星表面的全球地图是通过拼接NASA的OSIRIS-REx空间遥感器2021,13,3776在2019年3月7日至4月19日期间收集的图像创建的。共将2,155张PolyCam图像拼接在一起并进行校正以制作马赛克。每像素2英寸(5厘米),这是全球绘制行星体地图的最高分辨率。航天器在距离小行星表面1. 9至3. 1英里(3. 1至5公里)的地方收集了这些图像。

 四、实验效果(部分展示)

消融研究的结果。第一列中,第一行的“YOLOv 5”检测方法为原始YOLOv 5模型;第二行中的“改进的YOLOv 5”是指在YOLOv 5中增加了新的特征融合层的模型;第三行是在YOLOv 5中进一步增加新连接,从骨干网中提取浅层特征进行特征融合的模型;第四行是指将ECA注意机制应用于第三行模型的模型;第五行指的是将CBAM关注机制应用于第三行的模型的模型;而第六行指的是我们提出的将组合的ECA和CBAM注意力机制应用于第三行模型的模型。。

 对比实验结果。从表1中的结果可以看出,改进的YOLOv5优于其它检测方法。例如,它在boulder数据集上的性能优于YOLOv5 3.4%,在VOC2007数据集上优于YOLOv5 1.5%。这些结果表明,改进的YOLOv5检测方法在精确度方面达到了最好的结果。不过,在FPS方面,检测速度相比于YOLOV5原版车型有所下降。

 五、实验结论

本文改进了YOLOv 5中最先进的目标检测方法,用于从行星图像中检测巨石。YOLOv 5新增了特征融合层,可捕捉更多小孤石的特征信息。浅层特征也被从主干网络引入特征融合层,以进一步减少小孤石的特征信息损失。此外,还加入了结合CBAM和ECA-Net注意机制实现的注意模块,以突出有助于巨石检测的信息。基于广泛用于探测评估的VOC 2007数据集和我们从Bennu小行星图像构建的boulder数据集,评估结果表明YOLOv 5的精度提高了3.4%。鉴于巨石的多尺度和行星图像的大尺寸,还设计了基于金字塔的方法来从具有不同分辨率的图像的不同层检测不同尺度的巨石。我们已经将所提出的方法应用于Bennu小行星图像中的巨石检测。本文还对Bennu小行星上巨砾的分布作了分析和介绍。

六、投稿期刊介绍

 

注:论文原文出自Improving YOLOv5 with Attention Mechanism for Detecting
Boulders from Planetary Images. 本文仅用于学术分享,如有侵权,请联系后台作删文处理。

解读的系列文章,本人已进行创新点代码复现,有需要的朋友欢迎关注私信我获取❤

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/132970.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

EMNLP22提示模板生成:GPS: Genetic Prompt Search for Efficient Few-shot Learning

GPS: Genetic Prompt Search for Efficient Few-shot Learning 1 简介 Genetic Prompt Search (GPS) 通过提示改进少样本学习,它利用遗传算法自动搜索高性能提示 遗传提示搜索 (GPS) 算法,该算法使用生成模型逐渐改变提示,并根据它们在小型…

C语言网刷题记录

作者:会敲代码的Steve 座右铭:博学笃志,切问静思。 大家好久不见啊,一看时间我已经好久没发文章了,最近在刷OJ题和学习;就没那么多心思把时间花在写文章上了,我对此感到很抱歉,本文呢…

int8,FLOPS,FLOPs,TOPS 等具体含义

1、定义 算力的计量单位FLOPS(Floating-point operations per second),FLOPS表示每秒浮点的运算次数。具体使用时,FLOPS前面还会有一个字母常量,例如TFLOPS、PFLOPS。这个字母T、P代表次数,T代表每秒一万亿…

Linux学习笔记——MySQL数据库管理系统安装部署

5.1、MySQL数据库管理系统安装部署 5.1.1、简介 1、MySQL简介 MySQL数据库管理系统(后续简称MySQL),是一款知名的数据库系统,其特点是:轻量、简单、功能丰富。 MySQL数据库可谓是软件行业的明星产品,无…

xilinx ZYNQ 7000 AXI GPIO

.0AXI GPIO 第一部分 PS 和 PL之间的通讯有一个接口称为AXI。AXI总线具体的内容这边不去深究,可以理解为一种特殊协议的通讯方式。 AXI GPIO是什么意思? PL是FPGA它可以做成任何你想要的东西,做一个GPIO外设当然是可以的。 如上图所示&…

DoIP协议从入门到精通——通信建立

在DoIP专栏中,关于DoIP文章,主要讲述从车辆物理连接、车辆声明、车辆通信激活(Routine Activation)和诊断通信几个步骤。 本文介绍了Tester与车辆获取物理连接、车辆声明自身信息后接下来需要操作的就是本文所要分享的内容:Tester与车辆控制器的通信建立。 一、通信模式…

记一次堆外内存泄漏分析

文章目录1. 背景2. JVM 内存分布与分析2.1 JVM 内存分布2.2 堆外内存泄漏分析思路2.3 服务器 JVM 参数配置及实际内存分布2.4 JVM native 内存查看2.5 手动触发 Full GC3. 问题排查经历3.1 定位内存泄漏的位置及初步猜想1)定位 RES 区域存在内存泄漏2)分…

寒假每日一题W1D1——孤独的照片

题目描述 Farmer John 最近购入了 N 头新的奶牛,每头奶牛的品种是更赛牛(Guernsey)或荷斯坦牛(Holstein)之一。 奶牛目前排成一排,Farmer John 想要为每个连续不少于三头奶牛的序列拍摄一张照片。 然而&…

一本通 1267:【例9.11】01背包问题(详细代码)

经典01背包问题 这里给你3种方法 目录 DFS 思路: 代码: DFS记忆化 思路: 代码: 动态规划 思路: 代码: DFS 时间复杂度 :O(2^n) 思路: DFS求出所有选法,再用…

Maven 之 依赖管理

目录 1、依赖传递 小案例: 2、可选依赖 3、 排除依赖 4、可选依赖和排除依赖的区别 我们开发一个工程需要用到大量得jar包,而这些jar 包就是我们所说得依赖,一个项目可以配置多个依赖。 1、依赖传递 我们来看一下今天用来演示的工程。…

Linux性能学习(1.4):CPU_如何查看CPU上下文切换参数

文章目录1 系统总体上下文参数2 进程的上下文切换参数3 其它参考资料:vmstat:一个标准的报告虚拟内存统计工具 在前面大致了解了上下文切换的相关知识,那么如何在系统中查看上下文切换相关的参数? 1 系统总体上下文参数 使用vm…

人工势场法路径规划算法(APF)

本文主要对人工势场法路径规划算法进行介绍,主要涉及人工势场法的简介、引力和斥力模型及其推导过程、人工势场法的缺陷及改进思路、人工势场法的Python与MATLAB开源源码等方面 一、人工势场法简介 人工势场法是由Khatib于1985年在论文《Real-Time Obstacle Avoidan…

WPF使用触发器需要注意优先级问题

总目录 文章目录总目录前言一、问题开始二、问题说明三、问题订正总结前言 WPF使用触发器需要注意优先级问题 一、问题开始 现在有个需求: 初始状态(未选中)的时候,CheckBox的Content 为 “乒乓球”,然后选中之后&am…

python机器学习《基于逻辑回归的预测分类》

前言: 本文所有代码均在阿里天池实验室运行,本机的jupyter notebook也可运行。除此之外,还需要导入numpy,matplotlib,sklearn,seaborn包。每期文章前面都会有环境搭建说明。文中的讲解知识点均是按照从上往下讲解,将一些平常未接触…

⼯⼚⽅法模式

⼯⼚⽅法模式 ⼯⼚⽅法模式,属于创建者模式中的一种,这类模式提供创建对象的机制, 能够提升已有代码的灵活性和可复⽤性。 创建者模式包括:⼯⼚⽅法、抽象⼯⼚、⽣成器、原型、单例,这5类。 1.⼯⼚⽅法模式介绍 ⼯⼚…

LaoCat带你认识容器与镜像(二【一章】)

系列二章,祝大家新的一年事事顺心,想要的一定都实现。 本章内容 使用Docker镜像。 本文实操全部基于Ubuntu 20.04 一、使用Docker镜像 镜像(image)是Docker三大核心概念中最重要的,Docker运行容器前需要本地存在对应得…

在wsl下开发T113的主线linux(5)-构建ubi文件系统

接下来是构建文件系统,这里使用最新的buildroothttps://buildroot.org/download.htmlhttps://buildroot.org/download.html tar xf buildroot-2022.11.tar.gz cd buildroot-2022.11 make menuconfig 配置目标指令集类型 配置外部自定义编译器 配置生成文件系统类型…

数据结构和算法--算法与数据结构的概述、简单排序

目录 算法 算法概述 算法复杂度 数据结构 数据结构的概述 物理结构 逻辑结构 简单排序 1.选择排序 1.1算法描述 1.2算法实现 2冒泡排序 2.1算法描述 2.2算法实现 3插入排序 3.1算法描述 3.2算法实现 三种算法的比较 算法 算法概述 算法是一系列程序指令&am…

回溯算法题型

目录 一组合总和 二组合总和 三子集 四全排列 五解数独 一组合总和 题目描述: 找出所有相加之和为 n 的 k 个数的组合,且满足下列条件: 只使用数字1到9每个数字 最多使用一次 返回 所有可能的有效组合的列表 。该列表不能包含相同的组…

ArcGIS基础:提取道路中心线

本实验为对道路路面数据进行中心线提取 以路边两侧边界为准,运用等分的办法实现道路中心线提取,原始数据如下所示(来源于网络)。 道路顶端有一些圆弧段的部分,需要把其去除。 首先要做的是面转线操作,如下…