SCI论文解读复现【NO.2】基于注意机制的YOLOv5改进算法在行星图像中的应用(代码已复现)

news2025/7/13 22:55:29

此前出了目标检测算法改进专栏，但是对于应用于什么场景，需要什么改进方法对应与自己的应用场景有效果，并且多少改进点能发什么水平的文章，为解决大家的困惑，此系列文章旨在给大家解读发表高水平学术期刊中的SCI论文，并对相应的SCI期刊进行介绍，帮助大家解答疑惑，助力科研论文投稿。解读的系列文章，本人会进行创新点代码复现，有需要的朋友可关注私信我获取。

一、摘要

应用目标检测方法从行星图像中自动检测出漂砾并分析其分布具有重要意义。这有助于选择候选着陆点和了解地质过程。本文结合注意机制对YOLOv5的目标检测方法进行了改进，设计了一种基于金字塔的行星图像中巨石检测方法。设计了一个新的特征融合层来捕捉小巨石的更浅的特征。YOLOv5中还加入了卷积块注意力模块（CBAM）和有效通道注意力网络（ECA-Net）相结合的注意力模块，以突出有助于巨石检测的信息。基于广泛用于目标检测评估的Pascal Visual Object Classes 2007（VOC2007）数据集和我们从Bennu小行星图像构建的boulder数据集，评估结果表明，改进后的YOLOv5算法在精度上提高了3.4%。该方法利用改进的YOLOv5检测方法，从大型行星影像中提取不同分辨率的多层影像，并在不同层次上检测出不同尺度的巨石。我们还将提出的方法应用于探测Bennu小行星上的巨石。本文分析并给出了Bennu小行星上巨砾的分布情况。

二、网络模型及核心创新点

为了从行星图像中检测出多尺度的巨石，结合注意机制对YOLOv 5检测方法进行了改进。如图2所示，原始YOLOv 5架构有三项改进：（1）增加一个新的标记为绿色背景的特征融合层，以捕获更浅的小孤石特征信息;（2）将来自骨干网的特征纳入特征融合层（用红线表示），以减少小孤石的特征信息丢失;（3）在融合层中加入紫色的关注模块，突出对巨石检测有贡献的信息。

三、应用数据集

为了测试改进的YOLOv5在探测巨石方面的性能，我们利用Bennu小行星的图像构建了一个巨石数据集。Bennu小行星目前距离地球超过2亿英里。本努赤道的直径约为492米。林肯近地小行星研究小组于1999年9月11日发现了小行星Bennu。Bennu小行星表面的全球地图是通过拼接NASA的OSIRIS-REx空间遥感器2021，13，3776在2019年3月7日至4月19日期间收集的图像创建的。共将2,155张PolyCam图像拼接在一起并进行校正以制作马赛克。每像素2英寸（5厘米），这是全球绘制行星体地图的最高分辨率。航天器在距离小行星表面1. 9至3. 1英里（3. 1至5公里）的地方收集了这些图像。

四、实验效果（部分展示）

消融研究的结果。第一列中，第一行的“YOLOv 5”检测方法为原始YOLOv 5模型;第二行中的“改进的YOLOv 5”是指在YOLOv 5中增加了新的特征融合层的模型;第三行是在YOLOv 5中进一步增加新连接，从骨干网中提取浅层特征进行特征融合的模型;第四行是指将ECA注意机制应用于第三行模型的模型;第五行指的是将CBAM关注机制应用于第三行的模型的模型;而第六行指的是我们提出的将组合的ECA和CBAM注意力机制应用于第三行模型的模型。。

对比实验结果。从表1中的结果可以看出，改进的YOLOv5优于其它检测方法。例如，它在boulder数据集上的性能优于YOLOv5 3.4%，在VOC2007数据集上优于YOLOv5 1.5%。这些结果表明，改进的YOLOv5检测方法在精确度方面达到了最好的结果。不过，在FPS方面，检测速度相比于YOLOV5原版车型有所下降。

五、实验结论

本文改进了YOLOv 5中最先进的目标检测方法，用于从行星图像中检测巨石。YOLOv 5新增了特征融合层，可捕捉更多小孤石的特征信息。浅层特征也被从主干网络引入特征融合层，以进一步减少小孤石的特征信息损失。此外，还加入了结合CBAM和ECA-Net注意机制实现的注意模块，以突出有助于巨石检测的信息。基于广泛用于探测评估的VOC 2007数据集和我们从Bennu小行星图像构建的boulder数据集，评估结果表明YOLOv 5的精度提高了3.4%。鉴于巨石的多尺度和行星图像的大尺寸，还设计了基于金字塔的方法来从具有不同分辨率的图像的不同层检测不同尺度的巨石。我们已经将所提出的方法应用于Bennu小行星图像中的巨石检测。本文还对Bennu小行星上巨砾的分布作了分析和介绍。

六、投稿期刊介绍