此前出了目标检测算法改进专栏,但是对于应用于什么场景,需要什么改进方法对应与自己的应用场景有效果,并且多少改进点能发什么水平的文章,为解决大家的困惑,此系列文章旨在给大家解读发表高水平学术期刊中的 SCI论文,并对相应的SCI期刊进行介绍,帮助大家解答疑惑,助力科研论文投稿。解读的系列文章,本人会进行 创新点代码复现,有需要的朋友可关注私信我获取。
一、摘要
针对自然场景中复杂背景下多尺度、异型苹果叶片病害的准确定位与识别问题,提出了一种基于改进YOLOv5s模型的苹果叶片病害检测方法。首先,该模型利用双向特征金字塔网络(BiFPN)高效实现多尺度特征融合;然后,加入变压器和卷积块注意模块(CBAM)注意机制,减少无效背景信息的干扰,提高疾病特征的表达能力,提高模型的准确性和召回率。实验结果表明,所提出的 BTC-YOLOv5s模型(模型尺寸为15.8M)能够在自然场景中有效检测4种苹果叶片病害,平均精度(mAP)为84.3%。使用八核CPU,该模型平均每秒可以处理 8.7 张叶子图像。与SSD、Faster R-CNN、YOLOv4-tiny和YOLOx等经典检测模型相比,该模型的mAP值分别提高了12.74%、48.84%、24.44%和4.2%,具有更高的检测精度和更快的检测速度。此外,该模型在强光、昏暗灯光和模糊图像等强噪声条件下具有较强的鲁棒性,mAP值超过80%。综上所述,新型 BTC-YOLOv5s具有重量轻、精度高、效率高等特点,适合在移动设备上应用。该方法可为苹果叶片病害的早期干预和防治提供技术支持。
二、网络模型及核心创新点
1.双向特征金字塔网络
2.变压器编码器块
3.卷积块注意力模块
4.BTC-YOLOv5s检测模型
三、数据集
在本研究中,我们使用了三个数据集来训练和评估建议的模型:2020年植物病理学挑战(FGVC7)数据集、2021年植物病理学挑战(FGVC8)数据集和PlantDoc数据集。FGVC7和FGVC8由Kaggle 主办的植物病理学细粒度视觉分类比赛中使用的苹果叶片病害图像组成。这些照片是由康奈尔 AgriTech公司使用佳能Rebel T5i 数码单反相机和智能手机拍摄的,每张照片的分辨率为 4000 × 2672像素。苹果叶片病害有四种,即锈病、frogeye 叶斑病、白粉病和赤霉病。这些病害频繁发生,给苹果的品质和产量造成重大损失。数据集的示例图像如图1所示。
PlantDoc[24]是一个非实验室图像数据集,由Davinder Singh等人在2020年构建,用于视觉植物病害检测。它包含了 2598张自然场景中的植物疾病图片,涉及 13种植物和多达17种疾病。PlantDoc中的大多数图像分辨率低、噪声大、样本数量不足,使得检测更加困难。在本研究中,利用苹果锈病和疮痂病图像增强和验证了所提模型的通用性。图 2显示了疾病图像的示例。
四、实验效果(部分展示)
(1)消融实验
通过消融实验验证了不同优化模块的有效性。我们在基线模型 YOLOv5s 上依次添加了BiFPN模块(BF)、transformer模块(TR)和CBAM注意模块,构建了几个改进模型,并对相同的测试数据进行了比较。实验结果如表4所示。
表 4 中,基线模型YOLOv5s 的精密度和mAP@0.5 分别为 78.4%和 82.7%。通过增加三个优化模块,即BiFPN模块、transformer模块和CBAM关注模块,与基线模型相比,精度和 mAP@0.5 都得到了提高。具体来说,精度分别提高了 3.3%、3.3%和1.1%,mAP@0.5分别提高了0.5%、1%和0.2%。最终三个优化模块的组合得到了最好的结果,其中精度、mAP@0.5 和 mAP@0.5:0.95 都达到了最高值,分别比基线模型高5.7%、1.6%和 0.1%。通过融合跨通道信息和空间信息,CBAM注意机制聚焦于重要特征,而抑制不相关特征。此外,变压器模块采用自我注意机制建立具有疾病特征的长程特征通道。BiFPN模块将上述特征跨尺度融合,提高了重叠模糊目标的识别能力。由于三个模块的组合,BTC-YOLOv5s模型取得了最好的性能。
(2)注意力机制分析
为了评估CBAM注意机制模块的有效性,我们保留了BTC-YOLOv5s模型的其他结构作为实验参数设置,仅将 CBAM 模块替换为其他主流注意机制模块,如SE、CA、ECA模块,以进行对比。
从表 5 可以看出,注意机制可以显著提高模型的准确性。
SE、CA、ECA和CBAM模型的mAP@0.5分别为83.4%、83.6%、分别为83.6%和84.3%,比YOLOv5s + BF + TR模型高0.4%、0.6%、0.6%和1.3%。每个注意机制都不同程度地改善了 mAP@0.5,其中 CBAM 模型表现最好,达到 84.3%,为0.9%,在四种注意机制中,mAP @ 0.5: 0.95 也是最高的。SE和ECA注意机制只考虑特征图中的通道信息,CA注意机制利用位置信息对通道关系进行编码。而 CBAM关注机制则将空间关注和渠道关注相结合,强调特征图中疾病特征的信息,更有利于疾病的识别和定位。
五、实验结论
针对苹果叶片病害斑点形状不同、病害多尺度、病害分布密集等问题,本研究在YOLOv5s 的基础上,提出了一种改进的检测模型 BTC-YOLOv5s。为了提高原YOLOv5s模型的整体检测性能,本研究引入了 BiFPN模块,增加了多尺度特征的融合,提供了更多的语义信息。此外,还增加了变压器和 CBAM注意模块,提高了疾病特征的提取能力。结果表明,BTC- YOLOv5s模型在ALDD测试集上的准确率为 84.3%,模型尺寸为15.8 M,在八核CPU设备上的检测速度为8.7 FPS。此外,在极端条件下仍然保持了良好的性能和鲁棒性。改进后的模型检测精度高、检测速度快、计算量要求低,适合部署在移动设备上进行苹果病害的实时监测和智能控制。
注:论文原文出自Real-Time Detection of Apple Leaf Diseases in Natural Scenes Based on YOLOv5本文仅用于学术分享,如有侵权,请联系后台作删文处理。
解读的系列文章,本人已进行创新点代码复现,有需要的朋友欢迎关注私信我获取 ❤ 。