英文论文(sci)解读复现【NO.8】基于注意机制和感受野的YOLOv5在唐卡图像缺陷识别中的应用

news2025/1/16 18:06:16
此前出了目标检测算法改进专栏,但是对于应用于什么场景,需要什么改进方法对应与自己的应用场景有效果,并且多少改进点能发什么水平的文章,为解决大家的困惑,此系列文章旨在给大家解读发表高水平学术期刊中的 SCI论文,并对相应的SCI期刊进行介绍,帮助大家解答疑惑,助力科研论文投稿。解读的系列文章,本人会进行 创新点代码复现,有需要的朋友可关注私信我获取。

一、摘要

针对目标检测网络在背景颜色复杂的唐卡图像缺陷检测领域存在的小目标检测效果差、特征信息提取不足、容易出现误检和漏检、缺陷检测准确率低等问题,提出了结合注意机制和感受野的YOLOv 5缺陷检测算法。首先,利用Backbone网络进行特征提取,集成注意力机制来表示不同的特征,使网络能够充分提取缺陷区域的纹理和语义特征,并对提取的特征进行加权融合,减少信息损失。其次,通过Neck网络对不同维度的特征进行加权融合,并将FPN和PAN相结合,实现不同层次的语义特征和纹理特征的融合,更准确地定位缺陷目标。最后,在用CIoU代替GIoU损失函数的同时,在网络中加入感受野,使算法采用四通道检测机制扩大感受野的检测范围,并融合不同网络层之间的语义信息,从而实现小目标的快速定位和更精细的处理。实验结果表明,与原有的YOLOv 5网络相比,本文提出的YOLOV 5-scSE和YOLOV 5-CA网络的检测准确率分别提高了8.71个百分点和10.97个百分点,验证指标也有了显著提升。它能够快速、准确地识别和定位缺陷区域的位置,并具有更强的缺陷类别泛化能力,大大提高了唐卡图像缺陷检测的准确率。

二、网络模型及核心创新点

1.Backbone网络进行特征提取

2.Neck网络对不同维度的特征进行加权融合

3.CIoU代替GIoU损失函数的同时,在网络中加入感受野

三、数据集

实验中使用的数据集是西藏特有的唐卡图像。由于唐卡图像的特殊性和稀缺性,至今还没有统一的唐卡数据集。本实验所需要的是一些含有缺陷区域的唐卡图像数据集。但由于现有的唐卡图像不仅数量少,而且分辨率低,不同程度受损,难以获取,因此数据集的处理和获取成为本次实验的重要组成部分。本文使用的数据集中的唐卡图像均取自西藏。从采集并处理的7000幅唐卡图像中,选取有缺陷的唐卡图像组成本实验所用的数据集,然后按照训练集和测试集的比例8:2将其划分为数据集,用于网络的训练和测试。并且为了丰富训练样本的多样性和鲁棒性,本实验通过镜像、翻转、立即裁剪等数据增强方法对样本数据进行扩展,使网络训练能够达到更好的效果。

四、实验效果(对比实验分析部分展示)

(1)感受野无增加

本文采用未添加感受野的网络对唐卡图像进行训练学习,分别进行了3000次和6000次迭代的实验对比分析。

 从表2的实验结果可以看出,在唐卡数据集中在本实验中使用的Yolov5s网络,与其他网络模型相比,虽然本文使用的网络模型的检测准确率和召回率没有达到最佳,但在3000次迭代中,Yolov5s网络的检测准确率分别提高了0.0783和0.084,由此可以证明本文提出的网络能够有效提高检测效果.

(2)增强感受场

在本次实验中,小目标在缺陷区域中的比例过高,网络不能很好地学习小目标缺陷的纹理和语义特征,为了提高检测效率,本文对网络进行了改进和优化,增加了小目标的感受野从而使网络算法在检测小目标时能够准确地学习小目标缺陷区域的特征,提高唐卡图像缺陷检测的准确性。

从表4的实验结果可以看出,在唐卡图像数据集上,当在网络中加入感受野时,所有网络模型的准确率和召回率都比原始感受野有了很大的提高。

通过增加感受野,网络可以深入学习复杂背景颜色的小目标区域特征,从而提高检测效果。

(3)增强感受野实验效果比较

为了更直观地说明本文对整体网络框架改进的有效性,以直方图的形式描述了在原网络中加入scSE网络模块和CA网络模块的实施效果图,并分别用两组直方图表示了6000次网络epoch迭代有无感受野的效果可视化分析。

 从图7可以看出,原有网络YOLOv5s的检测准确率为0.773,而本文加入的注意力机制模块网络的检测准确率同比分别提升了0.076和0.093,检测召回率同比分别提升了0.031和0.041,mAP值也相应提升。充分证明了在原有网络中加入注意力机制模块可以大大提高图7唐卡图像特征的学习。

图8示出了在将感受野添加到网络之后网络模型的缺陷区域的检测准确度的比较条形图。从图表中可以清楚地看到,在本文中加入了注意力机制之后,网络数据也有了很大的提升。对比图7和图8,原网络YOLOv5s增加感受野后,检测精度提高了0.063。召回率和mAP值也得到了相应的提升。

五、实验结论

在唐卡图像的缺陷检测中,由于唐卡图像背景颜色复杂,缺陷区域特征提取困难,导致缺陷检测网络检测缺陷区域的准确率较低,容易出现误检和漏检现象。本文提出了一种融合scSE和CA机制的唐卡缺陷检测网络,可以有效解决唐卡缺陷特征提取困难和误检测问题。实验结果表明,与原YOLOv 5s网络相比,所提出的YOLOv 5-scSE提高了0.0871的缺陷检测精度,而与原YOLOv 5s网络相比,YOLOv 5-CA网络提高了0.1097的检测精度.此外,与一些经典算法(YOLOv 3、YOLOv 5)相比,本文所使用的缺陷检测网络在提高准确率和召回率的情况下,没有造成大量的时间损失,检测速度也远高于YOLOV 3和YOLOv 5l网络。实验表明,在复杂背景颜色的数据集中引入注意机制,在检测实验中取得了良好的效果,能够达到真实的意义上的速度与准确率相匹配的目的。

注:论文原文出自 Application of YOLOv5 Based on Attention Mechanism and Receptive Field in Identifying Defects of Thangka Images本文仅用于学术分享,如有侵权,请联系后台作删文处理。

解读的系列文章,本人已进行创新点代码复现,有需要的朋友欢迎关注私信我获取

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/576663.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【Unity100个实用小技巧】世界Canvas自动隐藏,包含子物体

☀️博客主页:CSDN博客主页💨本文由 萌萌的小木屋 原创,首发于 CSDN💢🔥学习专栏推荐:面试汇总❗️游戏框架专栏推荐:游戏实用框架专栏⛅️点赞 👍 收藏 ⭐留言 📝&#…

【JavaEE】JUC(java.util.concurrent)的常见类以及线程安全的集合类

目录 1、JUC(java.util.concurrent)的常见类 1.1、Callable接口的用法(创建线程的一种写法) 1.2、ReentrantLock可重入互斥锁 1.2.1、ReentrantLock和synchronized的区别 1.2.2、如何选择使用哪个锁 1.3、Semaphore信号量 1…

pta(浙大第四版)五道经典练习题③

目录 ①7-4 IP地址转换 ②、查找日期 ③藏头词 四、IP地址转换 五、删除链表值为偶数的节点 ①7-4 IP地址转换 题述:IP地址转换:一个IP地址是用四个字节(每个字节8个位)的二进制码组成。输入32位二进制字符串,输…

探索iOS转场动画

iOS提供图像转场动画,可实现酷炫的转场特效。动画包括:溶解、折叠、复印机、暴露、翻页、波纹、滑动等等。 一、溶解动画 CIDissolveTransition提供溶解动画,我们来看看对应的转场动画效果: 在CIFilter指定CIDissolveTransition…

Qt线程基础,多线程使用注意点,目前支持的线程种类。

Qt线程基础 一、什么是线程?二、GUI线程和工作线程三、同时访问数据四、使用线程1、何时使用线程的替代品2、应该用哪种Qt线程技术? 六、Qt中的多线程技术1、QThread:带有可选事件循环的低级API2、QThreadPool和QRunnable:重用线程 七、Qt Concurrent:使…

集成学习以及随机森林介绍

一、集成学习简介 1.什么是集成学习? 集成学习(Ensemble Learning)是一种机器学习方法,通过将多个弱学习器(weak learner)组合在一起来构建一个更强大的学习器(strong learner)。 …

C语言进阶——字符函数和字符串函数(下)

在前面我们已经学习了strlen、strcpy、strcat、strcmp几个库函数,今天我们继续学习剩余的库函数。 上期链接: C语言进阶——字符函数和字符串函数(上)_wangjiushun的博客-CSDN博客 目录: 3、长度受限制的字符串函数…

Redis(四)持久化策略

文章目录 持久化策略1、为什么Redis需要持久化2、Redis提供的两种持久化方式(1)RGB持久化详解概述RGB持久化的两种触发策略手动触发实例测试:自动触发实例测试: 查看rdb的状态信息info Persistence rdb模式的优缺点 (2)AOF持久化详解AOF持久化步骤&#…

近期复盘 | 想多了都是问题,想开了都是答案

文章目录 🌹四月坚持背单词,五月坚持利用AI写文章😊六月会坚持干什么🙌23年7月:毕业两年,参保两年👀强制存储,消费降级,开源节流😜好好深耕能力🎁…

JavaScript 进阶 (一)

目录 作用域 局部作用域 函数作用域 块作用域 全局作用域 作用域链 JS垃圾回收机制 闭包 变量提升 函数进阶 函数提升 函数参数 箭头函数 基本语法 箭头函数参数 箭头函数this 解构赋值 数组解构 对象解构 遍历数组 forEach 方法(重点) …

shell SNAT与DNAT

文章目录 SNATSNAT原理与应用SNAT实验 DNATDNAT原理与应用DNAT实验 SNAT SNAT原理与应用 SNAT 应用环境:局域网主机共享单个公网IP地址接入Internet(私有不能早Internet中正常路由) SNAT原理:修改数据包的源地址。 SNAT转换前提…

文心一言 VS 讯飞星火 VS chatgpt (23)-- 算法导论4.2 5题

五、V.Pan 发现一种方法,可以用 132 464 次乘法操作完成 68 x 68 的矩阵相乘,发现另一种方法,可以用 143 640 次乘法操作完成 70 x 70 的矩阵相乘,还发现一种方法,可以用155 424次乘法操作完成 72 x 72 的矩阵相乘。当…

数据安全治理科技产品能力-数据安全复合治理框架和模型解读(2)

数据治理,数据安全治理行业在发展,在实践,所以很多东西是实践出来的,哪有什么神仙理论指导,即使有也是一家之说,但为了提高企业投产比,必要的认知是必须的,落地数据安全治理科技水平差异直接决定产品和项目是否可持续性,当前和未来更需要专业和有效创新。数据安全治理…

自动驾驶业内动态简讯

1. 引言 参与自动驾驶领域相关研发工作已有多年,针对该领域的快速发展,收集业内各大科技公司最新进展和技术突破,供伙伴们交流探讨。 闲话少说,直接开始吧! 2. 博世 据新闻介绍,博世在德国道路上测试L4级无人驾驶汽…

java 区分缺陷Defects/感染Infections/失败Failure

java 区分缺陷Defects/感染Infections/失败Failure 缺陷Defects 软件故障总是从代码中一个或多个缺陷的执行开始。 缺陷只是一段有缺陷、不正确的代码。 缺陷可能是程序语句的一部分或完整部分,也可能对应于不存在但应该存在的语句。 尽管程序员要对代码中的缺陷负…

基于SSM的甜品店商城系统

✌全网粉丝20W,csdn特邀作者、博客专家、CSDN新星计划导师、java领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌ 🍅文末获取项目下载方式🍅 一、项目背景介绍: 随着社会经济的发展和…

Altium Designer 相同电路多组复制布线

在进行设计开发的时候,总会遇到相同的电路,或者模块,这些电路可以使用相同的布局和走线。我们可以画好其中一部分,然后直接复制,就可以提高效率。下面记录我自己的实际操作过程,有一些地方遇到了问题&#…

Android | Android OS 源码结构

参考:AndroidXRef (http://androidxref.com/)版本:Pie - 9.0.0_r3 整体结构 对于 Android OS 的源码目录来说,各个版本的结构大同小异,随不同版本特性会有个别目录差异。编译后会额外产生一个 out 文件夹用于存储编译产生的文件。…

Unity使用SteamVR2.0实现基本功能(瞬移,抓取物品,射线点击,UI交互等)

基础设置 把SteamVR的Player预制件拖到一个空场景,删掉场景内原本的相机 一.瞬移 新建一个Plane,当做地板找到SteamVR的人物瞬移控制器 Teleporting ,把它拖到场景里 1. 范围移动 我们需要在可以移动的区域,也就是碰撞器上,挂TeleportArea脚本 这个脚本会自动修改你的材质球…

抖音seo源码--开源,支持二开不加密

抖音seo源码,抖音seo矩阵系统源码技术搭建,抖音seo源码技术开发思路梳理搭建 开发思路: 抖音seo源码如何搭建?抖音seo排名优化系统软件部分源码分析,代码打包中。。。 场景:在 python 中,你可…