屏幕缺陷检测-目标检测数据集(包括VOC格式、YOLO格式)

news2024/11/15 20:00:01

屏幕缺陷检测-目标检测数据集(包括VOC格式、YOLO格式)

数据集:
链接:https://pan.baidu.com/s/1mb83CzAAOkvMZ_LS9Alt8w?pwd=agi6 
提取码:agi6 

数据集信息介绍:
共有 3789 张图像和一一对应的标注文件

标注文件格式提供了两种,包括VOC格式的xml文件和YOLO格式的txt文件。

标注的对象共有以下几种:

[‘white_point’, ‘flaw’, ‘scratch’]

标注框的数量信息如下:(标注时一般是用英文标的,括号里提供标注对象的中文作为参考)

white_point(白点): 2222

flaw(裂痕): 5127

scratch(划痕): 2256

注:一张图里可能标注了多个对象,所以标注框总数可能会大于图片的总数。

完整的数据集,包括3个文件夹和一个txt文件:
在这里插入图片描述
all_images文件:存储数据集的图片,截图如下:
在这里插入图片描述
图片大小信息:
在这里插入图片描述
all_txt文件夹和classes.txt: 存储yolo格式的txt标注文件,数量和图像一样,每个标注文件一一对应。
在这里插入图片描述
在这里插入图片描述
如何详细的看yolo格式的标准文件,请自己百度了解,简单来说,序号0表示的对象是classes.txt中数组0号位置的名称。

all_xml文件:VOC格式的xml标注文件。数量和图像一样,每个标注文件一一对应。
在这里插入图片描述
标注结果:
在这里插入图片描述

如何详细的看VOC格式的标准文件,请自己百度了解。
两种格式的标注都是可以使用的,选择其中一种即可。
——————————————————————————————————————

写论文参考

基于深度学习的屏幕缺陷检测及其意义
摘要
随着电子设备的普及,屏幕质量成为用户体验的重要因素之一。屏幕缺陷检测作为质量控制中的关键环节,确保了产品出厂时的高质量标准。传统的检测方法多依赖人工检查,存在效率低下和主观误差等问题。近年来,深度学习技术的发展为屏幕缺陷检测提供了全新的解决方案,利用图像识别和模式匹配技术,可以实现更高效、精准的缺陷检测。本文将基于屏幕缺陷检测数据集,探讨深度学习技术在该领域的应用及其在智能制造中的重要作用。

关键词
屏幕缺陷检测、深度学习、卷积神经网络、智能制造、图像识别

  1. 引言
    1.1 研究背景
    在现代电子设备的生产过程中,显示屏作为重要的组成部分,其质量直接影响产品的使用体验。显示屏的生产过程中,常见的缺陷包括亮点、暗点、色差、裂纹等,传统的检测方法依赖于人工目视检查或基于规则的图像处理技术。然而,随着屏幕分辨率和复杂度的提升,传统方法难以满足高效、精准的检测需求。

深度学习技术,特别是卷积神经网络(CNN)的出现,使得自动化的屏幕缺陷检测成为可能。通过大规模的图像数据集训练,深度学习模型能够自动提取屏幕缺陷的特征,并实现精确的缺陷分类与定位。本文基于屏幕缺陷检测数据集,探讨深度学习技术在该领域的应用及其对智能制造的贡献。

1.2 研究目的
本文的目的是研究深度学习技术如何在屏幕缺陷检测中提高检测精度与效率,分析其在生产过程中的具体应用。通过对不同深度学习模型的实验与评估,本文旨在提出适合屏幕缺陷检测的深度学习算法,并讨论其对制造业自动化的推动作用。

1.3 研究意义
深度学习技术的引入,极大地改善了屏幕缺陷检测的自动化水平,减少了人为检测的误差,提高了检测效率和准确度。在智能制造逐渐成为工业发展的趋势下,自动化的屏幕检测系统不仅能够降低生产成本,还能保证产品质量的一致性。因此,研究深度学习在屏幕缺陷检测中的应用,具有重要的工业意义。

  1. 文献综述
    2.1 传统的屏幕缺陷检测方法
    传统的屏幕缺陷检测方法主要分为两类:人工检测和基于图像处理的自动化检测。人工检测由于依赖于人工视觉观察,不仅效率低下,而且检测结果受检测员主观因素影响较大。而基于图像处理的自动检测方法,则通过预设的规则对屏幕图像进行边缘检测、滤波、二值化等操作,从而识别出缺陷。然而,面对复杂的屏幕纹理或多样化的缺陷类型,传统图像处理方法常常力不从心,难以应对变化多端的生产环境。

2.2 深度学习在缺陷检测中的应用
深度学习,尤其是卷积神经网络(CNN),近年来在图像识别领域取得了突破性进展。与传统的图像处理方法不同,深度学习通过大规模数据集进行训练,自动提取图像中的特征,无需依赖于人工设定的规则。因此,深度学习方法在屏幕缺陷检测中表现出更高的鲁棒性和适应性。

在制造业中,深度学习已被广泛应用于缺陷检测任务,包括钢板表面缺陷检测、半导体芯片缺陷检测以及液晶屏缺陷检测等。典型的深度学习模型如ResNet、YOLO和Mask R-CNN等,能够在保证高精度检测的同时,提供较快的检测速度,满足工业生产中对实时性的要求。

2.3 屏幕缺陷检测中的挑战
尽管深度学习在缺陷检测中取得了显著的效果,但屏幕缺陷检测仍然面临许多挑战。首先,屏幕缺陷的种类多样,既包括小面积的亮点、暗点等细节缺陷,也包括裂纹等较大规模的缺陷,这对模型的检测能力提出了较高要求。其次,不同的屏幕生产环境、光照条件和角度变化,可能导致检测结果的不稳定性。此外,深度学习模型的高效训练需要大量标注数据,而在实际生产中,获取高质量的缺陷样本标注具有一定难度。

  1. 研究方法
    3.1 数据集构建
    本文使用的屏幕缺陷检测数据集涵盖了多种类型的屏幕缺陷,如亮点、暗点、色差和裂纹等。数据集中每张图片都经过详细标注,包括缺陷的类型和位置。同时,数据集还包含了不同光照条件和环境下的屏幕图像,以保证模型在复杂生产环境中的适应性。

3.2 深度学习模型选择

3.3 模型训练与优化

3.4 性能评估

  1. 实验结果与分析
    4.1 实验结果
    实验结果表明,YOLO在屏幕缺陷检测任务中的表现最佳,其检测速度达到每秒30帧,同时在亮点、暗点等细微缺陷的识别上表现出色。Mask R-CNN虽然在检测速度上稍有逊色,但其像素级的分割能力使得其在裂纹等复杂形状的缺陷检测中具有显著优势。此外,CNN模型虽然在简单场景下能够取得较好的检测效果,但在应对复杂场景和多样化缺陷时,表现不如YOLO和Mask R-CNN。

通过数据增强操作,所有模型在应对不同光照条件和环境变化时均表现出了较好的稳定性。此外,迁移学习的应用大幅提高了模型的收敛速度,减少了训练时间。

4.2 结果讨论
实验结果表明,YOLO模型的高效性和精度使其非常适合于工业生产中的实时检测任务,尤其是在需要快速检测和分类的生产线中。相比之下,Mask R-CNN的像素级分割能力虽然适合复杂缺陷的检测,但由于其较高的计算复杂度,更适合于精度要求较高但实时性要求较低的任务。

此外,深度学习模型的性能与数据集的质量密切相关。在数据集构建时,确保数据的多样性和覆盖性,能够显著提升模型的泛化能力。本文通过多种数据增强技术,提升了模型在不同环境下的鲁棒性。

  1. 结论
    5.1 主要结论
    本文通过对屏幕缺陷检测数据集的深度学习研究,探讨了深度学习技术在屏幕缺陷检测中的应用及其对智能制造的推动作用。实验结果表明,基于深度学习的缺陷检测模型能够有效提高检测的准确性和实时性,为屏幕质量控制提供了可靠的技术支持。特别是YOLO和Mask R-CNN等模型,在不同缺陷类型的检测任务中表现优异,能够适应复杂多变的生产环境。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2138830.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

RPC远程调用的序列化框架

序列化框架对比: 一、Java Serialiazer 字段serialVersionUID的作用是为了在序列化时保持版本的兼容性,即版本升级时反序列化仍保持对象的唯一性。 //序列化 ByteArrayOutputStream bout new ByteArrayOutputStream(); ObjectOutoutStream out new O…

【Kubernetes笔记】为什么DNS解析会超时?

【Kubernetes笔记】为什么DNS解析会超时? 目录 1 问题背景2 产生后续的问题3 DNS 负缓存工作原理:4 如何解决和缓解 DNS 负缓存 4.1 减小负缓存 TTL4.2 重试机制4.3 减少 Pod 的频繁重启或调度4.4 使用 Headless Service4.5 手动刷新 DNS 缓存 5 总结 …

苹果cms多语言插件,插件配置前端默认语言采集语言等

苹果CMS(maccmscn)是一款功能强大的内容管理系统,广泛应用于视频网站和其他内容发布平台。为了满足全球用户的需求,苹果CMS支持多语言插件,使得网站能够方便地提供多语言版本。以下是关于苹果CMS多语言插件的详细介绍&…

网络原理2-网络层与数据链路层

目录 网络层数据链路层 网络层 网络层做的工作: 1、地址管理–>IP地址 2、路由选择–>数据包传输的路径规划 网络层主要的协议就是IP协议 IP协议的报头结构: 4位版本: 有两个取值,4表示IPv4,6表示IPv6&am…

关于网站ERR_TOO_MANY_REDIRECTS错误的修改办法

今天网站因为证书到期,七牛云的报错一直ERR_TOO_MANY_REDIRECTS,302重定向次数过多了,连后台都进不去 多次清除cookie未果,终于找到了原因:设置了太多重定向, 1.http强制跳转 2.宝塔后台设置了跳转 3.域…

备战软考Day02-数据结构与算法

1.基本概念与三要素 1.什么是数据 数据是信息的载体,是描述客观事物属性的数、字符及所有能输入到计算机中并被计算机程序识别和处理的符号的集合。数据是计算机程序加工的原料。 2.数据元素、数据项 数据元素是数据的基本单位,通常作为一个整体进行…

树莓派Pico2(RP2350)开发环境搭建

树莓派Pico2(RP2350)开发环境搭建 文章目录 树莓派Pico2(RP2350)开发环境搭建1、RP2350介绍2、开发环境搭建3、工程编译4、固件下载Raspberry Pi再次通过推出RP2350 MCU突破了微控制器设计的界限。这款微控制器是之前RP2040的重大升级,带来了更强大的性能、高级安全功能,…

基于SSM的二手车管理系统的设计与实现 (含源码+sql+视频导入教程)

👉文末查看项目功能视频演示获取源码sql脚本视频导入教程视频 1 、功能描述 基于SSM的二手车管理系统4拥有三种角色 管理员:订单管理、在售车辆管理、下架车辆管理、品牌管理、分类管理、推荐管理、统计等 商家:登录注册、添加/下架/删除车辆…

vscode搭建ros开发环境问题记录(更新...)

文章目录 vscode 不能自动补全 开发环境: vmware 15.7 ubuntu 20.04 ros noetic vscode 不能自动补全 这里将头文件已经正确包含到c_cpp_properties.json中代码中仍然不能自动补全, 将C_CPP插件设置中的Intelli Sense Engine 设置为TagParser,然后重新加…

828华为云征文 | 云服务器Flexus X实例:部署 Gitea,拥有自己的Git仓库,管理本地代码

目录 一、什么是 Gitea 二、安装 Docker 环境 2.1 更新 apt 软件源 2.2 安装依赖 2.3 安装 Docker 三、安装 Gitea 3.1 创建 docker-compose.yml 3.2 启动 Gitea 服务 3.3 初始化配置 四、运行 Gitea 4.1 登录/注册 4.2 创建仓库 五、总结 本篇文章通过部署 Gite…

【BFS专题】— 多源最短路问题

1、矩阵 - 力扣(LeetCode) 思路: 首先创建一个dist数组,将dist数组初始化为-1,表示该位置没有被搜索和记录该位置的值然后再遍历mat数组,将数组中的 0 添加到队列中,并且修改dist对应位置的值为…

全网最全最详细的跨域解决方案

你们好,我是金金金。 前置知识 本篇文章以通俗易懂的方式进行描述,自己组织语言进行输出,尽量让每一个人都能看得懂。哪里有说的不正确的地方 大佬请在评论区指正! 首先需要了解浏览器的同源策略 浏览器的同源策略 MDN解释地址&…

神经网络通俗理解学习笔记(3)注意力神经网络

Tansformer 什么是注意力机制注意力的计算键值对注意力和多头注意力自注意力机制注意力池化及代码实现Transformer模型Transformer代码实现 什么是注意力机制 注意力机制的发展史 Attention Mechanism Mnih V, Heess N, Graves A. Recurrent models of visual attention, 2014…

JVM 调优篇7 调优案例1-堆空间的优化解决

一 jvm优化 1.1 优化实施步骤* 1)减少使用全局变量和大对象; 2)调整新生代的大小到最合适; 3)设置老年代的大小为最合适; 4)选择合适的GC收集器; 1.2 关于GC优化原则 多数的Java应用不需要在服务器上进行GC优化&#xff1…

NeMo Curator 整理用于 LLM 参数高效微调的自定义数据集

目录 概述 预备知识 定义自定义文档构建器 下载数据集 解析和迭代数据集 将数据集写入 JSONL 格式 使用文档构建器加载数据集 使用现有工具统一 Unicode 格式 设计自定义数据集过滤器 编辑所有个人识别信息 添加指令提示 整合管线 概述 出于演示目的,本…

【PyQt6 应用程序】应用程序携带数据源文件一并打包

在开发好应用程序打包之后给到其他用户会发现数据文件比如封面图片不见了。 例如这样,很影响用户使用。 这里介绍一个非常简单的打包方法,不光要在打包命令的时候添加对应数据文件,在源码中也要进行一些简单的修改。 修改需要添加打包文件的地方。首先需要添加一个绝对路径…

143234234123432

📢博客主页:https://blog.csdn.net/2301_779549673 📢欢迎点赞 👍 收藏 ⭐留言 📝 如有错误敬请指正! 📢本文由 JohnKi 原创,首发于 CSDN🙉 📢未来很长&#…

【C++】c++的继承

目录 思维导图大纲: 1.基类和派生类 1.1 定义格式 1.2 继承方式 1.3 基类和派生类的转换 2. 继承中的作用域(隐藏关系) 2.1 考察继承作⽤域相关选择题 3. 派生类的默认成员函数 4. 继承类模板 5. 一个不能被继承的类 ​编辑 6.继承与友元 ​编辑 7. 继…

Java面向对象六大设计原则总结(超级详细,附有代码、图解以及案例)

文章目录 三.软件(面向对象)设计原则3.1 开闭原则(OSP)3.1.1 概述3.1.2 案列 3.2 里氏代换原则(LSP)3.2.1 概述3.2.2 案例 3.3 依赖倒转原则(DIP)3.3.1概述3.3.2 案例 3.4 接口隔离原则(ISP)3.4.1 概述3.4.2 案列 3.5 迪米特法则(DP)3.5.1 概述3.5.2 案例 3.6 合成复用原则(CRP…

红黑树前语

目录 概念 性质 红黑树与AVL树的比较 过两天更新红黑树的模拟实现,中秋快乐各位 概念 1. 概念: 是一种搜索二叉树, 但在每个结点上增加一个存储位表示节点的颜色,可以是Red 或 Black。通过对任何一条从根到叶子的路径上各个节点着色方式的…