基于深度学习的瓷砖色差分类方法研究——学习笔记(评价:色差的定义太模糊。。。问题描述不清楚,太水了)

news2024/9/28 5:34:10

文章目录

  • 摘要
  • 0 引言
  • 1 瓷砖图像处理
    • 1.1 图像采集
    • 1.2 图像处理
  • 2 基于深度学习的瓷砖色差分类算法设计
    • 2.1 数据预处理
    • 2.2 卷积神经网络的设计
    • 2.3 实验设计
  • 3 瓷砖色差分类平台的设计与实现

在这里插入图片描述

摘要

瓷砖是人类建筑不可或缺的一种材料,而瓷砖品质最重要的指标之一就是色差,一批瓷砖中色差越小,品级越高。目前企业主要是由熟练工人在特定的光照及距离条件下进行筛查,劳动强度大并且效率低,没有固定的判断标准。因此提出利用基于深度学习算法的视觉检测系统代替人工进行瓷砖色差分类,**首先,经过数字图像处理算法对采集的瓷砖图像进行预处理,将瓷砖本体从背景中分割出来 ;然后,利用卷积神经网络分别提取具有色差的两类瓷砖特征,通过监督学习实现瓷砖的色差分类 ;最后,设计了图形用户界面将上述所有图像处理算法及分类算法进行实现,开发可视化人机交互式操作和分类结果显示系统。**实验结果表明 :基于深度学习的视觉检测系统能够在瓷砖色差分类任务上实现准确分类,且分类效率高、分类结果可视化,具有重要的应用价值

0 引言

在这里插入图片描述
瓷砖的色差指瓷砖间的色泽差异,包含颜色与光泽间的总体差别。传统瓷砖色差分类工作主要通过熟练工人用肉眼对同一批烧制的同类瓷砖来进行差异化区分 [1],且工人们需在特定光线环境下和一定距离内进行观察与对比,从而确定瓷砖的等级与色号 [2]。这种检测工作对检测人员的经验要求高,且工作强度大。与此同时传统瓷砖行业通过人工对瓷砖进行分色,其精度与效率已不能满足愈发增长的生产规模和对瓷砖品级区分精度的要求。因此可以采取基于机器视觉的方法,以机器代替人眼来进行瓷砖色差分类工作。

基于深度学习 [3] 的机器视觉系统首先在生产线采集数字瓷砖图像,然后用数字图像处理算法对原始数据进行预处理 [4] 与图像分割,进而采用基于深度学习的卷积神经网络算法 [5] 实现对具有色差的瓷砖图像间的分类分色,最后通过图形用户界面将瓷砖图像预处理及图像分割结果以及分类结果可视化。最后,将该系统应用于实际的瓷砖生产线下的色差分类任务,证明算法的有效性。

1 瓷砖图像处理

1.1 图像采集

在这里插入图片描述

1.2 图像处理

在这里插入图片描述
在这里插入图片描述
降噪处理 :对于实地采集的瓷砖图像来说,一般图像尺寸巨大,噪声鲜有肉眼能直接看到的,但这些噪声都是实实在在存在的。常见的图像噪声包括高斯噪声 [7]、瑞利噪声、伽马噪声以及椒盐(脉冲)噪声,其中椒盐噪声其与图像信号强度对比明显,对图像
污染较大,因而在原始图像中较为明显 [8]。本文采用中值滤波算法去除数字瓷砖图像中的椒盐噪声,如图3(a) 所示。
在这里插入图片描述
灰度化处理 [9] :为了方便计算机程序对数字图像的操作,并且简化图像分割时的计算量,本文在图像分割前对降噪后的数字图像做灰度化处理,灰度化处理后如图 3(b) 所示。二值化处理 :为了更好地让瓷砖与原始图像的背景相区分,对瓷砖的灰度图做进一步的二值化处理。本文采用基于阈值的二值化方法,即设置一个阈值 n,将输入的灰度图像中灰度值 f(x,y) ≥ n的点的灰度值设置为 255,并将这些点称为对象点 [10] ;其他的点之灰度值则设置为 0,这些点称为背景点。该算法的计算公式如(1)所示 :
在这里插入图片描述
式中 f(x,y) 为灰度图像素值,g(x,y) 为二值化后的新图像像素值 [11]。由于原始图像的前景与背景对比较为强烈,本文选用双峰法确定阈值。首先计算出灰度化后的图像的灰度直方图,如图 3© 所示。将两个主要的波峰之间的最低谷作为前景与后景之间的分界线,由于摄像头位于同一位置,所有瓷砖的背景相同,且此处阈值的选取精度要求不高,还需要后续处理,因此选取 100 作为二值化处理时的阈值。二值化处理后的瓷砖图像如图3(d),可以看出图中的噪声明显减少,并且瓷砖整体更加清晰突出。

形态学操作 :利用形态学的开操作去除流水线背景中的支架结构对二值图中瓷砖图像的污染以及其他一些微小的噪声 [12]。实验效果如图 4 所示,此时的二值图中基本上只存在形状接近矩形的残缺瓷砖。

基于透视变换的图像分割 :将形态学运算后的图像用轮廓检测算法得到轮廓集,并求出其中面积最大一个轮廓作为瓷砖轮廓,之后求出瓷砖轮廓最小外接矩形作为最终需要从原始图像中分割出来的瓷砖图像本身。这里使用的最小外接矩形算法为用主成分分析法(PCA)求出轮廓的主方向向量,进而得到轮廓的长宽,最小外接矩形的轮廓(绿色)如图 5。
在这里插入图片描述

已求出瓷砖最小外接矩形,由这个矩形的四个角点坐标进行透视变换,使瓷砖图像投影为规整的矩形并平行于转换后完整图像的长宽,最后将此新矩形按角点坐标从转换后完整图像中裁剪出来,如图 6 所示。
在这里插入图片描述

2 基于深度学习的瓷砖色差分类算法设计

2.1 数据预处理

在这里插入图片描述
为了减小输入卷积神经网络的数据量,将分割好的图像的尺寸缩小为 227×227 的标准尺寸,并且由于数据集本身样本数量不多,需对数据集进行扩充,从而使训练出的模型具有更好的泛化能力,防止神经网络算法可能产生的过拟合现象,本文使用旋转和水平翻转作为数据增广的方法 [13]。为了训练神经网络模型并测试其分类精度,本文将数据集划分为训练集和测试集。并为了保证数据集中不同种类分布的均一性,从两个色号中分别选取 80% 作为训练集,用于网络的特征学习,将两种色号分别剩下的 20% 作为测试集用于测试每次训练完成之后的模型分类效果。

2.2 卷积神经网络的设计

在这里插入图片描述
ResNet[14] 的提出就是为了解决深度学习网络随着层数的加深而导致的梯度消失使得网络学习停滞的问题,其巧妙地运用恒等映射并通过快捷连接将其赋予上一模块的输入,从而使得每一层梯度不可能为零,使得每一层的参数可以不断地更新学习下去而不会停滞,使得超深层网络可以实现更加深入的学习 [15]

文 献 中 介 绍 了 18/34/50/101/152 等 多 种 层 数的 ResNet 模 型, 实 验 使 用 的 是 具 有 18 层 结 构 的ResNet18 模型 [16]。对网络进行训练的损失函数选择交叉熵函数,优化算法选择 Adam 算法,并在网络中间引入 Batch Normalization 层防止网络的过拟合 [16]。

2.3 实验设计

在这里插入图片描述
超参数是指与数据集无关,只与模型结构相关需在训练之前设定好的参数,主要包括数据集训练周期(epoch)、批量大小(batch size)、优化器的学习率(learning rate)[17]。在上述瓷砖数据集上设定训练周期为 50,批量大小恒定为 64,再分别设定大小为 0.01、0.001、0.0001 的初始学习率进行训练。

如图 7 至图 9 所示,在训练前期,前两者验证模型时准确率波动更大,分析认为这是由于样本数据集不够庞大,两种色差数据较为相似,较高的学习率导致网络的权值与偏置在优化过程中变化过大,导致输出的预测分布无法稳定,但随着损失值逐渐减小,训练集与测试集最终准确率都达到 100% 而实现收敛。

在这里插入图片描述

3 瓷砖色差分类平台的设计与实现

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
之后我会持续更新,如果喜欢我的文章,请记得一键三连哦,点赞关注收藏,你的每一个赞每一份关注每一次收藏都将是我前进路上的无限动力 !!!↖(▔▽▔)↗感谢支持!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1334123.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

为什么要出现并发?并发的三要素

大家好,我是"java继父"伯约,假如这篇对大家有帮助的话求一个赞,另外文章末尾放了我从小白到架构师多年的学习资料。 1.为什么需要多线程 众所周知,CPU、内存、I/O 设备的速度是有极大差异的,为了合理利用 C…

一个利用摸鱼时间背单词的软件

大家好,我是 Java陈序员。 最近进入了考试季,各种考试,英语四六级、考研、期末考等。不知道大家的英语四六级成绩怎么样呢? 记得大学时,英语四级都是靠高中学习积累的老本才勉强过关。 而六级则是考了多次&#xff…

cesium实现二三维联动

记录项目中实现二三维地图联动 效果如下&#xff1a; 第一步&#xff1a;现在页面中加载二三维地图&#xff08;地图的初始化已省略&#xff09; <template><div><div><button click"show">二三维联动</button></div><div&…

【Datawhale 大模型基础】第十一章 环境影响

第十一章 环境影响 This blog is based on datawhale files and a paper. The initial consideration revolves around the potential positive or negative direct impact on the environment. Other transformative technological advancements, like the metaverse, are li…

Redis-实践知识

转自极客时间Redis 亚风 原文视频&#xff1a;https://u.geekbang.org/lesson/535?article681062 Redis最佳实践 普通KEY Redis 的key虽然可以自定义&#xff0c;但是最好遵循下面几个实践的约定&#xff1a; 格式&#xff1a;[业务名称]:[数据名]:[id] 长度不超过44字节 不…

C语言蛇形矩阵

文章目录 每日一言题目解题思路全部代码结语 每日一言 山有榛&#xff0c;隰有苓。云谁之思&#xff1f;西方美人。 --邶风简兮 题目 解题思路 话不多说&#xff0c;直接看图 通过观察图表&#xff0c;我想到了这种方法&#xff1a; 我将数字放置的位置分为两大类&#xff…

VMware虚拟机的安装配置

目录 一. VMware虚拟机的安装 二. VMware配置虚拟机 三. VMware安装windows server 2012 一. VMware虚拟机的安装 1. 双击安装&#xff0c;点击下一步 2. 勾选接受许可&#xff0c;点击下一步 3. 选择安装位置&#xff0c;点击下一步 4. 用户体验设置&#xff08;可选&#…

Matlab仿真2ASK/OOK、2FSK、2PSK、QPSK、4QAM在加性高斯白噪声信道中的误码率与归一化信噪比的关系

本文为学习所用&#xff0c;严禁转载。 本文参考链接 https://zhuanlan.zhihu.com/p/667382398 QPSK代码及高斯白噪声如何产生 https://ww2.mathworks.cn/help/signal/ref/butter.html 滤波器 https://www.python100.com/html/4LEF79KQK398.html 低通滤波器 本实验使用matlab仿…

LeetCode刷题--- 字母大小写全排列

个人主页&#xff1a;元清加油_【C】,【C语言】,【数据结构与算法】-CSDN博客 个人专栏 力扣递归算法题 http://t.csdnimg.cn/yUl2I 【C】 http://t.csdnimg.cn/6AbpV 数据结构与算法 http://t.csdnimg.cn/hKh2l 前言&#xff1a;这个专栏主要讲述递归递归、搜索与回…

磁钢的取向和充磁方向

充磁是磁钢生产中的必备工序&#xff0c;如果磁铁不充磁&#xff0c;就不具备磁性&#xff0c;也就丧失了作为永磁材料的基本功能。磁钢作为一个立体的工件&#xff0c;形状和尺寸各异&#xff0c;如何给磁钢充磁&#xff1f;不同方向的充磁效果一样吗&#xff1f;今天我们就来…

Spring源码分析---Bean 的生命周期 03

来源&#xff1a;Spring 3. Bean 的生命周期 自定义一个 SpringBoot 的主启动类&#xff1a; SpringBootApplication public class A03Application {public static void main(String[] args) {ConfigurableApplicationContext context SpringApplication.run(A03Applicatio…

什么牌子国产主食冻干猫粮好?十大放心猫粮国产名单前五名推荐

很多新手铲屎官在为自家猫咪购买猫食品时&#xff0c;都会非常注重成分和安全性。养了这么多年的猫&#xff0c;可以说&#xff0c;他们购买过的猫食品数量一定比大多数人都要多。自从冻干猫粮流行起来之后&#xff0c;很多铲屎官都开始给自家的猫咪喂冻干。冻干不仅可以作为主…

视觉学习(3) —— 使用调试助手与视觉连接

Modbus Slave 进入之后 点击进入 OK后 此处就代表完成&#xff0c;若是没有连接完成就如下图 回到视觉 将视觉参数设置好后&#xff0c;回到Modbus Slave&#xff0c;点击进行连接

postman的下载安装和使用

第一章、使用postman向后端发送请求 1.2&#xff09;postman下载与安装使用 我的百度网盘postman点击下载 提取码&#xff1a;bybp 下载后双击.exe文件直接安装 点击此次创建集合 点击此处创建请求 1.2&#xff09;发送get请求 选择自己的请求方式&#xff0c;输入请求…

vue3 配置 @符号

config,ts 配置 有 爆红 安装 npm install 一下 然后 配置 路径提示功能 tsconfig.json 配置 路径提示功能 一共这两个路径配置

【Linux系统基础】(5)在Linux上集群化环境前置准备及部署Zookeeper、Kafka软件详细教程

集群化环境前置准备 介绍 在前面&#xff0c;我们所学习安装的软件&#xff0c;都是以单机模式运行的。 后续&#xff0c;我们将要学习大数据相关的软件部署&#xff0c;所以后续我们所安装的软件服务&#xff0c;大多数都是以集群化&#xff08;多台服务器共同工作&#xf…

小天使的小难题:新生儿疝气的关注与温馨呵护

引言&#xff1a; 新生儿疝气是一种在出生后可能出现的常见情况&#xff0c;虽然通常不会造成长期影响&#xff0c;但对于家长而言&#xff0c;了解如何正确应对新生儿疝气是至关重要的。本文将深入探讨新生儿疝气的原因、症状&#xff0c;以及家长在面对这一问题时应该采取的…

(Matlab)基于CNN-LSTM的多维回归预测(卷积神经网络-长短期记忆网络)

目录 一、程序及算法内容介绍&#xff1a; 基本内容&#xff1a; 亮点与优势&#xff1a; 二、代码实际运行效果&#xff1a; 三、部分代码展示&#xff1a; 四、本文完整代码数据分享&#xff1a; 一、程序及算法内容介绍&#xff1a; 基本内容&#xff1a; 本代码基于…

怎么录音频?掌握这些技巧是关键

“有什么好用的录音频方法吗&#xff1f;参加了学校社团组织的歌手大赛&#xff0c;需要录制一段个人演唱的歌曲&#xff0c;用来参加初赛&#xff0c;可是我不会录制音频&#xff0c;眼看提交作品的时间快要截止了&#xff0c;想来求助一下大家。” 录制音频已经成为人们日常…

Mendelson AS2 介绍下载和配置

最近与一家国外公司做EDI对接&#xff0c;并且EDI通讯工具是基于AS2协议的。目前开源的as2的开源项目有openas2,Mendelson AS2&#xff0c;和国人写的freeas2但是&#xff0c;现在freeas2已经被从开源中国不能下载了&#xff0c;变为收费的版本了。 如果你需要使用基于AS2协议…