【OpenCV】告别人工目检:深度学习技术引领工业品缺陷检测新时代

news2025/1/20 5:44:24

目录

前言

机器视觉

缺陷检测

工业上常见缺陷检测方法

内容简介

作者简介

目录

读者对象

如何阅读本书

获取方式


前言

前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。 点击跳转到网站

机器视觉

机器视觉是使用各种工业相机,结合传感器跟电气信号实现替代传统人工,完成对象识别、计数、测量、缺陷检测、引导定位与抓取等任务。其中工业品的缺陷检测极大的依赖人工完成,特别是传统的3C制造环节,产品缺陷检测依赖于人眼睛来发现与检测,不仅费时费力还面临人员成本与工作时间等因素的制约。使用机器视觉来实现产品缺陷检测,可以节约大量时间跟人员成本,实现生产过程的自动化与流水线作业。
 

缺陷检测

常见得工业品缺陷主要包括划痕、脏污、缺失、凹坑、裂纹等,这些依赖人工目检(眼睛检测)的缺陷都可以通过机器视觉的缺陷检测算法来实现替代。当前工业缺陷检测算法目前主要分为两个方向,基于传统视觉的算法和基于深度学习的算法,前者主要依靠对检测目标的特征进行量化,比如颜色,形状,长宽,角度,面积等,好处是可解释性强、对样本数量没有要求、运行速度快,缺点是依赖于固定的光照成像,稍有改动就要改写程序重新部署,而且检测规则和算法跟开发者经验其主导作用。基于深度学习的缺陷检测算法刚好能弥补前者的不足之处,能够很好适应不同的光照,更好地适配同类缺陷要求,缺点是对样本数量有一定要求,对硬件配置相比传统也会有一定要求。

《OpenCV应用开发:入门、进阶与工程化实践》一书第十四 章 通过案例详细介绍基于OpenCV如何实现传统方式的缺陷检测跟基于深度学习的缺陷检测。
 

工业上常见缺陷检测方法

方法一:基于简单二值图像分析实现划痕提取,效果如下:

方法二:复杂背景下的图像缺陷分析,基于频域增强的方法实现缺陷检测,运行截图:

方法三:复杂背景下的图像缺陷分析,基于空域增强实现图像缺陷分析,针对复杂背景的图像,通过空域滤波增强以后实现缺陷查找,运行截图如下:

方法四:基于样品模板比对实现基于空域增强实现图像缺陷分析,通过二之分析与轮廓比对实现缺陷查找,运行截图如下:

方法五:基于深度学习UNet模型网络,实现裂纹与划痕检测,运行截图如下:

方法六:基于深度学习实例分割网络模型网络,实现细微缺陷检测,运行截图如下:

以上内容均来自最近出版的一本新书《OpenCV应用开发:入门、进阶与工程化实践》一书第十四章,分享给大家。

内容简介

本书专注于介绍OpenCV4在工业领域的常用模块,通过合理的章节设置构建了阶梯式的知识点学习路径。化繁就简、案例驱动,注重算法原理、代码演示及在相关场景的实际使用。本书还介绍了必备的深度学习知识与开发技巧,拓展OpenCV开发者技能。全书共16章,分为3篇。

  • 基础篇(第1~4章):主要介绍OpenCV的简单使用、像素操作、色彩空间、图像直方图。特色:从如何配置OpenCV开发环境开始到完成第一个OpenCV代码演示,从图像的表示到基本的像素操作,方便读者全面扎实地掌握基本图像处理知识与函数使用技巧,为深入学习打下坚实基础。
  • 进阶篇(第5~12章):主要介绍卷积操作、二值图像分析、形态学分析、特征提取、视频分析、机器学习、DNN。特色:结合代码演示学习OpenCV框架中主要图像处理模块的算法原理与相关函数使用,通过多个案例打通知识节点,学会使用OpenCV传统算法解决实际问题。
  • 高级与实战篇(第13~16章):主要介绍YOLO 5自定义对象检测、缺陷检测、OpenVINO加速与CUDA加速。特色:面向工程应用,帮助OpenCV开发者提升技能,通过实战案例增强OpenCV应用能力,掌握视觉开发必备的深度学习知识,以及从模型训练到部署加速的技巧。

作者简介

贾志刚

OpenVINO中文社区创始成员、英特尔物联网创新大使、华为晟腾HAE、51CTO学院金牌讲师。在机器视觉缺陷检测、生物医学细胞分类与检测识别、安防监控视频内容分析与提取、人工智能软件开发、深度学习框架集成开发等方面有深入研究,开发过多个图像处理算法模块并成功应用在医学检测与工业检测领域。开设有公众号“OpenCV学堂”,并著有《Java数字图像处理:编程技巧与应用实践》《OpenCV Android开发实战》等书。
张 振

上海赫立苏州研究院(赫芯科技)院长,具备丰富的机器视觉检测一线研发、管理与运营经验。深耕半导体/SMT缺陷检测领域10余年,拥有自主知识产权的软件和相关专利数十项。多年成功创业经历,积累了丰富的研发创新和团队管理经验,并参与市场与客户需求分析、技术分析与评估、方案制订、算法迭代、验收指标制定、标准机型量产的全流程管理与实践。
 

目录

前言

基础篇

第1章 OpenCV简介与安装 / 2

1.1 OpenCV简介 / 2

1.1.1 OpenCV历史 / 2

1.1.2 OpenCV的模块与功能 / 3

1.1.3 OpenCV4里程碑 / 4

1.1.4 OpenCV发展现状与

应用趋势 / 4

1.2 OpenCV源码项目 / 4

1.3 OpenCV4开发环境搭建 / 5

1.4 第一个OpenCV开发程序 / 6

1.5 图像加载与保存 / 7

1.5.1 加载图像 / 7

1.5.2 保存图像 / 8

1.6 加载视频 / 9

1.7 小结 / 12

第2章 Mat与像素操作 / 13

2.1 Mat对象 / 13

2.1.1 什么是Mat对象 / 13

2.1.2 一切图像皆Mat / 14

2.1.3 Mat类型与深度 / 15

2.1.4 创建Mat / 15

2.2 访问像素 / 18

2.2.1 遍历Mat中的像素 / 18

2.2.2 像素算术运算 / 20

2.2.3 位运算 / 21

2.2.4 调整图像亮度与对比度 / 22

2.3 图像类型与通道 / 23

2.3.1 图像类型 / 23

2.3.2 图像通道 / 23

2.3.3 通道操作 / 24

2.4 小结 / 25

第3章 色彩空间 / 26

3.1 RGB色彩空间 / 26

3.2 HSV色彩空间 / 28

3.3 LAB色彩空间 / 29

3.4 色彩空间的转换与应用 / 30

3.5 小结 / 31

第4章 图像直方图 / 32

4.1 像素统计信息 / 32

4.2 直方图的计算与绘制 / 34

4.2.1 直方图计算 / 35

4.2.2 直方图绘制 / 36

4.3 直方图均衡化 / 37

4.4 直方图比较 / 40

4.5 直方图反向投影 / 41

4.6 小结 / 43

进阶篇

第5章 卷积操作 / 46

5.1 卷积的概念 / 46

5.2 卷积模糊 / 49

5.3 自定义滤波 / 53

5.4 梯度提取 / 56

5.5 边缘发现 / 59

5.6 噪声与去噪 / 61

5.7 边缘保留滤波 / 64

5.8 锐化增强 / 66

5.9 小结 / 68

第6章 二值图像 / 70

6.1 图像阈值化分割 / 70

6.2 全局阈值计算 / 72

6.3 自适应阈值计算 / 76

6.4 去噪与二值化 / 77

6.4.1 去噪对二值化的影响 / 77

6.4.2 其他方式的二值化 / 78

6.5 小结 / 79

第7章 二值分析 / 80

7.1 二值图像分析概述 / 80

7.2 连通组件标记 / 82

7.3 轮廓发现 / 85

7.3.1 轮廓发现函数 / 85

7.3.2 轮廓绘制函数 / 87

7.3.3 轮廓发现与绘制的示例

代码 / 87

7.4 轮廓测量 / 88

7.5 拟合与逼近 / 90

7.6 轮廓分析 / 95

7.7 直线检测 / 97

7.8 霍夫圆检测 / 99

7.9 最大内接圆与最小外接圆 / 101

7.10 轮廓匹配 / 102

7.11 最大轮廓与关键点编码 / 104

7.12 凸包检测 / 106

7.13 小结 / 107

第8章 形态学分析 / 108

8.1 图像形态学概述 / 108

8.2 膨胀与腐蚀 / 109

8.3 开/闭操作 / 111

8.4 形态学梯度 / 113

8.5 顶帽与黑帽 / 115

8.6 击中/击不中 / 116

8.7 结构元素 / 119

8.8 距离变换 / 120

8.9 分水岭分割 / 121

8.10 小结 / 124

第9章 特征提取 / 125

9.1 图像金字塔 / 125

9.1.1 高斯金字塔 / 125

9.1.2 拉普拉斯金字塔 / 128

9.1.3 图像金字塔融合 / 129

9.2 Harris角点检测 / 131

9.3 shi-tomas角点检测 / 133

9.4 亚像素级别的角点检测 / 135

9.5 HOG特征与使用 / 137

9.5.1 HOG特征描述子 / 137

9.5.2 HOG特征行人检测 / 139

9.6 ORB特征描述子 / 140

9.6.1 关键点与描述子提取 / 140

9.6.2 描述子匹配 / 144

9.7 基于特征的对象检测 / 148

9.7.1 单应性矩阵计算方法 / 148

9.7.2 特征对象的位置发现 / 150

9.8 小结 / 152

第10章 视频分析 / 153

10.1 基于颜色的对象跟踪 / 153

10.2 视频背景分析 / 155

10.3 帧差法背景分析 / 157

10.4 稀疏光流分析法 / 158

10.5 稠密光流分析法 / 161

10.6 均值迁移分析 / 163

10.7 小结 / 166

第11章 机器学习 / 167

11.1 KMeans分类 / 167

11.1.1 KMeans图像语义

分割 / 167

11.1.2 提取主色彩构建色卡 / 170

11.2 KNN分类 / 172

11.2.1 KNN函数支持 / 172

11.2.2 KNN实现手写数字

识别 / 173

11.3 SVM分类 / 175

11.3.1 SVM的原理与分类 / 175

11.3.2 SVM函数 / 176

11.3.3 SVM实现手写数字

识别 / 176

11.4 SVM与HOG实现对象检测 / 177

11.4.1 数据样本特征提取 / 178

11.4.2 SVM特征分类 / 179

11.4.3 构建SVM对象检测器 / 179

11.5 小结 / 181

第12章 深度神经网络 / 182

12.1 DNN概述 / 182

12.2 图像分类 / 183

12.3 对象检测 / 186

12.3.1 SSD对象检测 / 187

12.3.2 Faster-RCNN对象

检测 / 188

12.3.3 YOLO对象检测 / 190

12.4 ENet图像语义分割 / 193

12.5 风格迁移 / 195

12.6 场景文字检测 / 197

12.7 人脸检测 / 199

12.8 小结 / 201

高级与实战篇

第13章 YOLO 5自定义对象

检测 / 204

13.1 YOLO 5对象检测框架 / 204

13.2 YOLO 5对象检测 / 205

13.3 自定义对象检测 / 208

13.3.1 数据集制作与生成 / 209

13.3.2 模型训练与查看损失

曲线 / 210

13.3.3 模型导出与部署 / 211

13.4 小结 / 212

第14章 缺陷检测 / 213

14.1 简单背景下的缺陷检测 / 213

14.2 复杂背景下的缺陷检测 / 216

14.2.1 频域增强的缺陷检测 / 216

14.2.2 空间域增强的缺陷检测 / 219

14.3 案例:刀片缺陷检测 / 220

14.4 基于深度学习的缺陷检测 / 222

14.4.1 基于分类的缺陷检测 / 223

14.4.2 基于分割的缺陷检测 / 226

14.5 小结 / 228

第15章 OpenVINO加速 / 229

15.1 OpenVINO框架安装与环境

配置 / 229

15.1.1 OpenVINO安装 / 230

15.1.2 配置C++开发支持 / 232

15.2 OpenVINO2022.x版SDK

推理演示 / 233

15.2.1 推理SDK介绍 / 234

15.2.2 推理SDK演示 / 235

15.3 OpenVINO支持UNet部署 / 236

15.4 OpenVINO支持YOLO 5

部署 / 237

15.5 小结 / 239

第16章 CUDA加速 / 240

16.1 编译OpenCV源码支持CUDA

加速 / 240

16.2 用CUDA加速传统图像处理 / 245

16.2.1 Mat与GpuMat / 245

16.2.2 加速图像处理与视频

分析 / 246

16.3 加速DNN / 248

16.4 小结 / 249

读者对象

本书适合以下读者阅读:

  • 计算机视觉领域的从业者。
  • OpenCV的爱好者。
  • 高等院校相关专业的师生。
  • C++/Python开发者。

如何阅读本书

本书共16章,分为3篇,由浅入深地讲解OpenCV的技术及应用。
基础篇(第1~4章)主要介绍了OpenCV4框架中基础模块相关的图像知识、函数及应用。
进阶篇(第5~12章)深入介绍了OpenCV4核心模块的功能与应用场景,主要包括图像卷积、二值分析、形态学分析、特征提取、视频分析、机器学习模块等,其中穿插大量实践案例。
高级与实战篇(第13~16章)全面介绍了OpenCV4支持的各种性能加速技术与深度学习模型推理技术,从项目实现出发,讲解了对象检测、缺陷检测、深度学习模型加速等高级应用层面的OpenCV开发技术。
 

获取方式

京东图书:《OpenCV4应用开发:入门、进阶与工程化实践》(贾志刚,张振)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1339827.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

深入探索MongoDB集群模式:从高可用复制集

MongoDB复制集概述 MongoDB复制集主要用于实现服务的高可用性,与Redis中的哨兵模式相似。它的核心作用是数据的备份和故障转移。 复制集的主要功能 数据复制:数据写入主节点(Primary)时,自动复制到一个或多个副本节…

Flask 日志

flask 日志 代码源码源自编程浪子flask点餐小程序代码 记录用户访问日志 和 错误日志 这段代码是一个基于Flask框架的日志服务类,用于 记录用户访问日志 和 错误日志。代码中定义了一个名为LogService的类,其中包含了两个静态方法:addAcc…

Spring Boot 中的虚拟线程

在本文中,我将讨论 Spring Boot 中的虚拟线程。 什么是虚拟线程? 虚拟线程作为 Java 中的一项功能引入,旨在简化并发性。 Virtual threads 是 轻量级的线程,由 Java Virtual Machine 而不是操作系统管理。它们被设计为易于使用且…

Linux下安装QQ

安装步骤: 1.进入官网:QQ Linux版-轻松做自己 2.选择版本:X86版下载dep 3安装qq 找到qq安装包位置,然后右击在终端打开输入安装命令,然后点击回车 sudo dpkg -i linuxqq_3.2.0-16736_amd64.deb 卸载qq 使用命令…

游泳耳机哪个牌子好,盘点2024最值得购买的游泳耳机

一款好的游泳耳机能让你在水中尽情畅游,同时享受到美妙的音乐。在选购游泳耳机时,防水性能、音质、舒适度和续航能力是至关重要的因素。接下来,我将为你介绍几款在这些方面都有出色表现的游泳耳机。 1. 南卡骨传导耳机 推荐理由&#xff1a…

软件测试/测试开发丨Pytest测试用例生命周期管理-Fixture

1、Fixture 用法 Fixture 特点及优势 1、命令灵活:对于 setup,teardown,可以不起这两个名字2、数据共享:在 conftest.py 配置⾥写⽅法可以实现数据共享,不需要 import 导⼊。可以跨⽂件共享3、scope 的层次及…

图像处理-周期噪声

周期噪声 对于具有周期性的噪声被称为周期噪声,其中周期噪声在频率域会出现关于中心对称的性质,如下图所示 带阻滤波器 为了消除周期性噪声,由此设计了几种常见的滤波器,其中 W W W表示带阻滤波器的带宽 理想带阻滤波器 H ( u …

SNP Glue新Saas技术在云数据集成中如何提升客户价值

■ 新Glue版本可作为软件即服务(SaaS)应用程序使用 ■ SAP数据和非SAP数据源之间的云原生集成大大简化了客户的企业数据集成 ■ SNP Glue通过应对AI和大数据计划中的关键挑战来增强云数据集成的价值 德国,海德堡 —— 2023年11月29日,作为SAP环境中数…

Linux内核定时器-模块导出符号表

Linux内核定时器 定时器的当前时间如何获取? jiffies:内核时钟节拍数 jiffies是在板子上电这一刻开始计数,只要 板子不断电,这个值一直在增加(64位)。在 驱动代码中直接使用即可。 定时器加1代表走了多长时间&#xff…

javaEE -19(9000 字 JavaScript入门 - 4)

一: jQuery jQuery是一个快速、小巧且功能丰富的JavaScript库。它旨在简化HTML文档遍历、事件处理、动画效果以及与后端服务器的交互等操作。通过使用jQuery,开发者可以以更简洁、更高效的方式来编写JavaScript代码。 jQuery提供了许多易于使用的方法和…

腾讯云轻量应用服务器优缺点介绍

腾讯云轻量应用服务器开箱即用、运维简单的轻量级云服务器,CPU内存带宽配置高并且价格特别优惠,轻量2核2G3M带宽62元一年、2核2G4M优惠价118元一年,540元三年、2核4G5M带宽218元一年,756元3年、4核8G12M带宽646元15个月等&#xf…

【 C语言 】 | C程序百例

【 C语言 】 | C程序百例 时间:2023年12月28日13:50:43 文章目录 【 C语言 】 | C程序百例1.参考2.练习 1.参考 1.【 C语言 】 | C程序百例-CSDN博客 2.100Example: C程序百例-酷勤网(kuqin.com)提供.pdf (gitee.com) 3.cProgram/LinuxC - 码…

[JS设计模式] Module Pattern

随着应用程序和代码库的增长,保持代码的可维护性和模块化变得越来越重要。模块模式允许将代码分成更小的、可重用的部分。 除了能够将代码分割成更小的可重用部分之外,模块还允许将文件中的某些值保留为私有。默认情况下,模块内的声明范围(封…

Qt编写的exe程序上添加程序信息

1、qtcreator编写 在pro文件中添加如下信息 # 版本信息 VERSION 4.0.2.666# 图标 RC_ICONS Images/MyApp.ico# 公司名称 QMAKE_TARGET_COMPANY "Digia"# 产品名称 QMAKE_TARGET_PRODUCT "Qt Creator"# 文件说明 QMAKE_TARGET_DESCRIPTION "Qt …

Android : 画布的使用 简单应用

示例图: MyView.java: package com.example.demo;import android.content.Context; import android.graphics.BitmapFactory; import android.graphics.Canvas; import android.graphics.Color; import android.graphics.Paint; import android.view.Vi…

node-red:modbus协议数据格式转换

node-red:MODBUS协议数据格式转换 一、32word无符号转换1.1 写操作1.2 读操作 二、字符串转换2.1 字符串写操作2.2 字符串读操作 三、有符号整数转换3.1 有符号16word转换3.1.1 负数 读 操作3.1.2 负数 写 操作 3.2 有符号32word转换 源码 本文将描述通过node-red采…

2024年【北京市安全员-B证】证考试及北京市安全员-B证模拟考试题库

题库来源:安全生产模拟考试一点通公众号小程序 2024年【北京市安全员-B证】证考试及北京市安全员-B证模拟考试题库,包含北京市安全员-B证证考试答案和解析及北京市安全员-B证模拟考试题库练习。安全生产模拟考试一点通结合国家北京市安全员-B证考试最新…

本地部署 text-generation-webui

本地部署 text-generation-webui 0. 背景1. text-generation-webui 介绍2. 克隆代码3. 创建虚拟环境4. 安装 pytorch5. 安装 CUDA 运行时库6. 安装依赖库7. 启动 Web UI8. 访问 Web UI9. OpenAI 兼容 API 0. 背景 一直喜欢用 FastChat 本地部署大语言模型,今天试一…

GitOps实践指南:GitOps能为我们带来什么?

Git,作为开发过程中的核心工具,提供了强大的版本控制功能。即便在写代码的时候稍微手抖一下,我们也能通过 Git 的差异对比(diff)轻松追踪到庞大工程中的问题,确保代码的准确与可靠。这种无与伦比的自省能力…

python如何通过日志分析加入黑名单

python通过日志分析加入黑名单 监控nginx日志,若有人攻击,则加入黑名单,操作步骤如下: 1.读取日志文件 2.分隔文件,取出ip 3.将取出的ip放入list,然后判读ip的次数 4.若超过设定的次数,则加…