Lesson3-4:OpenCV图像处理---边缘检测

news2025/1/11 22:58:26

学习目标

  • 了解Sobel算子,Scharr算子和拉普拉斯算子
  • 掌握canny边缘检测的原理及应用

1 原理

边缘检测是图像处理和计算机视觉中的基本问题,边缘检测的目的是标识数字图像中亮度变化明显的点。图像属性中的显著变化通常反映了属性的重要事件和变化。边缘的表现形式如下图所示:
在这里插入图片描述
图像边缘检测大幅度地减少了数据量,并且剔除了可以认为不相关的信息,保留了图像重要的结构属性。有许多方法用于边缘检测,它们的绝大部分可以划分为两类:基于搜索和基于零穿越。

  • 基于搜索:通过寻找图像一阶导数中的最大值来检测边界,然后利用计算结果估计边缘的局部方向,通常采用梯度的方向,并利用此方向找到局部梯度模的最大值,代表算法是Sobel算子和Scharr算子。
    在这里插入图片描述
  • 基于零穿越:通过寻找图像二阶导数零穿越来寻找边界,代表算法是Laplacian算子。

在这里插入图片描述

2 Sobel检测算子

Sobel边缘检测算法比较简单,实际应用中效率比canny边缘检测效率要高,但是边缘不如Canny检测的准确,但是很多实际应用的场合,sobel边缘却是首选,Sobel算子是高斯平滑与微分操作的结合体,所以其抗噪声能力很强,用途较多。尤其是效率要求较高,而对细纹理不太关心的时候。

2.1 方法

对于不连续的函数,一阶导数可以写作:
f ​′​​ ( x ) = f ( x ) − f ( x − 1 ) {f^{​′ ​​}(x)=f(x) - f(x - 1)} f​′​​(x)=f(x)f(x1)


f ​′​​ ( x ) = f ( x + 1 ) − f ( x ) {f^{​′ ​​}(x)=f(x + 1) - f(x )} f​′​​(x)=f(x+1)f(x)

所以有

f ​′​​ ( x ) = f ( x + 1 ) − f ( x − 1 ) 2 f^{​′ ​​}(x)=\frac{f(x + 1) - f(x -1)}{2} f​′​​x=2f(x+1)f(x1)

假设要处理的图像为I,在两个方向求导:

  • 水平变化: 将图像I 与奇数大小的模版进行卷积,结果为 G ​ x G​_{x} Gx​​ 。比如,当模板大小为3时, G ​ x G​_{x} Gx为:
    G ​ x = [ − 1 0 + 1 − 2 0 + 2 − 1 0 + 1 ] ∗ I G​_{x}= \begin{bmatrix} -1 & 0 & +1\\ -2 & 0 & +2\\ -1 & 0 & +1 \end{bmatrix}*I Gx= 121000+1+2+1 I
  • 垂直变化: 将图像I 与奇数大小的模版进行卷积,结果为 G ​ y G​_{y} Gy​​ 。比如,当模板大小为3时,
    G ​ y G​_{y} Gy为:
    G ​ y = [ − 1 − 2 + 1 0 0 0 + 1 + 2 + 1 ] ∗ I G​_{y}= \begin{bmatrix} -1 & -2 & +1\\ 0 & 0 & 0\\ +1 &+2 & +1 \end{bmatrix}*I Gy= 10+120+2+10+1 I
    在图像的每一点,结合以上两个结果求出:

G = G x 2 + G y 2 G = \sqrt{G^{2}_{x}+G^{2}_{y}} G=Gx2+Gy2

统计极大值所在的位置,就是图像的边缘。

注意:当内核大小为3时, 以上Sobel内核可能产生比较明显的误差, 为解决这一问题,我们使用Scharr函数,但该函数仅作用于大小为3的内核。该函数的运算与Sobel函数一样快,但结果却更加精确,其计算方法为:
G ​ x = [ − 3 0 + 3 − 10 0 + 10 − 3 0 + 3 ] ∗ I G​_{x}= \begin{bmatrix} -3 & 0 & +3\\ -10 & 0 & +10\\ -3 & 0 & +3\\ \end{bmatrix}*I Gx= 3103000+3+10+3 I
G ​ y = [ − 3 − 10 + 3 0 0 0 + 3 + 10 + 3 ] ∗ I G​_{y}= \begin{bmatrix} -3 & -10 & +3\\ 0 & 0 & 0\\ +3 & +10& +3\\ \end{bmatrix}*I Gy= 30+3100+10+30+3 I

2.2 应用

利用OpenCV进行sobel边缘检测的API是:

Sobel_x_or_y = cv2.Sobel(src, ddepth, dx, dy, dst, ksize, scale, delta, borderType)

参数:

  • src:传入的图像

  • ddepth: 图像的深度

  • dxdy: 指求导的阶数,0表示这个方向上没有求导,取值为01

  • ksize: 是Sobel算子的大小,即卷积核的大小,必须为奇数1357,默认为3
    注意:如果ksize=-1,就演变成为3x3的Scharr算子。

  • scale:缩放导数的比例常数,默认情况为没有伸缩系数。

  • borderType:图像边界的模式,默认值为cv2.BORDER_DEFAULT

Sobel函数求完导数后会有负值,还有会大于255的值。而原图像是uint8,即8位无符号数,所以Sobel建立的图像位数不够,会有截断。因此要使用16位有符号的数据类型,即cv2.CV_16S。处理完图像后,再使用cv2.convertScaleAbs()函数将其转回原来的uint8格式,否则图像无法显示。

Sobel算子是在两个方向计算的,最后还需要用cv2.addWeighted( )函数将其组合起来

Scale_abs = cv2.convertScaleAbs(x)  # 格式转换函数
result = cv2.addWeighted(src1, alpha, src2, beta) # 图像混合

示例:

import cv2 as cv
import numpy as np
from matplotlib import pyplot as plt
# 1 读取图像
img = cv.imread('./image/horse.jpg',0)
# 2 计算Sobel卷积结果
x = cv.Sobel(img, cv.CV_16S, 1, 0)
y = cv.Sobel(img, cv.CV_16S, 0, 1)
# 3 将数据进行转换
Scale_absX = cv.convertScaleAbs(x)  # convert 转换  scale 缩放
Scale_absY = cv.convertScaleAbs(y)
# 4 结果合成
result = cv.addWeighted(Scale_absX, 0.5, Scale_absY, 0.5, 0)
# 5 图像显示
plt.figure(figsize=(10,8),dpi=100)
plt.subplot(121),plt.imshow(img,cmap=plt.cm.gray),plt.title('原图')
plt.xticks([]), plt.yticks([])
plt.subplot(122),plt.imshow(result,cmap = plt.cm.gray),plt.title('Sobel滤波后结果')
plt.xticks([]), plt.yticks([])
plt.show()

在这里插入图片描述
将上述代码中计算sobel算子的部分中将ksize设为-1,就是利用Scharr进行边缘检测。

x = cv.Sobel(img, cv.CV_16S, 1, 0, ksize = -1)
y = cv.Sobel(img, cv.CV_16S, 0, 1, ksize = -1)

在这里插入图片描述

3 Laplacian算子

Laplacian是利用二阶导数来检测边缘 。 因为图像是 “2维”, 我们需要在两个方向求导,如下式所示:
Δ s r c = ∂ 2 s r c ∂ x 2 + ∂ 2 s r c ∂ y 2 Δsrc =\frac{∂^{2}src}{∂x^{2}}+ \frac{∂^{2}src}{∂y^{2}} Δsrc=x22src+y22src
那不连续函数的二阶导数是:

f ′′​​ ( x ) = f ′ ( x + 1 ) − f ′ ( x ) = f ( x + 1 ) + f ( x − 1 ) − 2 f ( x ) f^{′′ ​​}(x) = f^{′}(x+1)- f^{′}(x)=f(x+1)+f(x-1)-2f(x) f′′​​(x)=f(x+1)f(x)=f(x+1)+f(x1)2f(x)

那使用的卷积核是:

k e r n e l = [ 0 1 0 1 − 4 1 0 1 0 ] kernel= \begin{bmatrix} 0& 1 & 0\\ 1 & -4 & 1\\ 0 & 1& 0\\ \end{bmatrix} kernel= 010141010
API:

laplacian = cv2.Laplacian(src, ddepth[, dst[, ksize[, scale[, delta[, borderType]]]]])

参数:

  • Src: 需要处理的图像,
  • Ddepth: 图像的深度,-1表示采用的是原图像相同的深度,目标图像的深度必须大于等于原图像的深度;
  • ksize:算子的大小,即卷积核的大小,必须为1,3,5,7

示例:

import cv2 as cv
import numpy as np
from matplotlib import pyplot as plt
# 1 读取图像
img = cv.imread('./image/horse.jpg',0)
# 2 laplacian转换
result = cv.Laplacian(img,cv.CV_16S)
Scale_abs = cv.convertScaleAbs(result)
# 3 图像展示
plt.figure(figsize=(10,8),dpi=100)
plt.subplot(121),plt.imshow(img,cmap=plt.cm.gray),plt.title('原图')
plt.xticks([]), plt.yticks([])
plt.subplot(122),plt.imshow(Scale_abs,cmap = plt.cm.gray),plt.title('Laplacian检测后结果')
plt.xticks([]), plt.yticks([])
plt.show()

在这里插入图片描述

4 Canny边缘检测

Canny 边缘检测算法是一种非常流行的边缘检测算法,是 John F. Canny 于 1986年提出的,被认为是最优的边缘检测算法。

4.1 原理

Canny边缘检测算法是由4步构成,分别介绍如下:

  • 第一步:噪声去除
    由于边缘检测很容易受到噪声的影响,所以首先使用 5 ∗ 5 5*5 55高斯滤波器去除噪声,在图像平滑那一章节中已经介绍过。
  • 第二步:计算图像梯度

对平滑后的图像使用 Sobel 算子计算水平方向和竖直方向的一阶导数( G x G{x} Gx G y G{y} Gy)。根据得到的这两幅梯度图( G x G{x} Gx G y G{y} Gy)找到边界的梯度和方向,公式如下:
E d g e ‾ G r a d i e n t ( G ) = G x 2 + G y 2 Edge\underline{}Gradient(G) = \sqrt{G^{2}_{x}+G^{2}_{y}} EdgeGradient(G)=Gx2+Gy2

A n g l e ( θ ) = t a n − 1 G y G x Angle(θ) = tan^{-1}\frac{G_{y}}{G_{x}} Angle(θ)=tan1GxGy
如果某个像素点是边缘,则其梯度方向总是垂直与边缘垂直。梯度方向被归为四类:垂直,水平,和两个对角线方向。

  • 第三步:非极大值抑制
    在获得梯度的方向和大小之后,对整幅图像进行扫描,去除那些非边界上的点。对每一个像素进行检查,看这个点的梯度是不是周围具有相同梯度方向的点中最大的。如下图所示:
    在这里插入图片描述
    A点位于图像的边缘,在其梯度变化方向,选择像素点B和C,用来检验A点的梯度是否为极大值,若为极大值,则进行保留,否则A点被抑制,最终的结果是具有“细边”的二进制图像。

  • 第四步:滞后阈值

现在要确定真正的边界。 我们设置两个阈值: m i n V a l minVal minVal m a x V a l maxVal maxVal。 当图像的灰度梯度高于 m a x V a l maxVal maxVal时被认为是真的边界, 低于 m i n V a l minVal minVal 的边界会被抛弃。如果介于两者之间的话,就要看这个点是否与某个被确定为真正的边界点相连,如果是就认为它也是边界点,如果不是就抛弃。如下图:
在这里插入图片描述
如上图所示,A 高于阈值 m a x V a l maxVal maxVal 所以是真正的边界点,C 虽然低于 m a x V a l maxVal maxVal但高于 m i n V a l minVal minVal 并且与 A 相连,所以也被认为是真正的边界点。而 B 就会被抛弃,因为低于 m a x V a l maxVal maxVal而且不与真正的边界点相连。所以选择合适的 m a x V a l maxVal maxVal m i n V a l minVal minVal 对于能否得到好的结果非常重要。

4.2 应用

在OpenCV中要实现Canny检测使用的API:

canny = cv2.Canny(image, threshold1, threshold2)

参数:

  • image:灰度图,
  • threshold1: minval,较小的阈值将间断的边缘连接起来
  • threshold2: maxval,较大的阈值检测图像中明显的边缘

示例:

import cv2 as cv
import numpy as np
from matplotlib import pyplot as plt
# 1 图像读取
img = cv.imread('./image/horse.jpg',0)
# 2 Canny边缘检测
lowThreshold = 0
max_lowThreshold = 100
canny = cv.Canny(img, lowThreshold, max_lowThreshold) 
# 3 图像展示
plt.figure(figsize=(10,8),dpi=100)
plt.subplot(121),plt.imshow(img,cmap=plt.cm.gray),plt.title('原图')
plt.xticks([]), plt.yticks([])
plt.subplot(122),plt.imshow(canny,cmap = plt.cm.gray),plt.title('Canny检测后结果')
plt.xticks([]), plt.yticks([])
plt.show()

在这里插入图片描述


总结

  1. 边缘检测的原理

    • 基于搜索:利用一阶导数的最大值获取边界
    • 基于零穿越:利用二阶导数为0获取边界
  2. Sobel算子

    • 基于搜索的方法获取边界
    • cv.sobel()
    • cv.convertScaleAbs()
    • cv.addweights()
  3. Laplacian算子

    • 基于零穿越获取边界
    • cv.Laplacian()
  4. Canny算法
    流程:

    • 噪声去除:高斯滤波
    • 计算图像梯度:sobel算子,计算梯度大小和方向
    • 非极大值抑制:利用梯度方向像素来判断当前像素是否为边界点
    • 滞后阈值:设置两个阈值,确定最终的边界
  5. 算子比较

算子优缺点比较
Roberts对具有陡峭的低噪声的图像处理效果较好,但利用Roberts算子提取边缘的结果是边缘比较粗,因此边缘定位不是很准确
Sobel对灰度渐变和噪声较多的图像处理效果比较好,Sobel算子对边缘定位比较准确
Kirsch对灰度渐变和噪声较多的图像处理效果较好
Prewitt对灰度渐变和噪声较多的图像处理效果较好
Laplacian对图像中的阶跃性边缘点定位准确,对噪声非常敏感,丢失一部分边缘的方向信息,造成一些不连续的检测边缘
LoGLoG算子经常出现双边缘像素边界,而且该检测算法对噪声比较敏感,所以很少用LoG算子检测边缘,而是用来判断边缘像素是位于图像的明区还是暗区
Canny此方法不容易受噪声的干扰,能够检测到真正的弱边缘。在edge函数中,最有效的边缘检测方法是Canny方法。该方法的优点在于使用两种不同的阈值分别检测强边缘和弱边缘,并且仅当弱边缘和强边缘相连时,才将弱边缘包含在输出图像中。因此,这种方法不容易被噪声”填充“,更容易检测出真正的弱边缘。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/760226.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

vuex使用/this.$store/分模块的vuex

vuex使用 this.$store.state mutation 简化写法 执行异步行为 actions 简化写法getters vuex分模块 访问子模块中的数据

Python程序编译为动态库pyd进行加密

1. 写一段Python代码 首先敲一段代码,这里在名为data.py的Python文件中写下一个求两数之和的简单函数,函数名为i_sum;需要注意一个问题,除了代码前两行常见内容,第3行添加 # cython: language_level3,以在…

【JMeter】四种参数化实现方式是什么?

1 参数化释义 什么是参数化?从字面上去理解的话,就是事先准备好数据(广义上来说,可以是具体的数据值,也可以是数据生成规则),而非在脚本中写死,脚本执行时从准备好的数据中取值。 参…

【大模型】ChatGLM2-6B

参考 清华开源ChatGLM2-6B安装使用 手把手教程,轻松掌握 相关链接 代码:https://github.com/THUDM/ChatGLM2-6B 模型:https://huggingface.co/THUDM/chatglm2-6b、https://cloud.tsinghua.edu.cn/d/674208019e314311ab5c/?p%2Fchatglm2-6b&…

LiNux + 腾讯云 部署项目

1、介绍 Linux本地部署项目华为云简介腾讯云(CVM)远程部署CMS 2、Linux本地部署 2.1、引入 2.2、上传所需文件 文件里已经为大家准备了所需文件了: 在window上使用xftp工具,将linux版本的Jdk、tomcat、Mysql等软件上传至linux…

【电路原理学习笔记】第3章:欧姆定律:3.5 故障排查

第3章:欧姆定律 3.5 故障排查 故障排查是运用逻辑思维,结合对电路或习题运行的全面来纠正故障。故障排查的基本方法包括3个步骤:分析、规划和测量,将这三步方法称为APM。 3.5.1 分析 排查电路故障的第一步是分析故障的线索或症…

java项目之弹幕视频网站(ssm+mysql+jsp)

风定落花生,歌声逐流水,大家好我是风歌,混迹在java圈的辛苦码农。今天要和大家聊的是一款基于ssm的弹幕视频网站。技术交流和部署相关看文章末尾! 目录 开发环境: 后端: 前端: 数据库&…

操作系统练习:创建内核模块,并加载和卸载模块

说明 本文记录如何创建和编译一个内核模块,以及加载和卸载内核模块。为《操作系统概念(第九版)》第二章,关于“Linux内核模块”的练习题。 创建内核模块 注:我这里是基于阿里云的轻量应用服务器(即当前博客服务器) 首…

JS混淆原理

JS混淆原理 •eval 加密 通过eval去执行函数通常和webpack打包拼接一起使用• 变量混淆 ​ 变量名混淆,十六进制替换,随机字符串替换• 属性加密 ​ 一套组合算法,将属性加密生成• 控制流平坦化 逻辑处理块统一加上前驱逻辑块&#xff0c…

最近写了一个Python知识分享网,开源了

大家好,我是锋哥! 项目简介 肝了一周,Python知识分享网上线发布了。www.python222.com 虽然2很多,但是这个网站一点都不二,网站主要分享一些Python相关的技术知识,技术资源以及后面我的Python相关干货课程…

C# Modbus通信从入门到精通(9)——Modbus RTU(0x0F功能码)

1、0F(0x0F)写单个寄存器输出 使用该功能码能将一个寄存器的值写入到远程地址中。 2、发送报文格式 更详细的格式如下: 从站地址+功能码+线圈起始地址高字节+线圈起始地址低字节++线圈数量高字节+线圈数量低字节+字节计数+输出值最高字节+…+输出值最低字节+CRC,其中CRC是…

Linux学习之数组

数组可以存储同一类型的值,定义数组的常见方式是数组名(变量1 变量2 变量3......变量n),使用小括号(圆括号,())括起来,每个变量之间使用空格隔开。比如IPS数组可以存储多个ip变量,定义为IPS(192…

飞书ChatGPT机器人 – 打造智能问答助手实现无障碍交流

文章目录 前言环境列表1.飞书设置2.克隆feishu-chatgpt项目3.配置config.yaml文件4.运行feishu-chatgpt项目5.安装cpolar内网穿透6.固定公网地址7.机器人权限配置8.创建版本9.创建测试企业10. 机器人测试 前言 在飞书中创建chatGPT机器人并且对话,在下面操作步骤中…

设计模式再探-备忘录模式

目录 一、背景介绍二、思路&方案三、过程1.简介,定义2.类图3.符合面向对象的地方4.按照面向对象还可以优化的地方5.扩展-json转化、序列化 四、总结五、升华 一、背景介绍 最近在做一学期的语文课,每一节课结束的时候,需要将这节课上到哪儿了给记录…

SpringBoot使用JWT进行身份验证

JWT身份验证的流程 用户登录: 用户向服务器提供他们的用户名和密码。 服务器验证:服务器接收到请求,验证用户名和密码。 生成JWT:如果用户名和密码验证通过,服务器将创建一个 JWT。 JWT 包含了一些数据(称…

JS混淆原理2023

JS混淆原理 •eval 加密 通过eval去执行函数通常和webpack打包拼接一起使用• 变量混淆 ​ 变量名混淆,十六进制替换,随机字符串替换• 属性加密 ​ 一套组合算法,将属性加密生成• 控制流平坦化 逻辑处理块统一加上前驱逻辑块&#xff0c…

kubeproxy和service dns整体原理

iptables知识 五条链 iptables是linux内核集成的IP信息过滤规则,负责将发往主机的网络包进行分发,转换等。当客户端请求服务器的某个服务时,请求信息会先通过网卡进入服务器内核,这时iptables会对包进行过滤,决定这些…

Docker安装卸载

说明:在大型的项目开发中,各种开发软件所需的环境各不相同,所需的依赖也时常发生冲突。而Docker将开发软件,和所需的依赖、函数库、配置打包成一个可移植的镜像文件,在Docker的容器中运行,使用沙箱机制&…

线程基础和等待唤醒机制

一、基础 1、进程和线程 进程:进程是用来加载指令、管理内存、管理IO的,操作系统会以进程为单位分配系统资源(cpu、内存等资源),进程是资源分配的最小单位线程:线程是操作系统cpu调度的最小单位&#xff…

用Linux模拟实现进度条

1.设置文件,以及创建makefile 2.make 的相关用法 make存在的目的就是为了在文件多的时候,gcc 文件名,你可能要输入很多次,但是make的存在,一句make指令就可以完成了。 process [生成文件] : 与之有关的文件。下一行就…