opencv基础41-图像梯度-sobel算子详解cv2.Sobel()(边缘检测基础)

news2024/10/7 16:20:28

图像梯度是用于描述图像变化率的概念。在图像处理中,梯度指的是图像中每个像素的灰度值变化速率或方向。它常用于边缘检测和图像特征提取。

一维图像的梯度表示为函数 f(x) 的导数,而在二维图像中,梯度是一个向量,包含两个分量:水平方向和垂直方向的灰度变化率。这两个分量的大小和方向可以用来确定图像中的边缘和纹理信息。

在图像处理中,常用的算子如Sobel、Prewitt和Scharr等可以用于计算图像的梯度。梯度计算对于计算机视觉任务和图像处理中的特征提取非常有用。

图像梯度计算需要求导数,但是图像梯度一般通过计算像素值的差来得到梯度的近似值(近似导数值)。

例如,图 9-1 中的左右两幅图分别描述了图像的水平边界和垂直边界。

针对左图,通过垂直方向的线条 A 和线条 B 的位置,可以计算图像水平方向的边界:

  • 对于线条 A 和线条 B,其右侧像素值与左侧像素值的差值不为零,因此是边界。

  • 对于其余列,其右侧像素值与左侧像素值的差值均为零,因此不是边界。

针对右图,通过水平方向的线条 A 和线条 B 的位置,可以计算图像垂直方向的边界:

  • 对于线条 A 和线条 B,其下侧像素值与上侧像素值的差值不为零,因此是边界。
  • 对于其余行,其下侧像素值与上侧像素值的差值均为零,因此不是边界。

在这里插入图片描述

将上述运算关系进一步优化,可以得到更复杂的边缘信息。

Sobel 理论基础

Sobel 算子是一种离散的微分算子,该算子结合了高斯平滑和微分求导运算。该算子利用局部差分寻找边缘,计算所得的是一个梯度的近似值。

Sobel 算子如图 9-2 所示。

在这里插入图片描述
需要说明的是,滤波器通常是指由一幅图像根据像素点(x, y)临近的区域计算得到另外一幅新图像的算法。因此,滤波器是由邻域及预定义的操作构成的。滤波器规定了滤波时所采用的形状以及该区域内像素值的组成规律。滤波器也被称为“掩模”、“核”、“模板”、“窗口”、“算子”等。一般信号领域将其称为“滤波器”,数学领域将其称为“核”。

文中出现的滤波器多数为“线性滤波器”,也就是说,滤波的目标像素点的值等于原始像素值及其周围像素值的加权和。这种基于线性核的滤波,就是我们所熟悉的卷积。在文中,为了方便说明,直接使用“算子”来表示各种算子所使用的滤波器。例如,文中所说的“Sobel 算子”通常是指 Sobel滤波器。

假定有原始图像 src,下面对 Sobel 算子的计算进行讨论。

1. 计算水平方向偏导数的近似值

将 Sobel 算子与原始图像 src 进行卷积计算,可以计算水平方向上的像素值变化情况。
例如,当 Sobel 算子的大小为 3×3 时,水平方向偏导数 Gx的计算方式为:

在这里插入图片描述
上式中,src 是原始图像,假设其中有 9 个像素点,如图 9-3 所示。

在这里插入图片描述
如果要计算像素点 P5 的水平方向偏导数 P5x,则需要利用 Sobel 算子及 P5 邻域点,所使用的公式为:

P5x = (P3-P1) + 2·(P6-P4) + (P9-P7)

即用像素点 P5 右侧像素点的像素值减去其左侧像素点的像素值。其中,中间像素点(P4 和 P6)距离像素点 P5 较近,其像素值差值的权重为 2;其余差值的权重为 1。

然后将这三个差值相加得到一个新的值,并将这个新的值赋给P5,即得到P5的像素值。

2. 计算垂直方向偏导数的近似值

将 Sobel 算子与原始图像 src 进行卷积计算,可以计算垂直方向上的变化情况。例如,当Sobel 算子的大小为 3×3 时,垂直方向偏导数 Gy的计算方式为:

在这里插入图片描述

上式中,src 是原始图像,假设其中有 9 个像素点,如图 9-4 所示。

在这里插入图片描述
如果要计算像素点 P5 的垂直方向偏导数 P5y,则需要利用 Sobel 算子及 P5 邻域点,所使用的公式为:

P5y = (P7-P1) + 2·(P8-P2) + (P9-P3)

式中,使用像素点 P5 下一行像素点的像素值减去上一行像素点的像素值。其中,中间像素点(P2 和 P8)距离像素点 P5 较近,其像素值差值的权重为 2;其余差值的权重为 1。

Sobel 算子及函数使用

在 OpenCV 内,使用函数 cv2.Sobel()实现 Sobel 算子运算,其语法形式为:

dst = cv2.Sobel( src, ddepth, dx, dy[,ksize[, scale[, delta[, borderType]]]] )

式中:

  • dst 代表目标图像。
  • src 代表原始图像。
  • ddepth 代表输出图像的深度。其具体对应关系如表 9-1 所示。
    在这里插入图片描述
  • dx 代表 x 方向上的求导阶数。
  • dy 代表 y 方向上的求导阶数。
  • ksize 代表 Sobel 核的大小。该值为-1 时,则会使用 Scharr 算子进行运算。
  • scale 代表计算导数值时所采用的缩放因子,默认情况下该值是 1,是没有缩放的。
  • delta 代表加在目标图像 dst 上的值,该值是可选的,默认为 0。
  • borderType 代表边界样式。该参数的具体类型及值如表 9-2 所示。
    在这里插入图片描述

参数ddepth

在函数 cv2.Sobel()的语法中规定,可以将函数 cv2.Sobel()内 ddepth 参数的值设置为-1,让处理结果与原始图像保持一致。但是,如果直接将参数 ddepth 的值设置为-1,在计算时得到的结果可能是错误的

在实际操作中,计算梯度值可能会出现负数。如果处理的图像是 8 位图类型,则在 ddepth的参数值为-1 时,意味着指定运算结果也是 8 位图类型,那么所有负数会自动截断为 0,发生信息丢失。为了避免信息丢失,在计算时要先使用更高的数据类型 cv2.CV_64F,再通过取绝对值将其映射为 cv2.CV_8U(8 位图)类型。所以,通常要将函数 cv2.Sobel()内参数 ddepth 的值设置为“cv2.CV_64F”。

下面对参数 ddepth 值的设定做一个简要的说明。

例如,图 9-5 中的原始图像(左图)是一幅二值图像,图中黑色部分的像素值为 0,白色部分的像素值为 1。在计算 A 线条所在位置和 B 线条所在位置的近似偏导数时:

  • 针对 A 线条所在列,右侧像素值减去左侧像素值所得近似偏导数的值为-1。

  • 针对 B 线条所在列,右侧像素值减去左侧像素值所得近似偏导数的值为 1。

针对上述偏导数结果进行不同方式的处理,可能会得到不同的结果,例如:

  • 直接计算。此时,A 线条位置的值为负数,B 线条位置的值为正数。在显示时,由于上述负值不在 8 位图范围内,因此要做额外处理。将 A 线条处的负数偏导数处理为 0,B线条处的正数偏导数保持不变。在这种情况下,显示结果如图 9-5 中间的图所示。

  • 计算绝对值。此时,A 线条处的负数偏导数被处理正数,B 线条处的正数偏导数保持不变。在显示时,由于上述值在 8 位图的表示范围内,因此不再对上述值进行处理,此时,
    显示结果如图 9-5 中的右图所示。

在这里插入图片描述

上述问题在计算垂直方向的近似偏导数时同样存在。例如,图 9-6 中的原始图像(左图)
是一幅二值图像,图中黑色部分的像素值为 0,白色部分的像素值为 1。计算 A 线条所在位置
和 B 线条所在位置的近似偏导数时:
 针对 A 线条所在行,下方像素值减去上方像素值所得近似偏导数为-1。
 针对 B 线条所在行,下方像素值减去上方像素值所得近似偏导数为 1。

针对上述偏导数结果进行不同方式的处理,可能会得到不同的结果,例如:

  • 直接计算。此时,A 线条位置的值为负数,B 线条位置的值为正数。在显示时,上述值不在 8 位图的表示范围内,因此需要进行额外处理。将 A 线条处的负数偏导数处理为 0,
    B 线条处的正数偏导数保持不变。此时,显示结果如图 9-6 中间的图所示。
  • 计算绝对值。此时,A 线条处的负数偏导数被处理正数,B 线条处的正数偏导数保持不变。在显示时,由于上述值在 8 位图的表示范围内,因此不再对上述值进行处理,此时,
    显示结果如图 9-6 中的右图所示。

经过上述分析可知,为了让偏导数正确地显示出来,需要将值为负数的近似偏导数转换为正数。即,要将偏导数取绝对值,以保证偏导数总能正确地显示出来。

例如,图 9-7 描述了如何计算偏导数。

在这里插入图片描述
为了得到结果为正数的偏导数,需要对图 9-7 中计算的偏导数取绝对值,如下:

|P5x| = |(P3-P1) + 2·(P6-P4) + (P9-P7)|
|P5y| = |(P7-P1) + 2·(P8-P2) + (P9-P3)|

当然,在需要时,还可以进行如下处理:

P5Sobel = |P5x| + |P5y| = |(P3-P1) +2·(P6-P4) + (P9-P7)| + |(P7-P1) + 2·(P8-P2) + (P9-P3)|

经过以上分析,我们得知:在实际操作中,计算梯度值可能会出现负数。通常处理的图像是 8 位图类型,如果结果也是该类型,那么所有负数会自动截断为 0,发生信息丢失。所以,
为了避免信息丢失,我们在计算时使用更高的数据类型 cv2.CV_64F,再通过取绝对值将其映射为 cv2.CV_8U(8 位图)类型。

OpenCV 中,使用函数 cv2.convertScaleAbs()对参数取绝对值,该函数的语法格式为:

dst = cv2.convertScaleAbs( src [, alpha[, beta]] )

上式中:

  • dst 代表处理结果。
  • src 代表原始图像。
  • alpha 代表调节系数,该值是可选值,默认为 1。
  • beta 代表调节亮度值,该值是默认值,默认为 0。
    这里,该函数的作用是将原始图像 src 转换为 256 色位图,其可以表示为:
dst=saturate(src*alpha+beta)

式中,saturate()表示计算结果的最大值是饱和值,例如当“src*alpha+beta”的值超过 255 时,其取值为 255。

代码示例:使用函数 cv2.convertScaleAbs()对一个随机数组取绝对值。

import cv2
import numpy as np
img=np.random.randint(-256,256,size=[4,5],dtype=np.int16)

rst=cv2.convertScaleAbs(img)
print("img=\n",img)
print("rst=\n",rst)

运行结果:

img=
 [[ -26 -176  -21 -125   70]
 [  54  156  -76   -8 -117]
 [ 226  -19  -21  114  132]
 [ 126  120   72 -256  137]]
rst=
 [[ 26 176  21 125  70]
 [ 54 156  76   8 117]
 [226  19  21 114 132]
 [126 120  72 255 137]]

从结果中看出原图中的负数都转变成了正数,并且转正大于255 的会改成255

cv2.Sobel() 方向参数 dx,dy

在函数 cv2.Sobel()中,参数 dx 表示 x 轴方向的求导阶数,参数 dy 表示 y 轴方向的求导阶数。参数 dx 和 dy 通常的值为 0 或者 1,最大值为 2。如果是 0,表示在该方向上没有求导。当然,参数 dx 和参数 dy 的值不能同时为 0。

参数 dx 和参数 dy 可以有多种形式的组合,主要包含:

  • 计算 x 方向边缘(梯度):dx=1, dy=0。
  • 计算 y 方向边缘(梯度):dx=0, dy=1。
  • 参数 dx 与参数 dy 的值均为 1:dx=1, dy=1。
  • 计算 x 方向和 y 方向的边缘叠加:通过组合方式实现。

下面分别对上述情况进行简要说明。

1. 计算x方向边缘(梯度):dx=1,dy=0

如果想只计算 x 方向(水平方向)的边缘,需要将函数 cv2.Sobel()的参数 dx 和 dy 的值设置为“dx=1, dy=0”。当然,也可以设置为“dx=2, dy=0”。此时,会仅仅获取水平方向的边缘信息,此时的语法格式为:

dst = cv2.Sobel( src , ddepth , 1 , 0 )

使用该语句获取边缘图的示例如图 9-8 所示,其中左图为原始图像,右图为获取的边缘图。

在这里插入图片描述

2. 计算y方向边缘(梯度):dx=0,dy=1

如果想只计算 y 方向(垂直方向)的边缘,需要将函数 cv2.Sobel()的参数 dx 和 dy 的值设置为“dx=0, dy=1”。当然,也可以设置为“dx=0, dy=2”。此时,会仅仅获取垂直方向的边缘信
息,此时的语法格式为:

dst = cv2.Sobel( src , ddepth , 0 , 1 )

使用该语句获取边缘图的示例如图 9-9 所示,其中左图为原始图像,右图为获取的边缘图。

在这里插入图片描述

3. 参数dx与参数dy的值均为 1:dx=1,dy=1

可以将函数 cv2.Sobel()的参数 dx 和 dy 的值设置为“dx=1, dy=1”,也可以设置为“dx=2,dy=2”,或者两个参数都不为零的其他情况。此时,会获取两个方向的边缘信息,此时的语法格式为:

dst = cv2.Sobel( src , ddepth , 1 , 1 )

使用该语句获取边缘图的示例如图 9-10 所示,其中左图为原始图像,右图为获取的边缘图,仔细观察可以看到图中仅有若干个微小白点,每个点的大小为一个像素。

在这里插入图片描述

4. 计算x方向和y方向的边缘叠加

如果想获取 x 方向和 y 方向的边缘叠加,需要分别获取水平方向、垂直方向两个方向的边缘图,然后将二者相加。此时的语法格式为:

dx= cv2.Sobel( src , ddepth , 1 , 0 )
dy= cv2.Sobel( src , ddepth , 0 , 1 )
dst=cv2.addWeighted( src1 , alpha , src2 , beta , gamma )

使用上述语句获取边缘图的示意图如图 9-11 所示,其中左图为原始图像,右图为获取的边缘图

在这里插入图片描述

代码示例:使用函数 cv2.Sobel()获取图像水平方向的边缘信息。

原图:
在这里插入图片描述

import cv2
o = cv2.imread('sobel4.bmp',cv2.IMREAD_GRAYSCALE)
Sobelx = cv2.Sobel(o,-1,1,0)
cv2.imshow("original",o)
cv2.imshow("x",Sobelx)
cv2.waitKey()
cv2.destroyAllWindows()

运行结果:

在这里插入图片描述
从程序可以看出,当参数 ddepth 的值为-1 时,只得到了图中黑色框的右边界。这是因为,左边界在运算时得到了负值,其在显示时被调整为 0,所以没有显示出来。要想获取左边界的值(将其显示出来),必须将参数 ddepth 的值设置为更大范围的数据结构类型,并将其映射到8 位图像内。

示例2: 使用函数 cv2.Sobel()获取图像水平方向的完整边缘信息。

代码如下:

import cv2
o = cv2.imread('Sobel4.bmp',cv2.IMREAD_GRAYSCALE)
Sobelx = cv2.Sobel(o,cv2.CV_64F,1,0)
Sobelx = cv2.convertScaleAbs(Sobelx)
cv2.imshow("original",o)
cv2.imshow("x",Sobelx)
cv2.waitKey()
cv2.destroyAllWindows()

在这里插入图片描述

示例3: 计算函数 cv2.Sobel()在水平、垂直两个方向叠加的边缘信息。

import cv2
o = cv2.imread('Sobel4.bmp',cv2.IMREAD_GRAYSCALE)
Sobelx = cv2.Sobel(o,cv2.CV_64F,1,0)
Sobely = cv2.Sobel(o,cv2.CV_64F,0,1)
Sobelx = cv2.convertScaleAbs(Sobelx)
Sobely = cv2.convertScaleAbs(Sobely)
Sobelxy = cv2.addWeighted(Sobelx,0.5,Sobely,0.5,0)
cv2.imshow("original",o)
cv2.imshow("xy",Sobelxy)
cv2.waitKey()
cv2.destroyAllWindows()

在这里插入图片描述
本例中首先分别计算 x 方向的边缘、y 方向的边缘,接下来使用函数
cv2.addWeighted()对两个方向的边缘进行叠加。在最终的叠加边缘结果中,同时显示两个方向的边缘信息。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/841275.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

《HeadFirst设计模式(第二版)》第六章代码——命令模式

代码文件目录: Command package Chapter6_CommandPattern.Command;/*** Author 竹心* Date 2023/8/6**/public interface Command {public void execute();public void undo();//撤销该指令 }CeilingFan package Chapter6_CommandPattern.ElectricAppliance;/*** …

阿里云快速部署开发环境 (Apache + Mysql8.0+Redis7.0.x)

本文章的内容截取于云服务器管理控制台提供的安装步骤,再整合前人思路而成,文章末端会提供原文连接 ApacheMysql 8.0部署MySQL数据库(Linux)步骤一:安装MySQL步骤二:配置MySQL步骤三:远程访问My…

协议,序列化,反序列化,Json

文章目录 协议序列化和反序列化网络计算器protocol.hppServer.hppServer.ccClient.hppClient.cclog.txt通过结果再次理解通信过程 Json效果 协议 协议究竟是什么呢?首先得知道主机之间的网络通信交互的是什么数据,像平时使用聊天APP聊天可以清楚&#x…

【网络编程】利用套接字实现一个简单的网络通信(UDP实现聊天室 附上源码)

网络编程套接字 🐛预备知识🦋理解源IP地址和目的IP地址🐌认识端口号🐞 理解 "端口号" 和 "进程ID"🐜简单认识TCP协议🦟简单认识UDP协议🦗 什么是网络字节序 🕷相…

MySQL的关键指标及采集方法

MySQL 是个服务,所以我们可以借用 Google 四个黄金指标的思路来解决问题。 1、延迟 应用程序会向 MySQL 发起 SELECT、UPDATE 等操作,处理这些请求花费了多久,是非常关键的,甚至我们还想知道具体是哪个 SQL 最慢,这样…

【Linux】进程间通信——System V信号量

目录 写在前面的话 一些概念的理解 信号量的引入 信号量的概念及使用 写在前面的话 System V信号量是一种较低级的IPC机制,使用的时候需要手动进行操作和同步。在现代操作系统中,更常用的是POSIX信号量(通过sem_*系列的函数进行操作&…

linux系统虚拟主机开启支持Swoole Loader扩展

特别说明:只是安装支持Swoole扩展,主机并没有安装服务端。目前支持版本php5.4-php7.2。 1、登陆主机控制面板,找到【远程文件下载】这个功能。 2、远程下载文件填写http://download.myhostadmin.net/vps/SwooleLoader_linux.zip 下载保存的路…

SpringBoot 升级内嵌Tomcat

SpringBoot 更新 Tomcat 最近公司的一个老项目需要升级下Tomcat,由于这个项目我完全没有参与,所以一开始我以为是一个老的Tomcat项目,升级它的Tomcat依赖或者是Tomcat容器镜像,后面发现是一个SpringBoot项目,升级的是…

加速中产 “返贫” 的4个迹象

没有消息,就是好消息。这话放在现在的朋友圈子里,似乎很合适。最近接到两个朋友的电话,一个是朋友的诉苦电话,这位朋友曾是某大厂的高管,被裁后失业近1年,虽然当初赔了N1,但架不住这位朋友“房贷…

Maven 打包生成Windows和Liunx启动文件

新建一个springboot项目。 1、项目结构 2、pom.xml <?xml version"1.0" encoding"UTF-8"?> <project xmlns"http://maven.apache.org/POM/4.0.0" xmlns:xsi"http://www.w3.org/2001/XMLSchema-instance"xsi:schemaLocati…

ASP.NET Core MVC -- 将视图添加到 ASP.NET Core MVC 应用

Index页 右键单击“视图”文件夹&#xff0c;然后单击“添加”>>“新文件夹”&#xff0c;并将文件夹命名为“HelloWorld”。 右键单击“Views/HelloWorld”文件夹&#xff0c;然后单击“添加”>“新项”。 在“添加新项 - MvcMovie”对话框中&#xff1a; 在右上…

Misc取证学习

文章目录 Misc取证学习磁盘取证工具veracryto挂载fat文件DiskGenius 磁盘取证例题[RCTF2019]disk 磁盘[](https://ciphersaw.me/ctf-wiki/misc/disk-memory/introduction/#_2)内存取证工具volatility 内存取证例题数字取证赛题0x01.从内存中获取到用户admin的密码并且破解密码 …

gin和gorm框架安装

理论上只要这两句命令 go get -u gorm.io/gorm go get -u github.com/gin-gonic/gin然而却出现了问题 貌似是代理问题&#xff0c;加上一条命令 go env -w GOPROXYhttps://goproxy.cn,direct 可以成功安装 安装gorm的数据库驱动程序 go get -u gorm.io/driver/mysql

香港人力资源服务商迦里仕人才,申请纳斯达克IPO上市

来源&#xff1a;猛兽财经 作者&#xff1a;猛兽财经 猛兽财经获悉&#xff0c;总部位于香港的人力资源服务商迦里仕人才&#xff08;Galaxy Payroll Group&#xff09;近期已向美国证券交易委员会&#xff08;SEC&#xff09;提交招股书&#xff0c;申请在纳斯达克IPO上市&am…

VUE框架:vue2转vue3全面细节总结(4)滚动行为

大家好&#xff0c;我是csdn的博主&#xff1a;lqj_本人 这是我的个人博客主页&#xff1a; lqj_本人_python人工智能视觉&#xff08;opencv&#xff09;从入门到实战,前端,微信小程序-CSDN博客 最新的uniapp毕业设计专栏也放在下方了&#xff1a; https://blog.csdn.net/lbcy…

Redis可视化工具

Redis可视化工具 1、RedisInsight 下载地址&#xff1a;https://redis.com/redis-enterprise/redis-insight/ 双击软件进行安装&#xff0c;安装完后弹出如下界面&#xff1a; 安装完成后在主界面选择添加Redis数据库&#xff1b; 选择手动添加数据库&#xff0c;输入Redis…

GD32F103VE独立看门狗

GD32F103VE独立看门狗 看门狗定时器(WDGT)有两个&#xff1a; 1&#xff0c;独立看门狗定时器(FWDGT) 2&#xff0c;窗口看门狗定时器(WWDGT) 独立看门狗定时器(FWDGT)有一个独立的时钟源(IRC40K). 独立看门狗定时器有一个向下计数器,当计数器到达0&#xff0c;会让CPU复位。…

二叉树的前序遍历、中序遍历、后序遍历、层次遍历的实现

DLR–前序遍历&#xff08;根在前&#xff0c;从左往右&#xff0c;一棵树的根永远在左子树前面&#xff0c;左子树又永远在右子树前面 &#xff09; LDR–中序遍历&#xff08;根在中&#xff0c;从左往右&#xff0c;一棵树的左子树永远在根前面&#xff0c;根永远在右子树前…

从0到1开发go-tcp框架【4实战片— — 开发MMO之玩家聊天篇】

从0到1开发go-tcp框架【实战片— — 开发MMO】 MMO&#xff08;MassiveMultiplayerOnlineGame&#xff09;&#xff1a;大型多人在线游戏&#xff08;多人在线网游&#xff09; 1 AOI兴趣点的算法 游戏中的坐标模型&#xff1a; 场景相关数值计算 ● 场景大小&#xff1a; 250…

Vue2:组件基础(下)

Vue2&#xff1a;组件基础&#xff08;下&#xff09; Date: April 12, 2023 Sum: props验证、计算属性、自定义时间、组件上的v-model、任务列表案例 Tags: * 目标&#xff1a; 能够知道如何对 props 进行验证 能够知道如何使用计算属性 令能够知道如何为组件自定义事件 …