OpenCV:入门(五)

news2025/4/7 15:38:55

图像梯度

图像梯度计算的是图像变化的速度。对于图像的边缘部分,其灰度值变化较大,梯度值也 较大;相反,对于图像中比较平滑的部分,其灰度值变化较小,相应的梯度值也较小。一般情 况下,图像梯度计算的是图像的边缘信息。

严格来讲,图像梯度计算需要求导数,但是图像梯度一般通过计算像素值的差来得到梯度 的近似值(近似导数值)。

 例如,图 9-1 中的左右两幅图分别描述了图像的水平边界和垂直边界。

针对左图,通过垂直方向的线条 A 和线条 B 的位置,可以计算图像水平方向的边界:

  •  对于线条 A 和线条 B,其右侧像素值与左侧像素值的差值不为零,因此是边界。
  •  对于其余列,其右侧像素值与左侧像素值的差值均为零,因此不是边界。 针对右图,通过水平方向的线条 A 和线条 B 的位置,可以计算图像垂直方向的边界:
  •  对于线条 A 和线条 B,其下侧像素值与上侧像素值的差值不为零,因此是边界。
  •  对于其余行,其下侧像素值与上侧像素值的差值均为零,因此不是边界。

但是实际图像处理中肯定不会像上图一样好处理,所以我们也有相对复杂的算子:Sobel算子,Scharr算子,拉普拉斯算子等。 

一,Sobel算子

(1)原理

Sobel 算子是一种离散的微分算子,该算子结合了高斯平滑和微分求导运算。该算子利用 局部差分寻找边缘,计算所得的是一个梯度的近似值。

需要说明的是,滤波器通常是指由一幅图像根据像素点(x, y)临近的区域计算得到另外一幅 新图像的算法。因此,滤波器是由邻域及预定义的操作构成的。滤波器规定了滤波时所采用的 形状以及该区域内像素值的组成规律。滤波器也被称为“掩模”、“核”、“模板”、“窗口”、“算 子”等。一般信号领域将其称为“滤波器”,数学领域将其称为“核”。本章中出现的滤波器多 数为“线性滤波器”,也就是说,滤波的目标像素点的值等于原始像素值及其周围像素值的加权和。这种基于线性核的滤波,就是我们所熟悉的卷积。在本章中,为了方便说明,直接使用 “算子”来表示各种算子所使用的滤波器。例如,本章中所说的“Sobel算子”通常是指 Sobel 滤波器。  

1.计算水平方向偏导数的近似值

得到结果为:P5x = (P3-P1) + 2·(P6-P4) + (P9-P7)  

很明显,这些点都是x轴方向的点,而且离p5点越近权重越大。

那么垂直方向偏导数的近似值应该也很好理解了,我们只需要转置一下sobel算子就可以了。

2. 计算垂直方向偏导数的近似值 

P5y = (P7-P1) + 2·(P8-P2) + (P9-P3)

差不多,对吧? 

 (2)函数解析

dst = cv2.Sobel( src, ddepth, dx, dy[,ksize[, scale[, delta[, borderType]]]] )

  • dst 代表目标图像。
  • src 代表原始图像。
  • ddepth 代表输出图像的深度。其具体对应关系如表 9-1 所示。

  • dx 代表 x 方向上的求导阶数。
  • dy 代表 y 方向上的求导阶数。
  • ksize 代表 Sobel 核的大小。该值为-1 时,则会使用 Scharr 算子进行运算。
  • scale 代表计算导数值时所采用的缩放因子,默认情况下该值是 1,是没有缩放的。
  • delta 代表加在目标图像 dst 上的值,该值是可选的,默认为 0。
  • borderType 代表边界样式。该参数的具体类型及值如表 9-2 所示。  

 1.参数ddepth

在函数 cv2.Sobel()的语法中规定,可以将函数 cv2.Sobel()内 ddepth 参数的值设置为-1,让 处理结果与原始图像保持一致。但是,如果直接将参数 ddepth 的值设置为-1,在计算时得到的 结果可能是错误的。 在实际操作中,计算梯度值可能会出现负数。如果处理的图像是 8 位图类型,则在 ddepth 的参数值为-1 时,意味着指定运算结果也是 8 位图类型,那么所有负数会自动截断为 0,发生信息丢失。为了避免信息丢失,在计算时要先使用更高的数据类型 cv2.CV_64F,再通过取绝 对值将其映射为 cv2.CV_8U(8 位图)类型。所以,通常要将函数 cv2.Sobel()内参数 ddepth 的 值设置为“cv2.CV_64F”

简而言之,就是计算梯度时会出现负数,这就会导致一些问题(部分图像无法显示),这部分会在代码示例部分更加详细讨论,我们可以通过参数调整让8位图先升高位数防止截断,当然也可以用abs取绝对值来解决,我们放在后续讨论。

2.方向

在函数 cv2.Sobel()中,参数 dx 表示 x 轴方向的求导阶数,参数 dy 表示 y 轴方向的求导阶 数。参数 dx 和 dy 通常的值为 0 或者 1,最大值为 2。如果是 0,表示在该方向上没有求导。当 然,参数 dx 和参数 dy 的值不能同时为 0。

参数 dx 和参数 dy 可以有多种形式的组合,主要包含:

  • 计算 x 方向边缘(梯度):dx=1, dy=0。
  • 计算 y 方向边缘(梯度):dx=0, dy=1。
  • 参数 dx 与参数 dy 的值均为 1:dx=1, dy=1(这个效果不是很好,一般分别计算x,y方向梯度再计算)
  • 计算 x 方向和 y 方向的边缘叠加:通过组合方式实现。

(3)代码示例

import cv2
import numpy as np
import matplotlib.pyplot as plt

circle = cv2.imread("circle.jpg")
kernel = np.ones((5, 5), np.uint8)
circle = cv2.erode(circle,kernel=kernel,iterations=2)
sobel_x = cv2.Sobel(circle,cv2.CV_64F,1,0,ksize=5)
sobel_x_abs = cv2.convertScaleAbs(sobel_x)
sobel_y = cv2.Sobel(circle,cv2.CV_64F,0,1,ksize=5)
sobel_y_abs = cv2.convertScaleAbs(sobel_y)
sobel_x_y = cv2.Sobel(circle,cv2.CV_64F,1,1,ksize=5)
sobel_x_y_mix = cv2.addWeighted(sobel_x_abs,0.5,sobel_y_abs,0.5,0)
plt.subplot(231), plt.imshow(sobel_x), plt.title("Sobel_X")
plt.subplot(232), plt.imshow(sobel_y), plt.title("Sobel_Y")
plt.subplot(233), plt.imshow(sobel_x_y), plt.title("Sobel_X_Y")#不建议直接计算
plt.subplot(234), plt.imshow(sobel_x_abs), plt.title("Sobel_X_ABS")
plt.subplot(235), plt.imshow(sobel_y_abs), plt.title("Sobel_Y_ABS")
plt.subplot(236), plt.imshow(sobel_x_y_mix), plt.title("Sobel_X_Y_MIX")
plt.show()

和上文提及一般,对比sobel_x和sobel_x_abs图像,我们发现sobel_x图像出现缺失,这是因为计算出负值后出现的截断,导致值为0,对应就是黑点,无法显示出来,这里我们采用取绝对值解决了这个问题。

同样地,我们对比sobel_x_y和sobel_x_y_mix两幅图,前者是通过直接在函数中设置参数dx,dy=1产生的效果,后者是分别计算后叠加在一起的图像,采用的是addweighted方法。

二,Scharr算子

(1)原理

Scharr算子的原理和Sobel算子很相似,就是换了一个滤波器(核),不过Scharr算子精度更高一些。

如图:

(2)函数解析

dst = cv2.Scharr( src, ddepth, dx, dy[, scale[, delta[, borderType]]] ) 

  • dst 代表输出图像。
  • src 代表原始图像。
  • ddepth 代表输出图像深度。该值与函数 cv2.Sobel()中的参数 ddepth 的含义相同,具体可 以参考表 9-1。
  • dx 代表 x 方向上的导数阶数。
  • dy 代表 y 方向上的导数阶数。
  • scale 代表计算导数值时的缩放因子,该项是可选项,默认值是 1,表示没有缩放。
  • delta 代表加到目标图像上的亮度值,该项是可选项,默认值为 0。
  • borderType 代表边界样式。具体可以参考表 9-2。  

(3)代码示例

import cv2
import numpy as np
import matplotlib.pyplot as plt
if __name__ == '__main__':     
        circle = cv2.imread("circle.jpg")
        kernel = np.ones((5, 5), np.uint8)
        circle = cv2.erode(circle,kernel=kernel,iterations=2)
        scharr_x = cv2.Scharr(circle,cv2.CV_64F,1,0)
        scharr_x_abs = cv2.convertScaleAbs(scharr_x)
        scharr_y = cv2.Scharr(circle,cv2.CV_64F,0,1)
        scharr_y_abs = cv2.convertScaleAbs(scharr_y)
        scharr_x_y_mix = cv2.addWeighted(scharr_x_abs,0.5,scharr_y_abs,0.5,0)
        plt.subplot(231), plt.imshow(scharr_x), plt.title("Scharr_X")
        plt.subplot(232), plt.imshow(scharr_y), plt.title("Scharr_Y")
        plt.subplot(234), plt.imshow(scharr_x_abs), plt.title("Scharr_X_ABS")
        plt.subplot(235), plt.imshow(scharr_y_abs), plt.title("Scharr_Y_ABS")
        plt.subplot(236), plt.imshow(scharr_x_y_mix), plt.title("Scharr_X_Y_MIX")
        plt.show()
        cv2.waitKey(0)

对比Sobel图像:

我们发现Scharr算子显然更加精细一些,效果也要好一些,当然有兴趣的话可以使用其他图片进行更好的观察。 

三, Laplacian算子

(1)原理

Laplacian(拉普拉斯)算子是一种二阶导数算子,其具有旋转不变性,可以满足不同方向 的图像边缘锐化(边缘检测)的要求。通常情况下,其算子的系数之和需要为零。例如,一个 3×3 大小的 Laplacian 算子如图 9-24 所示。

Laplacian 算子类似二阶 Sobel 导数,需要计算两个方向的梯度值。例如,在图 9-25 中:

  • 左图是 Laplacian 算子。
  • 右图是一个简单图像,其中有 9 个像素点。  

计算像素点 P5 的近似导数值,如下:

P5lap = (P2 + P4 + P6 + P8) - 4·P5  

(2)函数解析

dst = cv2.Laplacian( src, ddepth[, ksize[, scale[, delta[, borderType]]]] ) 

  • dst 代表目标图像。
  • src 代表原始图像。
  • ddepth 代表目标图像的深度。
  • ksize 代表用于计算二阶导数的核尺寸大小。该值必须是正的奇数。
  • scale 代表计算 Laplacian 值的缩放比例因子,该参数是可选的。默认情况下,该值为 1, 表示不进行缩放。
  • delta 代表加到目标图像上的可选值,默认为 0。
  • borderType 代表边界样式。 该函数分别对 x、y 方向进行二次求导,具体为: 

上式是当 ksize 的值大于 1 时的情况。当 ksize 的值为 1 时,Laplacian 算子计算时采用的 3×3 的核如下:

通过从图像内减去它的 Laplacian 图像,可以增强图像的对比度,此时其算子如图 9-27 所 示。  

(3)代码示例

import cv2
import numpy as np
import matplotlib.pyplot as plt
if __name__ == '__main__':
        circle = cv2.imread("circle.jpg")
        laplacian = cv2.Laplacian(circle,cv2.CV_64F)
        laplacian_abs = cv2.convertScaleAbs(laplacian)
        plt.subplot(121),plt.imshow(laplacian),plt.title("Laplacian")
        plt.subplot(122),plt.imshow(laplacian_abs),plt.title("Laplacian_abs")
        plt.show()
        cv2.waitKey(0)

四,算子总结

Sobel 算子、Scharr 算子、Laplacian 算子都可以用作边缘检测,它们的核如图 9-29 所示。

Sobel 算子和 Scharr 算子计算的都是一阶近似导数的值。通常情况下,可以将它们表示为:

Sobel 算子= |左-右| / |下-上|

Scharr 算子= |左-右| / |下-上|

式中“|左-右|”表示左侧像素值减右侧像素值的结果的绝对值,“|下-上|”表示下方像素值减上 方像素值的结果的绝对值。

Laplacian 算子计算的是二阶近似导数值,可以将它表示为:

Laplacian 算子= |左-右| + |左-右| + |下-上| + |下-上|

通过公式可以发现,Sobel 算子和 Scharr 算子各计算了一次“|左-右|”和“|下-上|”的值, 而 Laplacian 算子分别计算了两次“|左-右|”和“|下-上|”的值。  

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1689814.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

k8s 1.28.10 浏览器访问6443查看api,需要证书

添加证书 使用client-certificate-data和client-key-data生成一个p12文件 1.生成client-certificate-data grep client-certificate-data ~/.kube/config | head -n 1 | awk {print $2} | base64 -d >> kubecfg.crt2.生成client-key-data grep client-key-data ~/.kub…

深 渔博会成功举办 新文件促进城市数字化转型| 产业互联网观察174期

深圳渔博会水产品竞价交易会成功举办 首批数据跨境一般数据清单发布 新文件加快城市全域数字化转型进程 | 产业互联网观察第174期 2024深圳渔博会水产品竞价交易会成功举办 5月17日至18日,深圳渔博会上深圳国际金枪鱼交易有限公司在深圳会展中心成功举办了水产品竞…

使用Prometheus + Blackbox-exporter快速监控一个网站性能和SSL过期时间

使用blackbox-exporter快速监控一个网站性能和SSL过期时间 环境介绍什么是blackbox-exporter下载blackbox-exporter安装blackbox-exporter配置Prometheus服务端查看job上线监控面板参考文献 环境介绍 本文实验环境 操作系统:Centos 7.9Prometheus版本:…

U-Mail邮件系统为用户提供更加安全的数据保护机制

据外媒报道,近日美国国家安全委员会泄露了其成员的近1万封电子邮件和密码,暴露了政府组织和大公司在内的2000家公司。其中包括美国国家航空航天局和特斯拉等。报道称该漏洞于3月7日被研究人员发现,通过该漏洞攻击者能够访问对web服务器操作至…

哪款电脑桌面日历记事本软件好用?推荐优秀的电脑日历记事本

对于众多上班族而言,每天在电脑前忙碌已成为生活常态。若想提升工作效率,简化繁琐的工作流程,选择一款出色的电脑桌面日历与记事本软件就显得至关重要。 然而,在Windows操作系统上设定提醒显得相当繁琐,而系统自带的记…

创新力作 焕新首发丨捷顺科技·捷曜系列智慧停车新品全新上市

2024捷顺科技智慧停车全家族新品全面上市 全新外观、全新特性、全新体验 新控制机、新道闸、新超眸相机... 每款新品都有哪些功能亮点 带您一探究竟

影响程序员发展,首个关于“软件供应链安全”国家标准发布,你该知道的10个问题!【附标准全文】

近日,GB/T 43698-2024《网络安全技术 软件供应链安全要求》作为国内首个软件供应链安全的国标,对于程序员的影响深远。该标准的实施,不仅为程序员提供了明确的软件安全开发指导,还强化了他们在软件开发过程中对安全性的重视。程序…

如何解决Nginx反向代理不生效?

目录 背景 过程 日志 检查配置文件 重启服务 检查容器内的配置文件 容器和宿主机 其他 背景 用了两年的nginx新加的反向代理不生效 Docker挂载的配置文件启动的Nginx,配置一切正常,但是反向代理不生效,???先自查一波 过程 日志 …

废物回收机构|基于SprinBoot+vue的地方废物回收机构管理系统(源码+数据库+文档)

地方废物回收机构管理系统 目录 基于SprinBootvue的地方废物回收机构管理系统 一、前言 二、系统设计 三、系统功能设计 1管理员功能模块 2 员工功能模块 四、数据库设计 五、核心代码 六、论文参考 七、最新计算机毕设选题推荐 八、源码获取: 博主介绍…

【ZYNQ】GPIO 与 AXI GPIO

在嵌入式开发中,GPIO 是最常见的外设。GPIO 是 General Purpose I/O 的缩写,译为通用输入/输出。GPIO 用于连接外部设备,例如按键、传感器等,实现数字信号的输入或输出功能。本文主要介绍 Zynq GPIO 的基本概念,并对比…

AIGC基础教学:AI+建筑设计,一场划时代变革的序幕已经拉开

2015年9月,美的集团本着把艺术融入民间的理念,邀请了安藤忠雄设计正在筹建中的美术馆。 在历经长达近120天的设计工作之后,美术馆于同年12月动工。这座具有岭南建筑文化意境的美术馆,后来荣获2020年美国建筑大师奖(Architecture …

VMM5310替代方案 (LT8713SX)三路DP或者三路HDMI

兼容USB上的VESA DisplayPort Alt模式 c型标准1.0b ▪DP Alt模式支持引脚分配C, D和E ▪符合USB供电规范3.0 ▪兼容USB Type-C电缆和连接器 规范1.3 ▪内置三CC逻辑和PD控制器充电器和 正常的沟通 ▪支持UFP和DFP数据角色 ▪支持电源,接收器和DRP电源角色 …

Tina-Linux -- 5. 网络通信(有线网络,无线网络,SSH链接)

有线网络 bash 指令 ifconfig eth0 192.168.2.222 netmask 255.255.255.0 up route add default gw 192.168.2.1开机自启 修改网络设置文件 /etc/init.d/S40network #!/bin/sh # # Start the network.... ## Debian ifupdown needs the /run/network lock directory mkdir …

明天(周六)下午!武汉Linux爱好者线下沙龙,我们在华中科技大学等你!

2024 年 5月 25 日(周六)下午,我们将在「武汉市洪山区」 珞喻路 1037 号华中科技大学南五楼 613 室举办武汉 Linux 爱好者线下沙龙(WHLUG),欢迎广大 Linux 爱好者来到现场,与我们一同交流技术&a…

flutter开发实战-flutter播放PAG动画

flutter开发实战-flutter播放PAG动画 最近开发过程中,遇到了PAG动画,这里进行记录一下。 一、什么是PAG? 官网:https://pag.art/ Portable Animated Graphics 是一套完整的动效工作流解决方案。 目标是降低或消除动效相关的研…

【小tips】当机器里面有多个版本的gcc时,该如何切换当前的gcc版本?

背景切换gcc版本 背景 有时候因为项目需求,可能不同的项目需要不同的gcc版本,所以机器上会安装多个版本的gcc,那我们如何切换到想要使用的版本? 切换gcc版本 比如我的机器上有两个版本的gcc: 我当前的版本是gcc-4…

【C++提高编程-03】----C++之STL常用容器基础实战

🎩 欢迎来到技术探索的奇幻世界👨‍💻 📜 个人主页:一伦明悦-CSDN博客 ✍🏻 作者简介: C软件开发、Python机器学习爱好者 🗣️ 互动与支持:💬评论 &…

智简云携手云器Lakehouse打造一体化大数据平台,释放数据价值

导读 本篇分享的是智简云使用云器Lakehouse升级数据平台的实践总结。 智简云,是一家拥有十余年历史的科技公司,专注于企业服务领域,开发了两款核心产品:基于PASS平台的客户关系管理(CRM)系统和为中小型用…

加密与解密(第四版)】第二十三章笔记

第二十三章 代码的二次开发 23.1 数据对齐 23.2 增加空间 利用区块空隙(注意区块属性) 增加区块(增加一个块头、增加块头指向的数据段、调整文件映像的尺寸(SizeOfImage)) 23.3 获得函数的调用信息 修…

用Python的PyAutoGUI库控制鼠标滚轮

哈喽,大家好,我是木头左! 轻松上手:安装与导入 要开始使用pyautogui库,你需要做的第一件事就是确保它已经被安装在你的Python环境中。你可以通过运行以下命令来安装: pip install pyautogui安装完成后&am…