opencv-27 阈值处理 cv2.threshold()

news2025/2/20 16:46:20

怎么理解阈值处理?

阈值处理（Thresholding）是一种常用的图像处理技术，在机器学习和计算机视觉中经常被用于二值化图像或二分类任务。它基于设定一个阈值来将像素值进行分类，将像素值大于或小于阈值的部分分为两个不同的类别，从而得到二值化的图像或进行二分类预测。

在图像处理中的阈值处理：

图像二值化：将灰度图像转换为二值图像，其中像素值大于或等于阈值的部分设为一个值（通常为255），而小于阈值的部分设为另一个值（通常为0）。
自适应阈值处理：根据图像局部的灰度特点来自动调整不同区域的阈值，适应图像的不同部分。

在二分类任务中的阈值处理：

对于分类模型的输出概率：将模型输出的概率值与阈值进行比较，大于阈值的样本被划分为一个类别，小于阈值的样本被划分为另一个类别。
对于回归模型的输出：将模型输出的连续值与阈值进行比较，大于阈值的样本被划分为一个类别，小于阈值的样本被划分为另一个类别。

阈值处理的应用场景

图像二值化：将灰度图像转换为二值图像，常用于图像分割、边缘检测、形态学运算等图像处理任务。
自适应阈值处理：根据图像局部的灰度特点来自动调整不同区域的阈值，适应图像的不同部分。适用于光照不均匀或对比度变化较大的图像。
目标检测中的二分类：在目标检测任务中，通常需要将模型输出的概率值转换为二分类结果，判断目标是否存在。
人脸识别和人脸表情分析：在人脸图像处理中，可以通过阈值处理来检测和分析人脸的不同表情或情绪。
图像分割：将图像分为多个区域，常用于图像分析、目标提取和图像理解等任务。
文字识别和OCR（光学字符识别）：在文字识别任务中，可以通过阈值处理将图像中的文字部分提取出来，便于后续识别过程。
遥感图像处理：在遥感图像中，阈值处理可以用于土地覆盖分类、植被检测等应用。
信号处理：在信号处理中，可以通过阈值处理来检测信号的起始点或结束点，以及滤除噪声。
异常检测：在异常检测任务中，可以使用阈值处理来识别异常点或异常事件。
机器学习中的二分类问题：在机器学习中，对于二分类任务，可以通过设定阈值来将模型输出的概率值转换为类别标签。

OpenCV 提供了函数 cv2.threshold()和函数 cv2.adaptiveThreshold()，用于实现阈值处理

threshold 函数

OpenCV 3.0 使用 cv2.threshold()函数进行阈值化处理，该函数的语法格式为：

retval, dst = cv2.threshold( src, thresh, maxval, type )

式中：
 retval 代表返回的阈值。
 dst 代表阈值分割结果图像，与原始图像具有相同的大小和类型。
 src 代表要进行阈值分割的图像，可以是多通道的，8 位或 32 位浮点型数值。
 thresh 代表要设定的阈值。
 maxval 代表当 type 参数为 THRESH_BINARY 或者 THRESH_BINARY_INV 类型时，需要设定的最大值。
 type 代表阈值分割的类型，具体类型值如表 6-1 所示。

在这里插入图片描述
上述公式相对抽象，可以将其可视化，具体如图 6-2 所示。

在这里插入图片描述

二值化阈值处理（cv2.THRESH_BINARY）

二值化阈值处理会将原始图像处理为仅有两个值的二值图像，其示意图如图 6-3 所示。其
针对像素点的处理方式为：

对于灰度值大于阈值thresh的像素点，将其灰度值设定为最大值。
对于灰度值小于或等于阈值thresh的像素点，将其灰度值设定为 0

在这里插入图片描述
如果使用表达式表示，其目标值的产生规则为：

在这里插入图片描述
式中，thresh是选定的特定阈值。

在 8 位图像中，最大值是 255。因此，在对 8 位灰度图像进行二值化时，如果将阈值设定
为 127，那么：

所有大于 127 的像素点会被处理为 255。
其余值会被处理为 0。

为了方便，在后续说明中，我们都以 8 位图像为例，即像素值最大值为 255。

实验:使用函数 cv2.threshold()对数组进行二值化阈值处理，观察处理结果

import cv2
import numpy as np
img=np.random.randint(0,256,size=[4,5],dtype=np.uint8)

t,rst=cv2.threshold(img,127,255,cv2.THRESH_BINARY)
print("img=\n",img)
print("t=",t)
print("rst=\n",rst)

运行结果:

img=
 [[235  26  81   7 121]
 [ 81  82  15  64  40]
 [156 250 246  30 226]
 [136 202 129 243  65]]
t= 127.0
rst=
 [[255   0   0   0   0]
 [  0   0   0   0   0]
 [255 255 255   0 255]
 [255 255 255 255   0]]

实验2:使用函数 cv2.threshold()对图像进行二值化阈值处理

import cv2
img=cv2.imread("lena.png")
#将图像转换为灰度图像
img=cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)
t,rst=cv2.threshold(img,127,255,cv2.THRESH_BINARY)
cv2.imshow("img",img)
cv2.imshow("rst",rst)
cv2.waitKey()
cv2.destroyAllWindows()

运行结果:

在这里插入图片描述
左图是原始图像，右图是二值化阈值处理结果。

反二值化阈值处理（cv2.THRESH_BINARY_INV）

反二值化阈值处理的结果也是仅有两个值的二值图像，与二值化阈值处理的区别在于，二
者对像素值的处理方式不同。反二值化阈值处理针对像素点的处理方式为：
 对于灰度值大于阈值的像素点，将其值设定为 0。
 对于灰度值小于或等于阈值的像素点，将其值设定为 255。
反二值化阈值处理方式的示意图如图 6-5 所示。

在这里插入图片描述
如果使用表达式来表示，其目标值的产生规则为：

在这里插入图片描述
式中，thresh 是选定的阈值.

实验3:使用函数 cv2.threshold()对数组进行反二值化阈值处理

import cv2
import numpy as np
img=np.random.randint(0,256,size=[4,5],dtype=np.uint8)
t,rst=cv2.threshold(img,127,255,cv2.THRESH_BINARY_INV)
print("img=\n",img)
print("t=",t)
print("rst=\n",rst)

运行程序，结果如下所示：

img=
[[ 56 64 150 48 41]
[108 165 112 213 110]
[122 244 10 213 46]
[247 30 90 0 26]]
t= 127.0
rst=
[[255 255 0 255 255]
[255 0 255 0 255]
[255 0 255 0 255]
[ 0 255 255 255 255]]

大于127的置为0,小于127的置为255

后面还有

截断阈值化处理（cv2.THRESH_TRUNC）
超阈值零处理（cv2.THRESH_TOZERO_INV）
低阈值零处理（cv2.THRESH_TOZERO）

感兴趣的同学自己去多实操几遍

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/798102.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！