探索图像分割技术:使用 OpenCV 的分水岭算法

news2025/1/12 6:56:15
贾斯卡兰·巴蒂亚

一、说明

        图像分割是计算机视觉的一个基本方面,多年来经历了巨大的转变。这将是一系列三篇博客文章,深入研究三种不同的图像分割技术 - 1使用OpenCV的经典分水岭算法,2使用PyTorch实现的基于深度学习的UNet模型,3 SOTA图像分割模型。同时,这部分重点介绍分水岭算法及其使用 OpenCV 的实现。在下一部分中,我们还将在人类分割数据集上训练UNet模型,展示基于深度学习的技术的强大功能和适用性。

二、什么是图像分割?

        图像分割涉及将图像分区为多个段或区域,每个段或区域包含一组像素。最终目标是将图像的表示简化或修改为更有意义的内容,从而使其更易于分析。这些技术已广泛应用于从图像中的物体识别到医学成像诊断的众多应用中。

三、经典路线:使用 OpenCV 的分水岭算法

        在传统的图像分割方法领域,分水岭算法占有重要地位。该算法将图像可视化为地形景观,在图像内生成“集水盆地”和“分水岭线”以隔离不同的对象。以简化的方式,任何灰度影像都可以被视为地形表面,其中高强度表示山峰和丘陵,而低强度表示山谷。

        尽管在概念上易于理解和有效,但分水岭算法有时会导致过度分割,即对象被分成许多段。但是,微调算法并添加预处理步骤可以提高算法的性能。

四、分水岭算法和OpenCV

  1. 阈值:在分水岭算法的上下文中,阈值在识别图像的某些部分方面起着重要作用。将图像转换为灰度后,该算法对灰度图像应用阈值以获得有助于分离前景(要分割的对象)和背景的二进制图像。
# Load image
img = cv2.imread('water_coins.jpg')
imshow("Original image", img)

# Grayscale
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

# Threshold using OTSU
ret, thresh = cv2.threshold(gray, 0, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU)
imshow("Thresholded", thresh)

        2.开运算(侵蚀后扩张):在此步骤中,执行打开操作,即侵蚀操作,然后进行扩张操作。此步骤的目的主要是消除噪音。侵蚀操作消除了图像中的小白噪声,但它也会缩小我们的对象。在此之后,通过膨胀操作,我们可以保留物体的大小,同时将噪声拒之门外。

        先让我们了解侵蚀和扩张

  1. 侵蚀:此操作会侵蚀前景对象的边界。它的工作原理是创建一个卷积内核并将其传递到图像上。如果内核下区域中的任何像素为黑色,则内核中间的像素设置为黑色。此操作可有效消除小白噪声。
  2. 扩张:侵蚀后进行扩张,这本质上与侵蚀相反。它将像素添加到图像中对象的边界。如果内核下区域中的任何像素为白色,则内核中间的像素设置为白色。
# noise removal
kernel = np.ones((3,3), np.uint8)
opening = cv2.morphologyEx(thresh, cv2.MORPH_OPEN,kernel, iterations = 2)

        让我们分解一下:

  1. 创建内核: np.ones((3,3),np.uint8) 创建一个 3x3 矩阵,所有元素为“1”。这体现了我们形态学操作的“结构元素”。它可以是不同的形状(方形、圆形等),但在这里,我们使用方形。
  2. 应用开运算: cv2.morphologyEx(thresh, cv2.MORPH_OPEN, kernel, iterations = 2) 应用开运算。 'thresh' 是阈值处理后获得的二值图像,cv2.MORPH_OPEN 表示我们要执行开运算,'kernel'是我们的结构元素,'iterations = 2' 表示我们要执行该操作两次。
  3. 用于背景识别的膨胀:在此步骤中,膨胀操作用于识别图像的背景区域。上一步的结果是,噪声已被消除,受到膨胀。膨胀后,物体(或前景)周围的很大一部分有望成为背景区域(因为膨胀会扩展物体)。这个“确定背景”区域有助于分水岭算法的后续步骤,我们的目标是识别不同的段/对象。
# sure background area
sure_bg = cv2.dilate(opening, kernel, iterations=3)

        4. 距离变换:流域算法涉及应用距离变换来识别可能成为前景的区域。下面是此步骤的代码:

# Finding sure foreground area
dist_transform = cv2.distanceTransform(opening, cv2.DIST_L2,5)
ret, sure_fg = cv2.threshold(dist_transform, 0.7 * dist_transform.max(), 255, 0)

        在此步骤中,我们将执行两项操作:

  • 应用距离变换: cv2.distanceTransform 函数使用 cv2.DIST_L2(欧几里德距离)计算从每个二值图像像素到最近的零像素的距离。距离变换帮助我们识别可能位于前景的区域。函数 cv2.distanceTransform(opening, cv2.DIST_L2, 5) 计算此变换。
  • 对距离变换进行阈值处理:计算距离变换后,我们对该变换后的图像应用阈值处理以获得确定的前景区域。 cv2.threshold(dist_transform, 0.7*dist_transform.max(), 255, 0) 函数调用应用阈值。第二个参数 0.7*dist_transform.max() 将阈值级别设置为距离变换找到的最大距离的 70%。距离变换值高于此阈值的像素被设置为确定前景。

        5.识别未知区域:我们识别未知区域,即既不是确定前景也不是确定背景的区域。我们首先将确定的前景(sure_fg)转换为无符号的8位整数。然后我们从确定背景(sure_bg)中减去确定前景以获得未知区域。未知区域是分水岭算法的关键,因为它表示不同对象之间或对象与背景之间的过渡区域。

# Finding unknown region
sure_fg = np.uint8(sure_fg)
unknown = cv2.subtract(sure_bg, sure_fg)

imshow("SureFG", sure_fg)
imshow("SureBG", sure_bg)
imshow("unknown", unknown)

  • sure_fg(确定前景):硬币占据的区域,或者更确切地说,硬币的中心(由于使用了距离变换和随后的阈值),将被标识为确定前景。
  • sure_bg(确定背景):硬币周围的区域以及硬币内部足够大以至于无法通过形态操作去除的任何区域都标记为确定背景。从本质上讲,这些是没有硬币的区域。
  • 未知(未知区域):这些区域既不是确定前景的一部分,也不是确定背景的一部分。这些是靠近硬币边缘的区域,算法没有足够的信心将它们指定为前景(硬币)或背景(硬币周围的区域)。

        6. 标记sure_bg、sure_fg和未知区域:这涉及创建标记并标记其中的区域。我们标记的区域是确定背景 ()、确定前景 () 和未知区域。下面是此步骤的代码片段:sure_bgsure_fg

# Marker labelling
# Connected Components determines the connectivity of blob-like regions in a binary image.
ret, markers = cv2.connectedComponents(sure_fg)

# Add one to all labels so that sure background is not 0, but 1
markers = markers+1

# Now, mark the region of unknown with zero
markers[unknown==255] = 0

        此外,我们希望确定背景的标记与确定前景不同,我们为标记图像中的所有标签添加 1。执行此操作后,确定背景像素标记为 1,确定前景像素从 2 开始标记。

7. 应用分水岭算法

        接下来,步骤是将分水岭算法应用于标记(在前面的步骤中找到的标记区域)

markers = cv2.watershed(img,markers)
img[markers == -1] = [255,0,0]
imshow("img", img)

        cv2.watershed() 函数修改标记图像(标记)本身。对象的边界在标记图像中用 -1 标记。图像中的不同对象用不同的正整数标记。我们不确定是背景还是前景的区域是由分水岭算法确定的——它们要么被分配给背景,要么被分配给某个对象,从而在对象和背景之间产生清晰的边界划分。

五、分水岭算法如何工作?

        流域算法中的“洪水”和“大坝建设”概念本质上是一种描述算法如何工作的隐喻方式

  1. 泛滥:“泛洪”过程是指根据图像的梯度扩展每个标记区域(标记)。在此上下文中,梯度表示地形高程,高强度像素值表示峰值,低强度像素值表示山谷。洪水从山谷或强度值最低的地区开始。泛洪过程的执行方式是,图像中的每个像素都被分配一个标签。它收到的标签取决于哪个标记的“洪水”首先到达它。如果一个像素与多个标记等距,则它目前仍作为未知区域的一部分。
  2. 大坝建设: 随着洪水过程的继续,来自不同标记(代表图像中的不同区域)的洪水最终将开始相遇。当他们这样做时,就会建造一个“大坝”。在算法方面,这种大坝建设对应于标记图像中边界的创建。这些边界被分配一个特殊的标签(通常为 -1)。大坝建在不同标记的洪水相遇的位置,这些位置通常是图像中强度快速变化的区域 - 表示图像中不同区域之间的边界。

        应用分水岭算法后,我们的标记图像(最初具有确定前景、确定背景和未知区域的标签)现在包含图像中每个不同对象的标签。我们有效地将图像分割成不同的对象(硬币)和背景。

六、结论

        分水岭算法提供了一种直观高效的图像分割方法,允许从复杂图像中有意义地提取特征。使用 OpenCV 库在 Python 中的实际实现进一步简化了该过程,并提供了一种执行图像分割的快速方法。虽然它的基本形式可能会受到过度分割的影响,但适当的图像预处理和参数调整可以有效地解决这个问题,使其成为图像分析领域的强大工具。永远记住,分割技术的选择取决于项目的具体要求和约束。

参考资料:

What is OpenCV? The Complete Guide (2023) - viso.ai

Jaskaran Bhatia – Medium        

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1116887.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

httpd服务

文章目录 httpd服务1.安装httpd服务2.开启服务,设置服务开机自启立马生效,并查看服务状态3.查看监听端口4.关闭防火墙,设置防火墙开机不自启立马生效;关闭selinux5.写一个index.html文件,在真机浏览器访问测试效果6.查…

【活体检测】“深度学习驱动的人脸反欺诈检测系统:性能提升与多模型支持“

微调小视科技开源静默活体检测模型加载方式,性能提升8倍 I. 引言 在当今数字化时代,人脸反欺诈检测在各种应用中发挥着重要作用,从人脸识别到金融欺诈检测。为了满足不断增长的需求,深度学习技术已成为关键工具,但性…

openGauss学习笔记-105 openGauss 数据库管理-管理用户及权限-默认权限机制

文章目录 openGauss学习笔记-105 openGauss 数据库管理-管理用户及权限-默认权限机制 openGauss学习笔记-105 openGauss 数据库管理-管理用户及权限-默认权限机制 数据库对象创建后,进行对象创建的用户就是该对象的所有者。openGauss安装后的默认情况下&#xff0c…

PowerShell 实现email发送消息

前言 通过Windows powershel​​​​​​​l脚本实现邮件发送 前提条件 开启wmi,配置网卡,参考 脚本说明解释 配置SMTP服务器信息 $smtpServer = "smtp.qiye.163.com"$smtpPort = "25"$username = "XXXX@YOU_email"$password = "YOU_…

改造xxl-job适配nacos注册中心

xxl-job并没有对nacos、zookeeper这一类注册中心进行适配,所以需要进行改造。 改造目标 1.对调度器,需要能注册到nacos上,并且执行器管理里的 机器地址 能使用 lb://serviceName 这种地址 2.对执行器,需要能注册到nacos上&…

激活MacBook的时候有个“文件保险箱磁盘加密“的选项,要不要开启

背景 在激活MacBook的时候,如果填了Apple ID,就会有 “文件保险箱磁盘加密” 的选项,到底是开还是不开呢? 注意,如果激活时跳过Apple ID,则没这选项,可以后续在 “设置->安全性和隐私->文…

天鹰340亿(AquilaChat2-34B-16K)本地部署的解决方案

大家好,我是herosunly。985院校硕士毕业,现担任算法研究员一职,热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名,CCF比赛第二名,科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法…

用WordCloud绘制词云

文章目录 初步认识基本参数掩模参数 初步认识 wordcloud是词云绘图模块,封装了WordCloud词云类,是词云的基本载体。在新建一个词云之后,通过generate装载用以生成词云的字符串,最后用to_file把词云图保存到文件中,例如…

TechSmith Camtasia Studio 23.3.2.49471 Crack

全新的Camtasia 2023.2 Camtasia Studio是专业的屏幕录像和视频编辑的软件套装。软件提供了强大的屏幕录像(Camtasia Recorder)、视频的剪辑和编辑(Camtasia Studio)、视频菜单制作(Camtasia MenuMaker)、视…

基于沙猫群优化的BP神经网络(分类应用) - 附代码

基于沙猫群优化的BP神经网络(分类应用) - 附代码 文章目录 基于沙猫群优化的BP神经网络(分类应用) - 附代码1.鸢尾花iris数据介绍2.数据集整理3.沙猫群优化BP神经网络3.1 BP神经网络参数设置3.2 沙猫群算法应用 4.测试结果&#x…

Linux常用命令——cmp命令

在线Linux命令查询工具 cmp 比较两个文件是否有差异 补充说明 cmp命令用来比较两个文件是否有差异。当相互比较的两个文件完全一样时,则该指令不会显示任何信息。若发现有差异,预设会标示出第一个不通之处的字符和列数编号。若不指定任何文件名称或是…

TIA博途中通过SCATTER指令实现将字节BYTE拆分成单个位的具体方法示例

TIA博途中通过SCATTER指令实现将字节BYTE拆分成单个位的具体方法示例 例如: 我们想判断某个字节中各个位的状态是1还是0 ,如何实现呢? 这里介绍通过SCATTER指令拆分字节的方法,仅供大家参考。 首先,我们先了解以下SCATTER指令的基本功能和使用方法: 如下图所示,在基本指…

无纸化办公小程序数据交互、wxs的使用

前言 很多同志们再写小程序的过程中,不知道该怎么发起HTTP请求到后端,在Web环境中发起HTTPS请求是很常见的,但是微信小程序是腾讯内部的产品,不能直接打开一个外部的链接。例如,在微信小程序中不能直接打开www.taobao…

冒泡排序、插入排序、选择排序和快速排序的原理

下面是对冒泡排序、插入排序、选择排序和快速排序的原理的简要解释: 冒泡排序(Bubble Sort):冒泡排序是一种简单的排序算法。它通过多次迭代比较相邻的元素,并交换它们的位置,使得较大(或较小&…

1600*D. Maximum Sum on Even Positions(贪心)

Problem - 1373D - Codeforces 解析: 显然可以发现,翻转数量为奇数是不影响结果,所以需要反转偶数个连续数字。 考虑贪心,我们每次反转相邻的两个数字,并且累计贡献,如果贡献为0则清空继续累计,…

Element Plus el-select选择框失去焦点blur

正常情况下&#xff0c;可以使用 el-select 自带的方法 blur 事件来使select失去焦点 示例&#xff1a; <el-select v-model"value" ref"selectRef"><el-optionv-for"item in options":key"item.value":label"item.la…

SQL sever中的存储过程

在Oracle的专篇中我也有仔细总结了存储过程的相关内容&#xff0c; 文章链接&#xff1a;http://t.csdnimg.cn/Z8AnH 尽管Oracle和SQL sever之间是存在一些区别&#xff0c;但许多基本的概念和原则在Oracle和SQL Server之间是通用的。它们之间有一些常见的区别&#xff0c;如下…

毅速科普课堂丨3D打印随形水路模具制造的一般流程

随形水路模具因其能大幅度提升冷却效率、缩短冷却时间、提升产品良率、提高生产效率的特点受到广泛应用&#xff0c;通常一件3D打印随形水路模具的制造需要经过多个步骤&#xff0c;包括设计、打印、后处理等多个环节&#xff0c;以确保模具的质量和性能符合预期需求。 首先&am…

分型+预后模型多层面验证,干湿结合直达7+

今天给同学们分享一篇铜死亡分型预后模型实验的生信文章“Construction and validation of a cuproptosis-related prognostic model for glioblastoma”&#xff0c;这篇文章于2023年2月6日发表在Front Immunol期刊上&#xff0c;影响因子为7.3。 铜死亡是一种新报道的程序性细…

【大模型AIGC系列课程 3-8】AI 代理的应用

1. 如果有一群角色(AI Agent)会发生什么? Generative Agents: Interactive Simulacra of Human Behavior Paper: https://arxiv.org/abs/2304.03442 Demo: https://reverie.herokuapp.com/arXiv_Demo/ 我们的生成式代理架构。代理感知(Perceive)其环境(Env),所有感知都…