分水岭算法是一种经典的图像分割技术,广泛应用于图像处理领域。它的名称源自地理学中的“分水岭”概念,即在地形中,水从高处流向低处,最终汇聚成河流的过程。在图像分割中,分水岭算法将灰度图像视为地形,将像素值看作海拔高度。该算法模拟水从各个局部最小值(即山谷)向外扩展,最终在山峰相遇处形成分割边界。
分水岭算法的步骤
-
图像预处理:
- 首先,对输入图像进行灰度化处理,然后通过高斯模糊等方法进行平滑,减少噪声的影响。
-
图像二值化:
- 通过阈值分割,将图像二值化。通常,采用 Otsu 方法自动确定最佳阈值,以确保前景和背景的有效分离。
-
形态学操作:
- 使用形态学开运算去除噪点,并通过膨胀操作填补前景中的空洞,以获得较为平滑的背景区域。
-
确定前景和背景:
- 应用距离变换技术,确定前景区域。通过对开运算结果进行距离变换,可以计算前景物体到边缘的距离。然后,通过设定阈值分割,得到前景区域。
- 背景区域通过膨胀操作从前景区域推导出来。
-
找到未知区域:
- 通过将背景区域和前景区域相减,得到未知区域。这些区域通常位于前景和背景之间,是分割的关键部分。
-
标记连通区域:
- 对确定的前景区域进行连通区域标记,以标识不同的物体。为了避免背景标记为零,通常将所有标记值加 1,然后将未知区域标记为 0。
-
应用分水岭算法:
- 最后,应用分水岭算法,通过不断扩展标记区域,最终在不同物体之间形成分割边界。
代码实现
以下是使用分水岭算法进行图像分割的完整代码示例:
import cv2
import numpy as np
import matplotlib.pyplot as plt
from matplotlib.font_manager import FontProperties
# 设置字体为黑体,避免中文显示乱码
font = FontProperties(fname="C:/Windows/Fonts/simhei.ttf", size=12)
# 读取图像
image = cv2.imread('yibgbi.png') # 将路径替换为你的图像路径
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY) # 转换为灰度图像
blurred = cv2.GaussianBlur(gray, (5, 5), 0) # 应用高斯模糊,平滑图像
# 二值化图像(使用Otsu方法进行阈值分割)
_, binary = cv2.threshold(blurred, 0, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU)
# 形态学操作去噪点和填补空洞
kernel = np.ones((3, 3), np.uint8) # 定义3x3的卷积核
opening = cv2.morphologyEx(binary, cv2.MORPH_OPEN, kernel, iterations=3) # 开运算去除噪点
# 确定背景区域(膨胀操作)
sure_bg = cv2.dilate(opening, kernel, iterations=3) # 膨胀操作填补空洞,得到确定的背景
# 确定前景区域(距离变换和阈值分割)
dist_transform = cv2.distanceTransform(opening, cv2.DIST_L2, 5) # 距离变换
_, sure_fg = cv2.threshold(dist_transform, 0.1 * dist_transform.max(), 255, 0) # 阈值分割得到确定的前景区域
sure_fg = np.uint8(sure_fg) # 转换为8位整型
# 找到未知区域
unknown = cv2.subtract(sure_bg, sure_fg) # 背景减去前景得到未知区域
# 标记连通区域
_, markers = cv2.connectedComponents(sure_fg) # 连通组件标记
# 所有标记加一,确保背景不是0
markers = markers + 1
# 将未知区域标记为0
markers[unknown == 255] = 0
# 应用分水岭算法
markers = cv2.watershed(image, markers)
image[markers == -1] = [255, 0, 0] # 用红色标记分割边界
# 绘制结果
plt.figure(figsize=(14, 12))
plt.subplot(2, 4, 1)
plt.title("原始图像", fontproperties=font)
plt.imshow(cv2.cvtColor(image, cv2.COLOR_BGR2RGB))
plt.subplot(2, 4, 2)
plt.title("二值化图像", fontproperties=font)
plt.imshow(binary, cmap='gray')
plt.subplot(2, 4, 3)
plt.title("开运算去噪点", fontproperties=font)
plt.imshow(opening, cmap='gray')
plt.subplot(2, 4, 4)
plt.title("确定的背景", fontproperties=font)
plt.imshow(sure_bg, cmap='gray')
plt.subplot(2, 4, 5)
plt.title("确定的前景", fontproperties=font)
plt.imshow(sure_fg, cmap='gray')
plt.subplot(2, 4, 6)
plt.title("未知区域", fontproperties=font)
plt.imshow(unknown, cmap='gray')
plt.subplot(2, 4, 7)
plt.title("距离变换", fontproperties=font)
plt.imshow(dist_transform, cmap='gray')
plt.subplot(2, 4, 8)
plt.title("分水岭分割结果", fontproperties=font)
plt.imshow(cv2.cvtColor(image, cv2.COLOR_BGR2RGB))
plt.show()