目标

我们将学习如何使用基于标记的图像分割以及分水岭算法
我们将学习：cv.watershed()

理论

任何灰度图像都可以视为地形表面，其上高强度表示峰值和山丘，而低强度表示山谷。你开始用不同的颜色水（标签）填充每个孤立山谷（局部最小值）。随着水位上升，根据附近的峰值（梯度值），来自不同山谷的水（显然具有不同的颜色）将开始合并。为了避免这种情况，你需要在水合并的地方构建障碍物。你将继续填充水并构建障碍物，直至所有峰值均被水淹没。然后，你创建的障碍物为你提供分割结果。这是分水岭背后的“理念”。你可以访问CMM 网站了解分水岭，并在一些动画的帮助下加以理解。

但由于图像中存在噪声或任何其他不规则问题，此方法为你提供了过度分割的结果。因此，OpenCV 实施了一种基于标记的分水岭算法，其中你可以指定要合并哪些山谷点，哪些不要合并。这是一项交互式图像分割。我们要做的是为我们已知的对象设置不同的标签。使用一种颜色（或强度）标记我们确定为前景或对象的区域，使用另一种颜色标记我们确定为背景或非对象的区域，最后，使用 0 标记我们不确定的区域。这是我们的标记。然后应用分水岭算法。然后，我们的标记将使用我们给出的标签进行更新，并且对象的边界将采用 -1 的值。

代码

下面我们将看到一个示例，了解如何将距离变换与分水岭结合使用以分割相互接触的对象。

考虑下面的硬币图像，这些硬币是相互接触的。即使对其进行阈值处理，它也将相互接触。

我们从对硬币进行近似估计开始。为此，我们可以使用大津二值化。

试一试

现在我们需要移除图像中任何的小白噪声。为此，我们可以使用形态学开操作。要移除物体中的任何小空洞，我们可以使用形态学闭操作。所以，现在我们能肯定地知道，靠近物体中心区域的是前景，远离物体的区域是背景。我们不确定的区域只有硬币的边界区域。

所以我们需要提取我们肯定为硬币的区域。侵蚀移除了边界像素。所以剩下的无论是什么，我们都能肯定它是硬币。如果物体没有互相接触，那将奏效。但是既然它们互相接触，另一种不错的选择是查找距离变换并应用合适的阈值。接下来，我们需要查找我们肯定不是硬币的区域。为此，我们膨胀了结果。膨胀将物体的边界扩展到背景。通过这种方式，我们可以确保结果中背景中的任何区域都真正是背景，因为边界区域已移除。参见下图。

试试看

剩下的区域是我们不知道是硬币还是背景的区域。分水岭算法应该可以找到它。这些区域通常在前景和背景相遇的硬币边界周围（或甚至两个不同的硬币相遇）。我们称之为边框。它可以通过从 sure_bg 区域中减去 sure_fg 区域得到。

我们使用函数：cv.distanceTransform (src, dst, distanceType, maskSize, labelType = cv.CV_32F)

参数

src	8 位、单通道（二进制）源图像。
dst	带有计算距离的输出图像。它是与 src 大小相同的 8 位或 32 位浮点单通道图像。
distanceType	距离类型（参见 cv.DistanceTypes）。
maskSize	距离变换掩模的大小，参见 (cv.DistanceTransformMasks）。
labelType	输出图像的类型。它可以是 cv.CV_8U 或 cv.CV_32F。类型 cv.CV_8U 只能用于该函数的第一个变体，distanceType == DIST_L1。

试试看

在阈值化的图像中，我们得到了一些我们确信是硬币的区域，现在它们是分离的。（在某些情况下，你可能只对前景分割感兴趣，而不是分离相互接触的物体。在这种情况下，你不需要使用距离变换，仅侵蚀就足够了。侵蚀只是提取确定前景区域的另一种方法，仅此而已。）

试试看

我们现在确切知道硬币的区域、背景等等。因此，我们创建标记（这是一个数组，与原始图像大小相同，但具有 int32 数据类型），并在其中标记区域。对于我们确知（无论是前景还是背景）的区域，都使用任意正整数（但不同的整数）进行标记，而我们不确定的区域则保留为零。为此，我们使用cv.connectedComponents()。它用 0 标记图像的背景，然后其他对象从 1 开始使用整数进行标记。

但我们知道，如果将背景标记为 0，分水岭会将其视为未知区域。因此，我们要用不同的整数对其进行标记。相反，我们将用 0 标记未知区域（由 unknown 定义）。

现在，我们的标记已准备就绪。是时候进行最后一步，应用分水岭。然后，标记图像将被修改。边界区域将标记为 -1。

我们使用以下函数：cv.connectedComponents (image, labels, connectivity = 8, ltype = cv.CV_32S)

参数

image	要标记的 8 位单通道图像。
labels	标记的的目标图像（cv.CV_32SC1 类型）。
connectivity	分别表示 8 路或 4 路连通性的 8 或 4。
ltype	输出图像标签类型。目前支持 cv.CV_32S 和 cv.CV_16U。

我们使用以下函数：cv.watershed (image, markers)

参数

image	输入 8 位 3 通道图像。
markers	标记的输入/输出 32 位单通道图像（映射）。它应与 image 大小相同。

目标

理论

代码

试一试

试试看

试试看

试试看

试用