OpenCV 4.11.0
开源计算机视觉库
加载中…
搜索中…
无匹配项
使用分水岭算法进行图像分割

目标

  • 我们将学习如何使用基于标记的分水岭算法进行图像分割。
  • 我们将学习:cv.watershed()

理论

任何灰度图像都可以看作一个地形表面,其中高强度表示山峰和丘陵,而低强度表示山谷。您可以用不同颜色的水(标签)填充每个孤立的山谷(局部最小值)。随着水位的上升,根据附近的山峰(梯度),不同山谷(显然颜色不同)的水会开始合并。为避免这种情况,您需要在水合并的位置建立屏障。您继续填充水和建造屏障的工作,直到所有山峰都在水下。然后,您创建的屏障会给出分割结果。这就是分水岭算法背后的“理念”。您可以访问CMM 分水岭算法网页,借助一些动画来理解它。

但是,由于图像中的噪声或其他不规则性,这种方法会产生过度分割的结果。因此,OpenCV 实现了一种基于标记的分水岭算法,您可以在其中指定要合并哪些谷点,哪些不合并。这是一种交互式图像分割。我们的做法是为我们已知的对象赋予不同的标签。将我们确定为前景或对象的区域标记为一种颜色(或强度),将我们确定为背景或非对象的区域标记为另一种颜色,最后,我们将不确定的区域标记为 0。这就是我们的标记。然后应用分水岭算法。然后我们的标记将使用我们给出的标签进行更新,并且对象的边界将具有 -1 的值。

代码

下面我们将看到一个示例,说明如何将距离变换与分水岭算法结合使用以分割相互接触的对象。

考虑下面的硬币图像,硬币彼此接触。即使您对其进行阈值处理,它们也会彼此接触。

我们首先找到硬币的近似估计。为此,我们可以使用 Otsu 二值化。

尝试一下

现在我们需要去除图像中任何小的白色噪点。为此,我们可以使用形态学开运算。为了去除对象中的任何小孔,我们可以使用形态学闭运算。因此,现在我们可以确定对象中心附近的区域是前景,远离对象的区域是背景。我们不确定的区域只是硬币的边界区域。

因此,我们需要提取我们确信是硬币的区域。腐蚀会去除边界像素。因此,任何剩余的部分,我们都可以确定它是硬币。如果物体没有相互接触,这将有效。但由于它们相互接触,另一个不错的选择是找到距离变换并应用适当的阈值。接下来,我们需要找到我们确定不是硬币的区域。为此,我们对结果进行膨胀。膨胀将物体边界增加到背景。通过这种方式,我们可以确保结果中的背景区域确实是背景,因为边界区域已被移除。请参见下图。

尝试一下

剩下的区域是我们不知道是硬币还是背景的区域。分水岭算法应该找到它。这些区域通常位于硬币的边界附近,前景和背景相遇的地方(甚至两个不同的硬币相遇)。我们称之为边界。它可以通过从 sure_bg 区域减去 sure_fg 区域获得。

我们使用函数:cv.distanceTransform (src, dst, distanceType, maskSize, labelType = cv.CV_32F)

参数
src8 位单通道(二值)源图像。
dst包含计算距离的输出图像。它是一个与 src 大小相同的 8 位或 32 位浮点单通道图像。
distanceType距离类型(参见cv.DistanceTypes)。
maskSize距离变换掩码的大小,参见 (cv.DistanceTransformMasks)。
labelType输出图像类型。可以是 cv.CV_8U 或 cv.CV_32F。cv.CV_8U 类型只能用于函数的第一个变体,并且 distanceType == DIST_L1。

尝试一下

在阈值图像中,我们得到一些我们确信是硬币的硬币区域,并且它们现在已经分离。(在某些情况下,您可能只对前景分割感兴趣,而不是分离相互接触的对象。在这种情况下,您不需要使用距离变换,只需要腐蚀就足够了。腐蚀只是另一种提取确定前景区域的方法,仅此而已。)

尝试一下

现在我们确定哪些是硬币区域,哪些是背景区域。因此,我们创建一个标记(它是一个与原始图像大小相同但数据类型为 int32 的数组)并在其中标记区域。我们确定的区域(无论是前景还是背景)都用任何正整数标记,但整数不同,而我们不确定的区域则保留为零。为此,我们使用cv.connectedComponents()。它将图像的背景标记为 0,然后其他对象用从 1 开始的整数标记。

但我们知道,如果背景标记为 0,则分水岭算法会将其视为未知区域。因此,我们希望用不同的整数标记它。相反,我们将用 0 标记由 unknown 定义的未知区域。

现在我们的标记已准备就绪。是时候进行最后一步了,应用分水岭算法。然后标记图像将被修改。边界区域将标记为 -1。

我们使用函数:cv.connectedComponents (image, labels, connectivity = 8, ltype = cv.CV_32S)

参数
image要标记的 8 位单通道图像。
labels目标标记图像(cv.CV_32SC1 类型)。
connectivity分别为 8 路或 4 路连接的 8 或 4。
ltype输出图像标签类型。目前支持 cv.CV_32S 和 cv.CV_16U。

我们使用函数:cv.watershed (image, markers)

参数
image输入 8 位 3 通道图像。
markers输入/输出 32 位单通道标记图像(地图)。它应该与 image 大小相同。

尝试一下