OpenCV 4.12.0
开源计算机视觉
加载中...
搜索中...
无匹配项
使用分水岭算法进行图像分割

目标

  • 我们将学习如何使用基于标记的图像分割,使用分水岭算法
  • 我们将学习:cv.watershed()

原理

任何灰度图像都可以被视为一个地形表面,其中高强度表示峰和山,而低强度表示谷。你开始用不同颜色的水(标签)填充每一个孤立的谷(局部最小值)。随着水位的上升,取决于附近的山峰(梯度),来自不同山谷的水,显然具有不同的颜色,将开始合并。为了避免这种情况,你会在水合并的位置建立屏障。你继续进行注水和建立屏障的工作,直到所有的山峰都被水淹没。然后,你创建的屏障会给你分割结果。这就是分水岭背后的“哲学”。你可以访问CMM 关于分水岭的网页,通过一些动画来理解它。

但是,由于图像中的噪声或任何其他不规则性,这种方法会给你过度分割的结果。因此,OpenCV 实现了一种基于标记的分水岭算法,你可以在其中指定哪些谷点要合并,哪些不要。这是一种交互式图像分割。我们所做的是为我们知道的物体赋予不同的标签。用一种颜色(或强度)标记我们确定是前景或物体的区域,用另一种颜色标记我们确定是背景或非物体的区域,最后,对于我们不确定的区域,用 0 标记它。这就是我们的标记。然后应用分水岭算法。然后我们的标记将被我们给定的标签更新,物体的边界值将为 -1。

代码

下面我们将看到一个例子,说明如何使用距离变换与分水岭来分割相互接触的物体。

考虑下面的硬币图像,硬币相互接触。即使你对其进行阈值处理,它们仍将相互接触。

我们首先找到硬币的近似估计。为此,我们可以使用 Otsu 的二值化。

尝试一下

现在我们需要去除图像中的任何小的白色噪声。为此,我们可以使用形态学开运算。为了去除物体中的任何小孔,我们可以使用形态学闭运算。所以,现在我们确信物体中心附近的区域是前景,而远离物体的区域是背景。我们不确定的唯一区域是硬币的边界区域。

因此,我们需要提取我们确定的区域是硬币。腐蚀会去除边界像素。因此,无论剩下什么,我们都可以确定它是硬币。如果物体没有相互接触,这将有效。但是由于它们相互接触,另一个好的选择是找到距离变换并应用适当的阈值。接下来,我们需要找到我们确定不是硬币的区域。为此,我们膨胀结果。膨胀会将物体边界增加到背景。这样,我们可以确保结果中背景中的任何区域都是真正的背景,因为边界区域已被删除。请参见下图。

尝试一下

剩余的区域是我们没有任何想法的区域,无论它是硬币还是背景。分水岭算法应该找到它。这些区域通常在硬币的边界附近,前景和背景相遇的地方(或者甚至是两个不同的硬币相遇的地方)。我们称之为边界。它可以从 sure_bg 区域中减去 sure_fg 区域获得。

我们使用函数:cv.distanceTransform (src, dst, distanceType, maskSize, labelType = cv.CV_32F)

参数
src8 位,单通道(二进制)源图像。
dst具有计算距离的输出图像。它是与 src 大小相同的 8 位或 32 位浮点,单通道图像。
distanceType距离类型(参见cv.DistanceTypes)。
maskSize距离变换掩码的大小,请参见(cv.DistanceTransformMasks)。
labelType输出图像的类型。它可以是 cv.CV_8U 或 cv.CV_32F。类型 cv.CV_8U 只能用于函数的第一个变体,并且 distanceType == DIST_L1。

尝试一下

在阈值图像中,我们获得了一些我们确定是硬币的区域,并且它们现在已分离。(在某些情况下,你可能只对前景分割感兴趣,而不是分离相互接触的物体。在这种情况下,你不需要使用距离变换,只需腐蚀就足够了。腐蚀只是提取确定前景区域的另一种方法,仅此而已。)

尝试一下

现在我们确定了哪些是硬币区域,哪些是背景等等。所以我们创建标记(它是一个与原始图像大小相同的数组,但具有 int32 数据类型)并在其中标记区域。我们确定(无论是前景还是背景)的区域都标有任何正整数,但不同的整数,并且我们不确定的区域只是保留为零。为此,我们使用cv.connectedComponents()。它用 0 标记图像的背景,然后其他对象用从 1 开始的整数标记。

但是我们知道如果背景标记为 0,分水岭会将其视为未知区域。所以我们想用不同的整数标记它。相反,我们将用 0 标记由未知定义的未知区域。

现在我们的标记已准备就绪。是最后一步的时候了,应用分水岭。然后标记图像将被修改。边界区域将被标记为 -1。

我们使用函数:cv.connectedComponents (image, labels, connectivity = 8, ltype = cv.CV_32S)

参数
image要标记的 8 位单通道图像。
labels目标标记图像(cv.CV_32SC1 类型)。
connectivity8 或 4 分别用于 8 向或 4 向连通性。
ltype输出图像标签类型。目前支持 cv.CV_32S 和 cv.CV_16U。

我们使用函数:cv.watershed (image, markers)

参数
image输入 8 位 3 通道图像。
markers标记的输入/输出 32 位单通道图像(映射)。它应该与 image 的大小相同。

尝试一下