上一篇教程: 如何使用 OpenCV 扫描图像、查找表和时间测量
下一篇教程: 图像操作
| 原作者 | Bernát Gábor |
| 兼容性 | OpenCV >= 3.0 |
矩阵上的掩膜操作非常简单。其思想是,我们根据一个掩膜矩阵(也称为核)重新计算图像中每个像素的值。这个掩膜包含的值将调整相邻像素(和当前像素)对新像素值的影响程度。从数学角度看,我们用指定的值进行加权平均。
让我们考虑图像对比度增强方法的问题。基本上,我们想对图像的每个像素应用以下公式
\[I(i,j) = 5*I(i,j) - [ I(i-1,j) + I(i+1,j) + I(i,j-1) + I(i,j+1)]\]
\[\iff I(i,j)*M, \text{其中 } M = \bordermatrix{ _i\backslash ^j & -1 & 0 & +1 \cr -1 & 0 & -1 & 0 \cr 0 & -1 & 5 & -1 \cr +1 & 0 & -1 & 0 \cr }\]
第一种表示法是使用公式,而第二种是通过使用掩膜对第一种进行压缩。使用掩膜的方法是:将掩膜矩阵的中心(在上图中由零-零索引表示)放在要计算的像素上,然后将像素值与重叠的矩阵值相乘并求和。它们是同一个东西,但在大型矩阵的情况下,后一种表示法更容易查看。
您可以从此处下载此源代码,或者在 OpenCV 源代码库的示例目录中查看 samples/cpp/tutorial_code/core/mat_mask_operations/mat_mask_operations.cpp。
您可以从此处下载此源代码,或者在 OpenCV 源代码库的示例目录中查看 samples/java/tutorial_code/core/mat_mask_operations/MatMaskOperations.java。
您可以从此处下载此源代码,或者在 OpenCV 源代码库的示例目录中查看 samples/python/tutorial_code/core/mat_mask_operations/mat_mask_operations.py。
现在让我们看看如何通过使用基本像素访问方法或使用 filter2D() 函数来实现这一点。
这是一个执行此操作的函数
首先,我们确保输入图像数据为无符号字符格式。为此,我们使用 CV_Assert 函数(宏),当其中的表达式为 false 时,它会抛出错误。
首先,我们确保输入图像数据为无符号 8 位格式。
首先,我们确保输入图像数据为无符号 8 位格式。
我们创建一个与输入图像大小和类型相同的输出图像。正如您在存储部分所看到的,根据通道数,我们可能有一个或多个子列。
我们将通过指针迭代它们,因此元素的总数取决于此数字。
我们将使用普通的 C [] 运算符访问像素。因为我们需要同时访问多行,所以我们将为每行(前一行、当前行和下一行)获取指针。我们还需要另一个指针来保存计算结果。然后简单地使用 [] 运算符访问正确的项。为了向前移动输出指针,我们在每次操作后简单地增加它(一个字节)
在图像的边界,上述表示法会产生不存在的像素位置(例如负一 - 负一)。在这些点,我们的公式是未定义的。一个简单的解决方案是不在这些点应用核,例如,将边界上的像素设置为零
我们需要访问多行多列,这可以通过对当前中心 (i,j) 加减 1 来完成。然后我们应用求和并将新值放入结果矩阵。
在图像的边界,上述表示法会产生不存在的像素位置(例如 (-1,-1))。在这些点,我们的公式是未定义的。一个简单的解决方案是不在这些点应用核,例如,将边界上的像素设置为零
我们需要访问多行多列,这可以通过对当前中心 (i,j) 加减 1 来完成。然后我们应用求和并将新值放入结果矩阵。
在图像处理中,应用此类滤波器非常常见,因此 OpenCV 中有一个函数可以处理掩膜(在某些地方也称为核)的应用。为此,您首先需要定义一个保存掩膜的对象
然后调用 filter2D() 函数,指定输入图像、输出图像和要使用的核
该函数甚至有第五个可选参数来指定核的中心,第六个用于在将过滤后的像素存储到 K 中之前添加一个可选值,第七个用于确定在操作未定义区域(边界)中执行什么操作。
这个函数更短,更简洁,并且由于存在一些优化,它通常比手写方法更快。例如,在我的测试中,第二个只用了 13 毫秒,而第一个用了大约 31 毫秒。这差距相当大。
例如
请在我们的 YouTube 频道上观看运行该程序的实例。
