目标
在本教程中,您将学习
理论
模板匹配是一种在较大图像中搜索和查找模板图像位置的方法。OpenCV 自带了函数 cv.matchTemplate() 来实现此目的。它只是将模板图像滑过输入图像(如 2D 卷积)并在模板图像下的模板图像和输入图像区域进行比较。OpenCV 中实现了多种比较方法。(您可以查看文档了解更多详情)。它返回一个灰度图像,其中每个像素表示该像素邻域与模板匹配的程度。
如果输入图像的大小为 (WxH),模板图像的大小为 (wxh),那么输出图像的大小为 (W-w+1, H-h+1)。在获得结果后,可以使用 cv.minMaxLoc() 函数来查找最大值/最小值所在的位置。将其作为矩形的左上角,并取 (w,h) 作为矩形的宽度和高度。该矩形就是模板区域。
- 注意
- 如果您使用 cv.TM_SQDIFF 作为比较方法,最小值将给出最佳匹配。
在 OpenCV 中使用模板匹配
在这里,作为示例,我们将在他自己的照片中搜索梅西的脸。因此,我创建了一个如下所示的模板
图片
我们将尝试所有比较方法,以便我们可以看到它们的结果如何
import cv2 as cv
import numpy as np
from matplotlib import pyplot as plt
img =
cv.imread(
'messi5.jpg', cv.IMREAD_GRAYSCALE)
assert img is not None, "找不到文件,请使用 os.path.exists() 检查文件是否存在"
img2 = img.copy()
template =
cv.imread(
'template.jpg', cv.IMREAD_GRAYSCALE)
assert template is not None, "找不到文件,请使用 os.path.exists() 检查文件是否存在"
w, h = template.shape[::-1]
methods = ['cv.TM_CCOEFF', 'cv.TM_CCOEFF_NORMED', 'cv.TM_CCORR',
'cv.TM_CCORR_NORMED', 'cv.TM_SQDIFF', 'cv.TM_SQDIFF_NORMED']
for meth in methods
img = img2.copy()
method = eval(meth)
if method in [cv.TM_SQDIFF, cv.TM_SQDIFF_NORMED]
top_left = min_loc
else:
top_left = max_loc
bottom_right = (top_left[0] + w, top_left[1] + h)
plt.subplot(121),plt.imshow(res,cmap = 'gray')
plt.title('匹配结果'), plt.xticks([]), plt.yticks([])
plt.subplot(122),plt.imshow(img,cmap = 'gray')
plt.title('检测到的点'), plt.xticks([]), plt.yticks([])
plt.suptitle(meth)
plt.show()
void minMaxLoc(InputArray src, double *minVal, double *maxVal=0, Point *minLoc=0, Point *maxLoc=0, InputArray mask=noArray())
在数组中找到全局最小值和最大值。
CV_EXPORTS_W Mat imread(const String &filename, int flags=IMREAD_COLOR)
从文件中加载图像。
void rectangle(InputOutputArray img, Point pt1, Point pt2, const Scalar &color, int thickness=1, int lineType=LINE_8, int shift=0)
绘制简单的、粗的或填充的右上方矩形。
void matchTemplate(InputArray image, InputArray templ, OutputArray result, int method, InputArray mask=noArray())
将模板与重叠的图像区域进行比较。
请参阅以下结果
图片
图片
图片
图片
图片
图片
您会看到使用cv.TM_CCORR的结果与我们预期的不一样。
带有多个对象的模板匹配
在上一节中,我们在图像中搜索梅西的脸,它只在图像中出现一次。假设您正在搜索一个具有多次出现的对象,cv.minMaxLoc()不会为您提供所有位置。在这种情况下,我们将使用阈值处理。所以在这个示例中,我们将使用著名游戏Mario的屏幕截图,然后找到其中的硬币。
import cv2 as cv
import numpy as np
from matplotlib import pyplot as plt
assert img_rgb is not None, "file could not be read, check with os.path.exists()"
template =
cv.imread(
'mario_coin.png', cv.IMREAD_GRAYSCALE)
assert template is not None, "找不到文件,请使用 os.path.exists() 检查文件是否存在"
w, h = template.shape[::-1]
threshold = 0.8
loc = np.where( res >= threshold)
for pt in zip(*loc[::-1])
cv.rectangle(img_rgb, pt, (pt[0] + w, pt[1] + h), (0,0,255), 2)
CV_EXPORTS_W bool imwrite(const String &filename, InputArray img, const std::vector< int > ¶ms=std::vector< int >())
将图像保存到指定的文件中。
void cvtColor(InputArray src, OutputArray dst, int code, int dstCn=0)
将图像从一个颜色空间转换到另一个颜色空间。
结果
图片
更多信息
练习