目标
本章你将学习
理论
模板匹配是一种在较大的图像中搜索和查找模板图像位置的方法。OpenCV 提供了函数cv.matchTemplate()用于此目的。它简单地将模板图像在输入图像上滑动(如同二维卷积),并比较模板和输入图像下模板图像的图像块。OpenCV中实现了多种比较方法。(你可以查看文档了解更多细节)。它返回一个灰度图像,其中每个像素表示该像素的邻域与模板匹配的程度。
如果输入图像的大小为 (WxH),模板图像的大小为 (wxh),则输出图像的大小将为 (W-w+1, H-h+1)。获得结果后,可以使用cv.minMaxLoc()函数查找最大/最小值的位置。将其作为矩形的左上角,并取 (w,h) 作为矩形的宽度和高度。该矩形即为模板区域。
- 注意
- 如果使用 cv.TM_SQDIFF 作为比较方法,最小值表示最佳匹配。
OpenCV中的模板匹配
这里,作为一个例子,我们将在他照片中搜索梅西的脸。所以我创建了如下模板
图像
我们将尝试所有比较方法,以便我们可以看到它们的结果是什么样的
import cv2 as cv
import numpy as np
from matplotlib import pyplot as plt
img =
cv.imread(
'messi5.jpg', cv.IMREAD_GRAYSCALE)
assert img is not None, "文件无法读取,请使用os.path.exists()检查"
img2 = img.copy()
template =
cv.imread(
'template.jpg', cv.IMREAD_GRAYSCALE)
assert template is not None, "文件无法读取,请使用os.path.exists()检查"
w, h = template.shape[::-1]
methods = ['TM_CCOEFF', 'TM_CCOEFF_NORMED', 'TM_CCORR',
'TM_CCORR_NORMED', 'TM_SQDIFF', 'TM_SQDIFF_NORMED']
for meth in methods
img = img2.copy()
method = getattr(cv, meth)
if method in [cv.TM_SQDIFF, cv.TM_SQDIFF_NORMED]
top_left = min_loc
else:
top_left = max_loc
bottom_right = (top_left[0] + w, top_left[1] + h)
plt.subplot(121),plt.imshow(res,cmap = 'gray')
plt.title('匹配结果'), plt.xticks([]), plt.yticks([])
plt.subplot(122),plt.imshow(img,cmap = 'gray')
plt.title('检测点'), plt.xticks([]), plt.yticks([])
plt.suptitle(meth)
plt.show()
void minMaxLoc(InputArray src, double *minVal, double *maxVal=0, Point *minLoc=0, Point *maxLoc=0, InputArray mask=noArray())
查找数组中的全局最小值和最大值。
CV_EXPORTS_W Mat imread(const String &filename, int flags=IMREAD_COLOR_BGR)
从文件中加载图像。
void rectangle(InputOutputArray img, Point pt1, Point pt2, const Scalar &color, int thickness=1, int lineType=LINE_8, int shift=0)
绘制一个简单的、粗的或填充的右上角矩形。
void matchTemplate(InputArray image, InputArray templ, OutputArray result, int method, InputArray mask=noArray())
将模板与重叠的图像区域进行比较。
请参见下面的结果
图像
图像
图像
图像
图像
图像
你可以看到使用cv.TM_CCORR的结果并不像我们预期的那样好。
多个物体的模板匹配
在上一节中,我们搜索了梅西脸的图像,该图像在图像中只出现一次。假设你正在搜索有多个出现次数的物体,cv.minMaxLoc()不会给你所有位置。在这种情况下,我们将使用阈值处理。因此,在这个例子中,我们将使用著名游戏马里奥的截图,并在其中找到金币。
import cv2 as cv
import numpy as np
from matplotlib import pyplot as plt
assert img_rgb is not None, "文件无法读取,请使用os.path.exists()检查"
template =
cv.imread(
'mario_coin.png', cv.IMREAD_GRAYSCALE)
assert template is not None, "文件无法读取,请使用os.path.exists()检查"
w, h = template.shape[::-1]
threshold = 0.8
loc = np.where( res >= threshold)
for pt in zip(*loc[::-1])
cv.rectangle(img_rgb, pt, (pt[0] + w, pt[1] + h), (0,0,255), 2)
CV_EXPORTS_W bool imwrite(const String &filename, InputArray img, const std::vector< int > ¶ms=std::vector< int >())
将图像保存到指定文件。
void cvtColor(InputArray src, OutputArray dst, int code, int dstCn=0, AlgorithmHint hint=cv::ALGO_HINT_DEFAULT)
将图像从一种颜色空间转换为另一种颜色空间。
结果
图像