目标

学习如何将不同的几何变换应用于图像，例如平移、旋转、仿射变换等。
您将学习以下函数：cv.resize，cv.warpAffine，cv.getAffineTransform 和 cv.warpPerspective

变换

缩放

缩放只是调整图像大小。OpenCV 提供了一个名为 cv.resize() 的函数来实现此目的。可以手动指定图像的大小，也可以指定缩放比例。使用不同的插值方法。首选插值方法是用于缩小的 cv.INTER_AREA 和用于缩放的 cv.INTER_CUBIC（慢）和 cv.INTER_LINEAR。

我们使用函数：cv.resize (src, dst, dsize, fx = 0, fy = 0, interpolation = cv.INTER_LINEAR)

参数

src	输入图像
dst	输出图像；它的大小为 dsize（当它不为零时）或从 src.size()、fx 和 fy 计算的大小；dst 的类型与 src 相同。
dsize	输出图像大小；如果它等于零，则计算如下 $𝚍 𝚜 𝚒 𝚣 𝚎 = 𝚂 𝚒 𝚣 𝚎 (𝚛 𝚘 𝚞 𝚗 𝚍 (𝚏 𝚡 * 𝚜 𝚛 𝚌 . 𝚌 𝚘 𝚕 𝚜), 𝚛 𝚘 𝚞 𝚗 𝚍 (𝚏 𝚢 * 𝚜 𝚛 𝚌 . 𝚛 𝚘 𝚠 𝚜))$ dsize 或 fx 和 fy 必须不为零。
fx	水平轴上的缩放比例；当它等于 0 时，计算如下 $(𝚍 𝚘 𝚞 𝚋 𝚕 𝚎) 𝚍 𝚜 𝚒 𝚣 𝚎 . 𝚠 𝚒 𝚍 𝚝 𝚑 / 𝚜 𝚛 𝚌 . 𝚌 𝚘 𝚕 𝚜$
fy	垂直轴上的缩放比例；当它等于 0 时，计算如下 $(𝚍 𝚘 𝚞 𝚋 𝚕 𝚎) 𝚍 𝚜 𝚒 𝚣 𝚎 . 𝚑 𝚎 𝚒 𝚐 𝚑 𝚝 / 𝚜 𝚛 𝚌 . 𝚛 𝚘 𝚠 𝚜$
interpolation	插值方法（请参阅 cv.InterpolationFlags）

试一试

平移

平移是对象位置的移动。如果您知道（x，y）方向的移动量，设为 $(t_{x}, t_{y})$ ，您可以创建如下所示的变换矩阵 $M$

$M = [\begin{matrix} 1 & 0 & t_{x} \\ 0 & 1 & t_{y} \end{matrix}]$

我们使用函数：cv.warpAffine (src, dst, M, dsize, flags = cv.INTER_LINEAR, borderMode = cv.BORDER_CONSTANT, borderValue = new cv.Scalar())

参数

src	输入图像。
dst	输出图像，大小为 dsize，类型与 src 相同。
Mat	2 × 3 变换矩阵（cv.CV_64FC1 类型）。
dsize	输出图像的大小。
flags	插值方法的组合（请参阅 cv.InterpolationFlags）以及可选标志 WARP_INVERSE_MAP，表示 M 是逆变换（ 𝚍𝚜𝚝→𝚜𝚛𝚌 ）
borderMode	像素外推方法（请参阅 cv.BorderTypes）；当 borderMode = BORDER_TRANSPARENT 时，表示目标图像中对应于源图像中“异常值”的像素不会被函数修改。
borderValue	在常量边界情况下使用的值；默认情况下，它为 0。

行。

试一试

旋转

图像以角度 $θ$ 旋转是通过以下形式的变换矩阵实现的

$M = [\begin{matrix} c o s θ & - s i n θ \\ s i n θ & c o s θ \end{matrix}]$

但 OpenCV 提供可调整旋转中心的缩放旋转，以便您可以在任何您喜欢的位置旋转。修改后的变换矩阵由以下公式给出

$[\begin{matrix} α & β & (1 - α) \cdot c e n t e r . x - β \cdot c e n t e r . y \\ - β & α & β \cdot c e n t e r . x + (1 - α) \cdot c e n t e r . y \end{matrix}]$

其中

$\begin{array}{l} α = s c a l e \cdot \cos θ, \\ β = s c a l e \cdot \sin θ \end{array}$

我们使用函数：cv.getRotationMatrix2D (center, angle, scale)

参数

center	源图像中旋转的中心。
angle	旋转角度（以度为单位）。正值表示逆时针旋转（假设坐标原点位于左上角）。
scale	各向同性缩放比例。

试一试

仿射变换

在仿射变换中，原始图像中的所有平行线在输出图像中仍然是平行的。要找到变换矩阵，我们需要输入图像中的三个点以及它们在输出图像中的对应位置。然后 cv.getAffineTransform 将创建一个 2x3 矩阵，该矩阵将传递给 cv.warpAffine。

我们使用函数：cv.getAffineTransform (src, dst)

参数

src	来自输入图像的三个点（[3, 1] 大小和 cv.CV_32FC2 类型）。
dst	输出图像中的三个对应点（[3, 1] 大小和 cv.CV_32FC2 类型）。

试一试

透视变换

对于透视变换，您需要一个 3x3 变换矩阵。即使在变换之后，直线也会保持直线。要找到此变换矩阵，您需要输入图像上的 4 个点以及输出图像上的对应点。在这 4 个点中，其中 3 个不应共线。然后可以通过函数 cv.getPerspectiveTransform 找到变换矩阵。然后将 cv.warpPerspective 应用于此 3x3 变换矩阵。

我们使用函数：cv.warpPerspective (src, dst, M, dsize, flags = cv.INTER_LINEAR, borderMode = cv.BORDER_CONSTANT, borderValue = new cv.Scalar())

参数

src	输入图像。
dst	输出图像，大小为 dsize，类型与 src 相同。
Mat	3 × 3 变换矩阵（cv.CV_64FC1 类型）。
dsize	输出图像的大小。
flags	插值方法的组合（cv.INTER_LINEAR 或 cv.INTER_NEAREST）以及可选标志 WARP_INVERSE_MAP，它将 M 设置为逆变换（ 𝚍𝚜𝚝→𝚜𝚛𝚌 ）。
borderMode	像素外推方法（cv.BORDER_CONSTANT 或 cv.BORDER_REPLICATE）。
borderValue	在常量边界情况下使用的值；默认情况下，它为 0。

cv.getPerspectiveTransform (src, dst)

参数

src	源图像中四边形顶点的坐标。
dst	目标图像中对应四边形顶点的坐标。