OpenCV 4.12.0
开源计算机视觉
加载中...
搜索中...
无匹配项
仿射变换

上一个教程: 重映射
下一个教程: 直方图均衡化

原始作者Ana Huamán
兼容性OpenCV >= 3.0

目标

在本教程中,您将学习如何

理论

什么是仿射变换?

  1. 一种可以通过矩阵乘法(线性变换)然后进行向量加法(平移)来表示的变换。
  2. 由上可知,我们可以使用仿射变换来表达

    1. 旋转(线性变换)
    2. 平移(向量加法)
    3. 缩放操作(线性变换)

    您可以看到,仿射变换本质上表示了两个图像之间的关系

  3. 表示仿射变换的常用方法是使用 \(2 \times 3\) 矩阵。

    \[ A = \begin{bmatrix} a_{00} & a_{01} \\ a_{10} & a_{11} \end{bmatrix}_{2 \times 2} B = \begin{bmatrix} b_{00} \\ b_{10} \end{bmatrix}_{2 \times 1} \]

    \[ M = \begin{bmatrix} A & B \end{bmatrix} = \begin{bmatrix} a_{00} & a_{01} & b_{00} \\ a_{10} & a_{11} & b_{10} \end{bmatrix}_{2 \times 3} \]

    考虑到我们想使用 \(A\) 和 \(B\) 变换一个二维向量 \(X = \begin{bmatrix}x \\ y\end{bmatrix}\),我们也可以通过以下方式实现:

    \(T = A \cdot \begin{bmatrix}x \\ y\end{bmatrix} + B\) 或 \(T = M \cdot [x, y, 1]^{T}\)

    \[T = \begin{bmatrix} a_{00}x + a_{01}y + b_{00} \\ a_{10}x + a_{11}y + b_{10} \end{bmatrix}\]

如何获取仿射变换?

  1. 我们提到仿射变换本质上是两个图像之间的关系。关于这种关系的信息大致可以通过两种方式获得:
    1. 我们同时知道 \(X\) 和 \(T\),并且知道它们之间存在关系。那么我们的任务就是找到 \(M\)
    2. 我们知道 \(M\) 和 \(X\)。要获取 \(T\),我们只需要应用 \(T = M \cdot X\)。关于 \(M\) 的信息可以是显式的(即拥有 2x3 矩阵),也可以是点之间的几何关系。
  2. 让我们更好地解释这一点(b)。由于 \(M\) 关联两个图像,我们可以分析最简单的情况,即它关联两个图像中的三个点。请看下图

点1、2和3(在图像1中形成一个三角形)被映射到图像2中,仍然形成一个三角形,但现在它们已经发生了显著变化。如果我们用这3个点找到仿射变换(您可以随意选择它们),那么我们就可以将这种找到的关系应用于图像中的所有像素。

代码

  • 此程序的作用是什么?
    • 加载图像
    • 对图像应用仿射变换。此变换是通过三个点之间的关系获得的。我们为此使用函数 cv::warpAffine
    • 对变换后的图像应用旋转。此旋转是相对于图像中心的
    • 等待用户退出程序

解释

  • 加载图像

  • 仿射变换:如上所述,我们需要两组3个点来推导仿射变换关系。请看

    您可能想绘制这些点,以便更好地了解它们如何变化。它们的位置与示例图(在理论部分)中所示的位置大致相同。您可能会注意到由3个点定义的三角形的大小和方向发生了变化。

  • 有了这两组点,我们使用OpenCV函数 cv::getAffineTransform 计算仿射变换。

    我们得到一个 \(2 \times 3\) 矩阵作为输出(在本例中为 warp_mat

  • 然后我们将刚刚找到的仿射变换应用于源图像

    参数如下

    • src: 输入图像
    • warp_dst: 输出图像
    • warp_mat: 仿射变换
    • warp_dst.size(): 输出图像的期望尺寸

    我们刚刚得到了第一张变换后的图像!我们将在一会儿显示它。在此之前,我们还想旋转它...

  • 旋转:要旋转图像,我们需要知道两件事

    1. 图像将围绕其旋转的中心
    2. 要旋转的角度。在OpenCV中,正角度表示逆时针方向
    3. 可选: 缩放因子

    我们通过以下代码片段定义这些参数

  • 我们使用OpenCV函数 cv::getRotationMatrix2D 生成旋转矩阵,它返回一个 \(2 \times 3\) 矩阵(在本例中为 rot_mat

  • 现在我们将找到的旋转应用于我们先前变换的输出图像

  • 最后,我们会在两个窗口中显示结果,并额外显示原始图像以作比较

  • 我们只需等待用户退出程序

结果

  • 编译上述代码后,我们可以将图像路径作为参数传递。例如,对于一张图片,如下所示:

应用第一次仿射变换后,我们得到

最后,在应用负旋转(请记住负值表示顺时针)和缩放因子后,我们得到