OpenCV  4.10.0
开源计算机视觉
正在加载...
正在搜索...
无匹配项
仿射变换

上一教程: 重映射
下一教程: 直方图均衡化

原始作者Ana Huamán
兼容性OpenCV >= 3.0

目标

在本教程中,您将学习如何

理论

什么是仿射变换?

  1. 一种可以表示为矩阵乘法(线性变换)后跟向量加法(平移)的变换。
  2. 从上面可以看出,我们可以使用仿射变换来表示

    1. 旋转(线性变换)
    2. 平移(向量加法)
    3. 缩放操作(线性变换)

    您可以看到,本质上,仿射变换表示两个图像之间的关系

  3. 表示仿射变换的常用方法是使用 \(2 \times 3\) 矩阵。

\[ A = \begin{bmatrix} a_{00} & a_{01} \\ a_{10} & a_{11} \end{bmatrix}_{2 \times 2} B = \begin{bmatrix} b_{00} \\ b_{10} \end{bmatrix}_{2 \times 1} \]

\[ M = \begin{bmatrix} A & B \end{bmatrix} = \begin{bmatrix} a_{00} & a_{01} & b_{00} \\ a_{10} & a_{11} & b_{10} \end{bmatrix}_{2 \times 3} \]

考虑到我们想用 \(A\) 和 \(B\) 变换一个 2D 向量 \(X = \begin{bmatrix}x \\ y\end{bmatrix}\),我们可以用

\(T = A \cdot \begin{bmatrix}x \\ y\end{bmatrix} + B\) 或 \(T = M \cdot [x, y, 1]^{T}\)

\[T = \begin{bmatrix} a_{00}x + a_{01}y + b_{00} \\ a_{10}x + a_{11}y + b_{10} \end{bmatrix}\]

如何获得仿射变换?

  1. 我们提到仿射变换基本上是两个图像之间的关系。关于这种关系的信息大致可以通过两种方式获得
    1. 我们知道 \(X\) 和 T,也知道它们之间存在关系。那么我们的任务就是找到 \(M\)
    2. 我们知道 \(M\) 和 \(X\)。为了得到 \(T\),我们只需要应用 \(T = M \cdot X\)。我们关于 \(M\) 的信息可能是明确的(例如,具有 2×3 矩阵),或者可以作为点之间的几何关系来获得。
  2. 让我们用一种更好的方式解释这一点(b)。由于 \(M\) 关联 2 个图像,我们可以分析最简单的情况,即它关联两个图像中的三个点。看下图

点 1、2 和 3(在图像 1 中形成一个三角形)映射到图像 2 中,仍然形成一个三角形,但现在它们已经发生了显著的变化。如果我们用这 3 个点(你可以根据自己的喜好选择它们)找到仿射变换,那么我们可以将这种找到的关系应用于图像中的所有像素。

代码

  • 该程序做什么?
    • 加载图像
    • 对图像应用仿射变换。该变换是从三个点之间的关系中得到的。为此,我们使用函数 cv::warpAffine
    • 在变换后,对图像应用旋转。该旋转相对于图像中心。
    • 等待用户退出程序

说明

  • 加载图像

  • 仿射变换: 如上所述,我们需要两组 3 个点来推导出仿射变换关系。请看

    你可能想绘制这些点以更好地了解它们如何变化。它们的位置与示例图(在理论部分)中描绘的点的位置大致相同。你可以注意到由 3 个点定义的三角形的尺寸和方向发生了变化。

  • 有了这两组点,我们可以使用 OpenCV 函数 cv::getAffineTransform 计算仿射变换

    我们得到一个 \(2 \times 3\) 矩阵作为输出(在本例中为 warp_mat

  • 然后我们将刚找到的仿射变换应用于 src 图像

    使用以下参数

    • src: 输入图像
    • warp_dst: 输出图像
    • warp_mat: 仿射变换
    • warp_dst.size(): 输出图像的期望尺寸

    我们得到了第一张变换后的图像!我们将在下一步显示它。在这之前,我们还想旋转它...

  • 旋转: 要旋转图像,我们需要知道两件事

    1. 图像旋转的中心
    2. 要旋转的角度。在 OpenCV 中,正角度表示逆时针方向
    3. 可选: 缩放因子

    我们使用以下代码片段定义这些参数

  • 我们使用 OpenCV 函数 cv::getRotationMatrix2D 生成旋转矩阵,该函数返回一个 \(2 \times 3\) 矩阵(在本例中为 rot_mat

  • 现在我们将找到的旋转应用于之前变换的输出

  • 最后,我们在两个窗口中显示我们的结果,以及原始图像以供参考

  • 我们只需要等待用户退出程序

结果

  • 编译上面的代码后,我们可以将图像的路径作为参数传递给它。例如,对于像这样的图片

应用第一个仿射变换后,我们得到

最后,应用负旋转(记住负表示顺时针方向)和缩放因子后,我们得到