OpenCV 4.11.0
开源计算机视觉库
加载中...
搜索中...
无匹配项
图像金字塔

上一教程: 使用形态学运算提取水平和垂直线
下一教程: 基本的阈值操作

原作者Ana Huamán
兼容性OpenCV >= 3.0

目标

在本教程中,您将学习如何

  • 使用 OpenCV 函数 pyrUp()pyrDown() 对给定图像进行降采样或上采样。

理论

注意
下面的解释来自 Bradski 和 Kaehler 编写的 Learning OpenCV 一书。
  • 通常我们需要将图像转换为与其原始大小不同的尺寸。为此,有两种可能的选择:
    1. 放大图像(放大)或
    2. 缩小图像(缩小)。
  • 虽然 OpenCV 中有一个几何变换函数可以真正地调整图像大小(resize,我们将在以后的教程中介绍),但在本节中,我们首先分析图像金字塔的使用,图像金字塔广泛应用于各种视觉应用中。

图像金字塔

  • 图像金字塔是由一系列图像组成的集合——所有图像都源自单个原始图像——这些图像被连续降采样,直到达到某个所需的停止点。
  • 图像金字塔有两种常见的类型:
    • 高斯金字塔:用于图像降采样
    • 拉普拉斯金字塔:用于从金字塔中较低层(分辨率较低)的图像重建上采样图像
  • 在本教程中,我们将使用高斯金字塔

高斯金字塔

  • 想象一下金字塔是一组层,层级越高,尺寸越小。
  • 每一层都从下到上编号,因此第\(i+1\)层(表示为\(G_{i+1}\))小于第\(i\)层(\(G_{i}\))。
  • 为了生成高斯金字塔中的第\(i+1\)层,我们执行以下操作:

    • 用高斯核卷积\(G_{i}\)

    \[\frac{1}{256} \begin{bmatrix} 1 & 4 & 6 & 4 & 1 \\ 4 & 16 & 24 & 16 & 4 \\ 6 & 24 & 36 & 24 & 6 \\ 4 & 16 & 24 & 16 & 4 \\ 1 & 4 & 6 & 4 & 1 \end{bmatrix}\]

    • 移除所有偶数行和偶数列。
  • 您可以很容易地注意到,生成的图像面积将恰好是其前驱图像的四分之一。对输入图像\(G_{0}\)(原始图像)迭代此过程会生成整个金字塔。
  • 上述过程用于图像降采样。如果我们想让图像更大呢?用零(\(0\))填充偶数行和偶数列
    • 首先,将图像在每个维度上放大到原始图像的两倍,并用新的偶数行和偶数列填充
    • 用上面显示的相同内核(乘以 4)进行卷积,以近似“缺失像素”的值
  • 这两个过程(如上所述的降采样和上采样)由 OpenCV 函数 pyrUp()pyrDown() 实现,我们将在下面的代码示例中看到。
注意
当我们减小图像大小时,实际上是丢失了图像信息。

代码

本教程代码如下所示。

说明

让我们检查程序的总体结构

加载图像

创建窗口

循环

执行无限循环,等待用户输入。如果用户按下 **ESC**,程序将退出。此外,它还有两个选项

  • 执行上采样 - 放大 (按下 'i' 后)

    我们使用具有三个参数的函数 **pyrUp()**

    • src:当前和目标图像(将在屏幕上显示,大概是输入图像的两倍)
    • Size( tmp.cols*2, tmp.rows*2 ):目标大小。由于我们正在进行上采样,**pyrUp()** 期望大小是输入图像(在本例中为 src)的两倍。
  • 执行下采样 - 缩小 (按下 'o' 后)

    我们使用具有三个参数的函数 **pyrDown()**(与 **pyrUp()** 类似)

    • src:当前和目标图像(将在屏幕上显示,大概是输入图像的一半)
    • Size( tmp.cols/2, tmp.rows/2 ):目标尺寸。由于我们进行的是下采样,因此pyrDown() 函数期望目标尺寸为输入图像(此处为src)尺寸的一半。

请注意,输入图像的尺寸必须能够被2整除(长和宽都必须是2的倍数)。否则,程序会报错。

结果

  • 程序默认调用samples/data文件夹中的图像chicky_512.png。请注意,该图像尺寸为\(512 \times 512\),因此下采样不会产生任何错误(\(512 = 2^{9}\))。原始图像如下所示
  • 首先,我们通过按下'd'键连续执行两次pyrDown()操作。输出结果为:
  • 请注意,由于图像尺寸减小,我们应该会损失一些分辨率。在连续两次应用pyrUp()操作(通过按下'u'键)后,这一点就显而易见了。现在的输出结果为: