OpenCV 4.11.0
开源计算机视觉库
加载中…
搜索中…
未找到匹配项
图像基本操作

目标

学习如何:

  • 访问像素值并修改它们
  • 访问图像属性
  • 设置感兴趣区域 (ROI)
  • 分割和合并图像

本节中几乎所有操作都主要与 NumPy 相关,而不是 OpenCV。 掌握 NumPy 知识对于编写更优化的 OpenCV 代码至关重要。

(示例将在 Python 终端中显示,因为大多数示例只是一行代码)

访问和修改像素值

让我们先加载一张彩色图像

>>> import numpy as np
>>> import cv2 as cv
>>> img = cv.imread('messi5.jpg')
>>> assert img is not None, "文件无法读取,请使用 os.path.exists() 检查"
CV_EXPORTS_W Mat imread(const String &filename, int flags=IMREAD_COLOR_BGR)
从文件中加载图像。

您可以通过其行和列坐标访问像素值。对于 BGR 图像,它返回一个包含蓝色、绿色、红色值的数组。对于灰度图像,只返回相应的强度值。

>>> px = img[100,100]
>>> print( px )
[157 166 200]
# 只访问蓝色像素
>>> blue = img[100,100,0]
>>> print( blue )
157

您可以以相同的方式修改像素值。

>>> img[100,100] = [255,255,255]
>>> print( img[100,100] )
[255 255 255]

警告

NumPy 是一个针对快速数组计算进行了优化的库。因此,简单地访问和修改每个像素值的速度非常慢,不建议这样做。

访问图像属性

图像属性包括行数、列数和通道数;图像数据类型;像素总数等。

可以通过 img.shape 访问图像的形状。它返回一个元组,包含行数、列数和通道数(如果图像是彩色的)。

>>> print( img.shape )
(342, 548, 3)
注意
如果图像是灰度图像,则返回的元组只包含行数和列数,因此这是一个检查加载的图像是灰度图像还是彩色图像的好方法。

像素总数可以通过 `img.size` 访问

>>> print( img.size )
562248

图像数据类型通过 `img.dtype` 获取

>>> print( img.dtype )
uint8
注意
img.dtype 在调试过程中非常重要,因为 OpenCV-Python 代码中的许多错误都是由无效的数据类型引起的。

图像 ROI

有时,您需要处理图像的某些区域。对于图像中的眼睛检测,首先对整个图像进行人脸检测。当获得人脸时,我们选择人脸区域,并在其中搜索眼睛,而不是搜索整张图像。这提高了精度(因为眼睛总是在脸上:D)和性能(因为我们在较小的区域内搜索)。

ROI 使用 NumPy 索引获得。这里我选择球并将它复制到图像的另一个区域

>>> ball = img[280:340, 330:390]
>>> img[273:333, 100:160] = ball

查看下面的结果

图像

分割和合并图像通道

有时您需要分别处理图像的 B、G、R 通道。在这种情况下,您需要将 BGR 图像分割成单通道图像。在其他情况下,您可能需要将这些单个通道连接起来以创建 BGR 图像。您可以简单地通过以下方式做到这一点:

>>> b,g,r = cv.split(img)
>>> img = cv.merge((b,g,r))
void split(const Mat &src, Mat *mvbegin)
将多通道数组分割成多个单通道数组。
void merge(const Mat *mv, size_t count, OutputArray dst)
从几个单通道数组创建一个多通道数组。

或者

>>> b = img[:,:,0]

假设您想将所有红色像素设置为零 - 您不需要先分割通道。NumPy 索引更快

>>> img[:,:,2] = 0

警告

cv.split() 是一个代价较高的操作(时间方面)。因此,只有在必要时才使用它。否则,使用 NumPy 索引。

为图像创建边界(填充)

如果您想在图像周围创建边界,类似于相框,您可以使用cv.copyMakeBorder()。 但它在卷积运算、零填充等方面有更多应用。此函数采用以下参数:

  • src - 输入图像
  • topbottomleftright - 相应方向上的像素数的边界宽度
  • borderType - 定义要添加何种边界的标志。它可以是以下类型:
  • value - 如果边界类型为 cv.BORDER_CONSTANT,则为边界的颜色

以下是一个示例代码,演示了所有这些边界类型,以便更好地理解

import cv2 as cv
import numpy as np
from matplotlib import pyplot as plt
BLUE = [255,0,0]
img1 = cv.imread('opencv-logo.png')
assert img1 is not None, "文件无法读取,请使用 os.path.exists() 检查"
replicate = cv.copyMakeBorder(img1,10,10,10,10,cv.BORDER_REPLICATE)
reflect = cv.copyMakeBorder(img1,10,10,10,10,cv.BORDER_REFLECT)
reflect101 = cv.copyMakeBorder(img1,10,10,10,10,cv.BORDER_REFLECT_101)
wrap = cv.copyMakeBorder(img1,10,10,10,10,cv.BORDER_WRAP)
constant= cv.copyMakeBorder(img1,10,10,10,10,cv.BORDER_CONSTANT,value=BLUE)
plt.subplot(231), plt.imshow(img1, 'gray'), plt.title('原始图像')
plt.subplot(232), plt.imshow(replicate, 'gray'), plt.title('复制')
plt.subplot(233), plt.imshow(reflect, 'gray'), plt.title('反射')
plt.subplot(234), plt.imshow(reflect101, 'gray'), plt.title('REFLECT_101')
plt.subplot(235), plt.imshow(wrap, 'gray'), plt.title('环绕')
plt.subplot(236), plt.imshow(constant, 'gray'), plt.title('常数')
plt.show()
void copyMakeBorder(InputArray src, OutputArray dst, int top, int bottom, int left, int right, int borderType, const Scalar &value=Scalar())
在图像周围形成边界。

参见下面的结果。(图像使用matplotlib显示,因此红色和蓝色通道将被交换)

图像