详细说明

本节描述的函数和类用于对二维图像（以 Mat 表示）执行各种线性或非线性滤波操作。这意味着对于源图像（通常是矩形）中的每个像素位置 \((x,y)\)，都会考虑其邻域并用于计算响应。在线性滤波器的情况下，它是像素值的加权和。在形态学操作的情况下，它是最小值或最大值，依此类推。计算出的响应存储在目标图像的相同位置 \((x,y)\)。这意味着输出图像将与输入图像具有相同的大小。通常，这些函数支持多通道数组，在这种情况下，每个通道都是独立处理的。因此，输出图像也将具有与输入图像相同的通道数。

本节描述的函数和类的另一个共同特征是，与简单的算术函数不同，它们需要对外推一些不存在的像素值。例如，如果您想使用高斯 \(3 \times 3\) 滤波器平滑图像，那么在处理每行最左侧的像素时，您需要它们左侧的像素，即图像之外的像素。您可以让这些像素与图像最左侧的像素相同（“复制边界”外推方法），或者假设所有不存在的像素都是零（“常量边界”外推方法），依此类推。OpenCV 允许您指定外推方法。有关详细信息，请参阅 BorderTypes

深度组合

输入深度 (src.depth())	输出深度 (ddepth)
CV_8U	-1/CV_16S/CV_32F/CV_64F
CV_16U/CV_16S	-1/CV_32F/CV_64F
CV_32F	-1/CV_32F
CV_64F	-1/CV_64F

注意: 当 ddepth=-1 时，输出图像将具有与源图像相同的深度。; 如果您需要双精度浮点精度并使用单精度浮点输入数据（CV_32F 输入和 CV_64F 输出深度组合），可以使用 Mat::convertTo 将输入数据转换为所需的精度。

枚举
enum	cv::MorphShapes { cv::MORPH_RECT = 0 , cv::MORPH_CROSS = 1 , cv::MORPH_ELLIPSE = 2 , cv::MORPH_DIAMOND = 3 }
	结构元素的形状更多...

enum	cv::MorphTypes { cv::MORPH_ERODE = 0 , cv::MORPH_DILATE = 1 , cv::MORPH_OPEN = 2 , cv::MORPH_CLOSE = 3 , cv::MORPH_GRADIENT = 4 , cv::MORPH_TOPHAT = 5 , cv::MORPH_BLACKHAT = 6 , cv::MORPH_HITMISS = 7 }
	形态学操作类型更多...

enum	cv::SpecialFilter { cv::FILTER_SCHARR = -1 }

函数
void	cv::bilateralFilter (InputArray src, OutputArray dst, int d, double sigmaColor, double sigmaSpace, int borderType=BORDER_DEFAULT)
	对图像应用双边滤波。

void	cv::blur (InputArray src, OutputArray dst, Size ksize, Point anchor=Point(-1,-1), int borderType=BORDER_DEFAULT)
	使用归一化框式滤波（normalized box filter）模糊图像。

void	cv::boxFilter (InputArray src, OutputArray dst, int ddepth, Size ksize, Point anchor=Point(-1,-1), bool normalize=true, int borderType=BORDER_DEFAULT)
	使用框式滤波模糊图像。

void	cv::buildPyramid (InputArray src, OutputArrayOfArrays dst, int maxlevel, int borderType=BORDER_DEFAULT)
	构建图像的高斯金字塔。

void	cv::dilate (InputArray src, OutputArray dst, InputArray kernel, Point anchor=Point(-1,-1), int iterations=1, int borderType=BORDER_CONSTANT, const Scalar &borderValue=morphologyDefaultBorderValue())
	使用特定的结构元素膨胀图像。

void	cv::erode (InputArray src, OutputArray dst, InputArray kernel, Point anchor=Point(-1,-1), int iterations=1, int borderType=BORDER_CONSTANT, const Scalar &borderValue=morphologyDefaultBorderValue())
	使用特定的结构元素腐蚀图像。

void	cv::filter2D (InputArray src, OutputArray dst, int ddepth, InputArray kernel, Point anchor=Point(-1,-1), double delta=0, int borderType=BORDER_DEFAULT)
	将图像与卷积核进行卷积。

void	cv::GaussianBlur (InputArray src, OutputArray dst, Size ksize, double sigmaX, double sigmaY=0, int borderType=BORDER_DEFAULT, AlgorithmHint hint=cv::ALGO_HINT_DEFAULT)
	使用高斯滤波器模糊图像。

void	cv::getDerivKernels (OutputArray kx, OutputArray ky, int dx, int dy, int ksize, bool normalize=false, int ktype=CV_32F)
	返回用于计算图像空间导数的滤波器系数。

Mat	cv::getGaborKernel (Size ksize, double sigma, double theta, double lambd, double gamma, double psi=CV_PI *0.5, int ktype=CV_64F)
	返回 Gabor 滤波器系数。

Mat	cv::getGaussianKernel (int ksize, double sigma, int ktype=CV_64F)
	返回高斯滤波器系数。

Mat	cv::getStructuringElement (int shape, Size ksize, Point anchor=Point(-1,-1))
	返回用于形态学操作的指定大小和形状的结构元素。

void	cv::Laplacian (InputArray src, OutputArray dst, int ddepth, int ksize=1, double scale=1, double delta=0, int borderType=BORDER_DEFAULT)
	计算图像的拉普拉斯算子。

void	cv::medianBlur (InputArray src, OutputArray dst, int ksize)
	使用中值滤波器模糊图像。

static Scalar	cv::morphologyDefaultBorderValue ()
	返回腐蚀和膨胀的“魔术”边界值。在膨胀操作中，它会自动转换为 Scalar::all(-DBL_MAX)。

void	cv::morphologyEx (InputArray src, OutputArray dst, int op, InputArray kernel, Point anchor=Point(-1,-1), int iterations=1, int borderType=BORDER_CONSTANT, const Scalar &borderValue=morphologyDefaultBorderValue())
	执行高级形态学变换。

void	cv::pyrDown (InputArray src, OutputArray dst, const Size &dstsize=Size(), int borderType=BORDER_DEFAULT)
	模糊并下采样图像。

void	cv::pyrMeanShiftFiltering (InputArray src, OutputArray dst, double sp, double sr, int maxLevel=1, TermCriteria termcrit=TermCriteria(TermCriteria::MAX_ITER+TermCriteria::EPS, 5, 1))
	执行图像均值漂移分割的初始步骤。

void	cv::pyrUp (InputArray src, OutputArray dst, const Size &dstsize=Size(), int borderType=BORDER_DEFAULT)
	上采样并模糊图像。

void	cv::Scharr (InputArray src, OutputArray dst, int ddepth, int dx, int dy, double scale=1, double delta=0, int borderType=BORDER_DEFAULT)
	使用 Scharr 算子计算图像的一阶 x 或 y 导数。

void	cv::sepFilter2D (InputArray src, OutputArray dst, int ddepth, InputArray kernelX, InputArray kernelY, Point anchor=Point(-1,-1), double delta=0, int borderType=BORDER_DEFAULT)
	对图像应用可分离线性滤波器。

void	cv::Sobel (InputArray src, OutputArray dst, int ddepth, int dx, int dy, int ksize=3, double scale=1, double delta=0, int borderType=BORDER_DEFAULT)
	使用扩展 Sobel 算子计算图像的一阶、二阶、三阶或混合导数。

void	cv::spatialGradient (InputArray src, OutputArray dx, OutputArray dy, int ksize=3, int borderType=BORDER_DEFAULT)
	使用 Sobel 算子同时计算 x 和 y 方向的一阶图像导数。

void	cv::sqrBoxFilter (InputArray src, OutputArray dst, int ddepth, Size ksize, Point anchor=Point(-1, -1), bool normalize=true, int borderType=BORDER_DEFAULT)
	计算与滤波器重叠的像素值的归一化平方和。

void	cv::stackBlur (InputArray src, OutputArray dst, Size ksize)
	使用 stackBlur 模糊图像。

枚举值 (Enumerator)
MORPH_RECT Python: cv.MORPH_RECT	矩形结构元素 \[E_{ij}=1\]
MORPH_CROSS Python: cv.MORPH_CROSS	十字形结构元素 \[E_{ij} = \begin{cases} 1 & \texttt{if } {i=\texttt{anchor.y } {or } {j=\texttt{anchor.x}}} \\0 & \texttt{otherwise} \end{cases}\]
MORPH_ELLIPSE Python: cv.MORPH_ELLIPSE	内切于矩形 Rect(0, 0, esize.width, esize.height) 椭圆形结构元素，即一个实心内切椭圆
MORPH_DIAMOND Python: cv.MORPH_DIAMOND	由曼哈顿距离定义的菱形结构元素

枚举值 (Enumerator)
MORPH_ERODE Python: cv.MORPH_ERODE	参见 erode
MORPH_DILATE Python: cv.MORPH_DILATE	参见 dilate
MORPH_OPEN Python: cv.MORPH_OPEN	开运算 \[\texttt{dst} = \mathrm{open} ( \texttt{src} , \texttt{element} )= \mathrm{dilate} ( \mathrm{erode} ( \texttt{src} , \texttt{element} ))\]
MORPH_CLOSE Python: cv.MORPH_CLOSE	闭运算 \[\texttt{dst} = \mathrm{close} ( \texttt{src} , \texttt{element} )= \mathrm{erode} ( \mathrm{dilate} ( \texttt{src} , \texttt{element} ))\]
MORPH_GRADIENT Python: cv.MORPH_GRADIENT	形态学梯度 \[\texttt{dst} = \mathrm{morph\_grad} ( \texttt{src} , \texttt{element} )= \mathrm{dilate} ( \texttt{src} , \texttt{element} )- \mathrm{erode} ( \texttt{src} , \texttt{element} )\]
MORPH_TOPHAT Python: cv.MORPH_TOPHAT	“顶帽”运算 \[\texttt{dst} = \mathrm{tophat} ( \texttt{src} , \texttt{element} )= \texttt{src} - \mathrm{open} ( \texttt{src} , \texttt{element} )\]
MORPH_BLACKHAT Python: cv.MORPH_BLACKHAT	“黑帽”运算 \[\texttt{dst} = \mathrm{blackhat} ( \texttt{src} , \texttt{element} )= \mathrm{close} ( \texttt{src} , \texttt{element} )- \texttt{src}\]
MORPH_HITMISS Python: cv.MORPH_HITMISS	“击中击不中”运算。仅支持 CV_8UC1 二值图像。教程可以在文档中找到。

void cv::bilateralFilter	(	InputArray	src,
		OutputArray	dst,
		int	d,
		double	sigmaColor,
		double	sigmaSpace,
		int	borderType = BORDER_DEFAULT )

src	源 8 位或浮点型，1 通道或 3 通道图像。
dst	目标图像，与 src 具有相同的大小和类型。
d	滤波期间使用的每个像素邻域的直径。如果它是非正数，则从 sigmaSpace 计算得出。
sigmaColor	颜色空间中的滤波器 sigma。该参数值越大，像素邻域内（参见 sigmaSpace）较远颜色将被混合在一起，从而产生更大的半等色区域。
sigmaSpace	坐标空间中的滤波器 sigma。该参数值越大，只要颜色足够接近（参见 sigmaColor），较远的像素就会相互影响。当 d>0 时，它指定邻域大小而不考虑 sigmaSpace。否则，d 与 sigmaSpace 成正比。
borderType	用于外推图像外部像素的边界模式，请参阅 BorderTypes

void cv::blur	(	InputArray	src,
		OutputArray	dst,
		Size	ksize,
		点 (Point)	anchor = Point(-1,-1),
		int	borderType = BORDER_DEFAULT )

src	输入图像；它可以具有任意数量的通道，这些通道是独立处理的，但深度应为 CV_8U、CV_16U、CV_16S、CV_32F 或 CV_64F。
dst	输出图像，与 src 具有相同的大小和类型。
ksize	模糊内核大小。
锚点 (anchor)	锚点位置；默认值 Point(-1,-1) 表示锚点位于内核中心。
borderType	用于外推图像外部像素的边界模式，请参阅 BorderTypes。不支持 BORDER_WRAP。

void cv::boxFilter	(	InputArray	src,
		OutputArray	dst,
		int	ddepth,
		Size	ksize,
		点 (Point)	anchor = Point(-1,-1),
		bool	normalize = true,
		int	borderType = BORDER_DEFAULT )

src	输入图像。
dst	输出图像，与 src 具有相同的大小和类型。
ddepth	输出图像深度（-1 使用 src.depth()）。
ksize	模糊内核大小。
锚点 (anchor)	锚点位置；默认值 Point(-1,-1) 表示锚点位于内核中心。
normalize	标志，指定内核是否按其面积归一化。
borderType	用于外推图像外部像素的边界模式，请参阅 BorderTypes。不支持 BORDER_WRAP。

void cv::buildPyramid	(	InputArray	src,
		OutputArrayOfArrays	dst,
		int	maxlevel,
		int	borderType = BORDER_DEFAULT )

src	源图像。支持类型列表请查看 pyrDown。
dst	目标向量，包含 maxlevel+1 幅与 src 具有相同类型的图像。dst[0] 将与 src 相同。dst[1] 是下一金字塔层，即平滑且缩小尺寸后的 src，依此类推。
maxlevel	最后一层（最小层）金字塔的从 0 开始的索引。它必须是非负数。
borderType	像素外推方法，请参阅 BorderTypes（不支持 BORDER_CONSTANT）

src	输入图像；通道数可以是任意的，但深度应为 CV_8U、CV_16U、CV_16S、CV_32F 或 CV_64F 之一。
dst	输出图像，与 src 具有相同的大小和类型。
kernel	用于膨胀的结构元素；如果 element=Mat()，则使用 3 x 3 矩形结构元素。内核可以使用 getStructuringElement 创建
锚点 (anchor)	锚点在元素内的位置；默认值 (-1, -1) 表示锚点位于元素中心。
iterations	应用膨胀的次数。
borderType	像素外推方法，请参阅 BorderTypes。不支持 BORDER_WRAP。
borderValue	常量边界情况下的边界值

src	输入图像；通道数可以是任意的，但深度应为 CV_8U、CV_16U、CV_16S、CV_32F 或 CV_64F 之一。
dst	输出图像，与 src 具有相同的大小和类型。
kernel	用于腐蚀的结构元素；如果 `element=Mat()`，则使用 `3 x 3` 矩形结构元素。内核可以使用 getStructuringElement 创建。
锚点 (anchor)	锚点在元素内的位置；默认值 (-1, -1) 表示锚点位于元素中心。
iterations	应用腐蚀的次数。
borderType	像素外推方法，请参阅 BorderTypes。不支持 BORDER_WRAP。
borderValue	常量边界情况下的边界值

src	输入图像；图像可以具有任意数量的通道，这些通道是独立处理的，但深度应为 CV_8U、CV_16U、CV_16S、CV_32F 或 CV_64F。
dst	输出图像，与 src 具有相同的大小和类型。
ksize	高斯内核大小。ksize.width 和 ksize.height 可以不同，但它们必须都是正数且为奇数。或者，它们可以是零，然后根据 sigma 计算得出。
sigmaX	X 方向的高斯内核标准差。
sigmaY	Y 方向的高斯内核标准差；如果 sigmaY 为零，则将其设置为等于 sigmaX，如果两个 sigma 都是零，则分别从 ksize.width 和 ksize.height 计算得出（详见 getGaussianKernel）；为了在未来可能的修改中完全控制结果，建议指定所有 ksize、sigmaX 和 sigmaY。
borderType	像素外推方法，请参阅 BorderTypes。不支持 BORDER_WRAP。
提示 (hint)	实现修改标志。参见 AlgorithmHint

kx	行滤波器系数的输出矩阵。其类型为 ktype。
ky	列滤波器系数的输出矩阵。其类型为 ktype。
dx	关于 x 的导数阶数。
dy	关于 y 的导数阶数。
ksize	光圈大小。可以是 FILTER_SCHARR、1、3、5 或 7。
normalize	指示是否归一化（缩小）滤波器系数的标志。理论上，系数的分母应为 \(=2^{ksize*2-dx-dy-2}\)。如果您打算对浮点图像进行滤波，则可能会使用归一化内核。但如果您计算 8 位图像的导数，并将结果存储在 16 位图像中，并希望保留所有小数位，则可能需要设置 normalize=false。
ktype	滤波器系数的类型。可以是 CV_32F 或 CV_64F。

void cv::dilate	(	InputArray	src,
		OutputArray	dst,
		InputArray	kernel,
		点 (Point)	anchor = Point(-1,-1),
		int	iterations = 1,
		int	borderType = BORDER_CONSTANT,
		const Scalar &	borderValue = morphologyDefaultBorderValue() )

void cv::erode	(	InputArray	src,
		OutputArray	dst,
		InputArray	kernel,
		点 (Point)	anchor = Point(-1,-1),
		int	iterations = 1,
		int	borderType = BORDER_CONSTANT,
		const Scalar &	borderValue = morphologyDefaultBorderValue() )

void cv::filter2D	(	InputArray	src,
		OutputArray	dst,
		int	ddepth,
		InputArray	kernel,
		点 (Point)	anchor = Point(-1,-1),
		double	delta = 0,
		int	borderType = BORDER_DEFAULT )

src	输入图像。
dst	输出图像，与 src 具有相同的大小和通道数。
ddepth	目标图像的期望深度，参见深度组合
kernel	卷积核（更确切地说是相关核），单通道浮点矩阵；如果您想对不同通道应用不同的内核，请使用 split 将图像拆分为独立的颜色平面并分别处理。
锚点 (anchor)	内核的锚点，指示滤波点在内核中的相对位置；锚点应位于内核内；默认值 (-1,-1) 表示锚点位于内核中心。
delta	可选值，在存储到 dst 之前添加到滤波后的像素中。
borderType	像素外推方法，请参阅 BorderTypes。不支持 BORDER_WRAP。

void cv::GaussianBlur	(	InputArray	src,
		OutputArray	dst,
		Size	ksize,
		double	sigmaX,
		double	sigmaY = 0,
		int	borderType = BORDER_DEFAULT,
		AlgorithmHint	hint = cv::ALGO_HINT_DEFAULT )

void cv::getDerivKernels	(	OutputArray	kx,
		OutputArray	ky,
		int	dx,
		int	dy,
		int	ksize,
		bool	normalize = false,
		int	ktype = CV_32F )

Mat cv::getGaborKernel	(	Size	ksize,
		double	sigma,
		double	theta,
		double	lambd,
		double	gamma,
		double	psi = CV_PI *0.5,
		int	ktype = CV_64F )

ksize	返回的滤波器大小。
sigma	高斯包络的标准差。
theta	Gabor 函数平行条纹法线的方向。
lambd	正弦因子的波长。
gamma	空间纵横比。
psi	相位偏移。
ktype	滤波器系数的类型。可以是 CV_32F 或 CV_64F。

Mat cv::getGaussianKernel	(	int	ksize,
		double	sigma,
		int	ktype = CV_64F )

ksize	光圈大小。应为奇数 ( \(\texttt{ksize} \mod 2 = 1\) ) 且为正数。
sigma	高斯标准差。如果它是非正数，则从 ksize 计算为 `sigma = 0.3((ksize-1)0.5 - 1) + 0.8`。
ktype	滤波器系数的类型。可以是 CV_32F 或 CV_64F。

详细说明

深度组合

枚举

函数

枚举类型文档 (Enumeration Type Documentation)

◆ MorphShapes

◆ MorphTypes

◆ SpecialFilter

函数文档 (Function Documentation)

◆ bilateralFilter()

◆ blur()

◆ boxFilter()

◆ buildPyramid()

◆ dilate()

◆ erode()

◆ filter2D()

◆ GaussianBlur()

◆ getDerivKernels()

◆ getGaborKernel()

◆ getGaussianKernel()

◆ getStructuringElement()

◆ Laplacian()

◆ medianBlur()

◆ morphologyDefaultBorderValue()

◆ morphologyEx()

◆ pyrDown()

◆ pyrMeanShiftFiltering()

◆ pyrUp()

◆ Scharr()

◆ sepFilter2D()

◆ Sobel()

◆ spatialGradient()

◆ sqrBoxFilter()

◆ stackBlur()

Mat cv::getStructuringElement	(	int	shape,
		Size	ksize,
		点 (Point)	anchor = Point(-1,-1) )

shape	元素形状，可以是 MorphShapes 之一
ksize	结构元素的大小。
锚点 (anchor)	元素内的锚点位置。默认值 \((-1, -1)\) 表示锚点位于中心。注意，只有十字形元素的形状取决于锚点位置。在其他情况下，锚点仅调节形态学操作结果的偏移量。

void cv::Laplacian	(	InputArray	src,
		OutputArray	dst,
		int	ddepth,
		int	ksize = 1,
		double	scale = 1,
		double	delta = 0,
		int	borderType = BORDER_DEFAULT )

src	源图像。
dst	目标图像，与 src 具有相同的大小和通道数。
ddepth	目标图像的期望深度，参见深度组合。
ksize	用于计算二阶导数滤波器的光圈大小。详见 getDerivKernels。大小必须为正数且为奇数。
scale	计算出的拉普拉斯值的可选比例因子。默认情况下不应用缩放。详见 getDerivKernels。
delta	可选的 delta 值，在将结果存储到 dst 之前添加到结果中。
borderType	像素外推方法，请参阅 BorderTypes。不支持 BORDER_WRAP。

void cv::medianBlur	(	InputArray	src,
		OutputArray	dst,
		int	ksize )

src	输入 1、3 或 4 通道图像；当 ksize 为 3 或 5 时，图像深度应为 CV_8U、CV_16U 或 CV_32F，对于更大的光圈大小，只能是 CV_8U。
dst	目标数组，与 src 具有相同的大小和类型。
ksize	光圈线性大小；它必须是奇数且大于 1，例如：3、5、7 ...

void cv::morphologyEx	(	InputArray	src,
		OutputArray	dst,
		int	op,
		InputArray	kernel,
		点 (Point)	anchor = Point(-1,-1),
		int	iterations = 1,
		int	borderType = BORDER_CONSTANT,
		const Scalar &	borderValue = morphologyDefaultBorderValue() )

src	源图像。通道数可以是任意的。深度应为 CV_8U、CV_16U、CV_16S、CV_32F 或 CV_64F 之一。
dst	目标图像，与源图像具有相同的大小和类型。
op	形态学操作的类型，请参阅 MorphTypes
kernel	结构元素。可以使用 getStructuringElement 创建。
锚点 (anchor)	内核内的锚点位置。负值表示锚点位于内核中心。
iterations	应用腐蚀和膨胀的次数。
borderType	像素外推方法，请参阅 BorderTypes。不支持 BORDER_WRAP。
borderValue	常量边界情况下的边界值。默认值具有特殊含义。

void cv::pyrDown	(	InputArray	src,
		OutputArray	dst,
		const Size &	dstsize = Size(),
		int	borderType = BORDER_DEFAULT )

src	输入图像。
dst	输出图像；它具有指定的大小且类型与 src 相同。
dstsize	输出图像的大小。
borderType	像素外推方法，请参阅 BorderTypes（不支持 BORDER_CONSTANT）