![]() |
OpenCV 4.12.0
开源计算机视觉
|
OpenCV(开源计算机视觉库:https://opencv.ac.cn)是一个包含数百种计算机视觉算法的开源库。本文档描述了所谓的 OpenCV 2.x API,它本质上是一个 C++ API,与基于 C 的 OpenCV 1.x API 不同(自 OpenCV 2.4 版本发布以来,C API 已被弃用且未通过“C”编译器测试)
OpenCV 具有模块化结构,这意味着该软件包包含多个共享或静态库。以下模块可用:
文档的后续章节将描述每个模块的功能。但首先,请务必熟悉库中广泛使用的通用 API 概念。
所有 OpenCV 类和函数都位于 cv 命名空间中。因此,要在代码中访问此功能,请使用 cv:: 限定符或 using namespace cv; 指令
或者
一些当前或未来的 OpenCV 外部名称可能与 STL 或其他库冲突。在这种情况下,请使用显式命名空间限定符来解决名称冲突。
OpenCV 自动处理所有内存。
首先,函数和方法使用的 std::vector、cv::Mat 以及其他数据结构都具有析构函数,这些析构函数在需要时会释放底层内存缓冲区。这意味着析构函数并不总是像 Mat 那样立即释放缓冲区。它们会考虑可能的数据共享。析构函数会递减与矩阵数据缓冲区关联的引用计数。只有当引用计数达到零时,即没有其他结构引用同一缓冲区时,才会释放缓冲区。类似地,当复制一个 Mat 实例时,并没有实际数据被复制。相反,引用计数会增加,以记录存在另一个相同数据的所有者。还有 cv::Mat::clone 方法,它会创建一个矩阵数据的完整副本。请看下面的例子:
您可以看到 Mat 和其他基本结构的使用非常简单。但是,对于没有考虑自动内存管理而创建的高级类甚至用户数据类型呢?对于它们,OpenCV 提供了类似于 C++11 中 std::shared_ptr 的 cv::Ptr 模板类。因此,与其使用普通指针:
您可以使用:
或者
Ptr<T> 封装了一个指向 T 实例的指针以及与该指针关联的引用计数。有关详细信息,请参阅 cv::Ptr 的描述。
OpenCV 会自动释放内存,并且在大多数情况下,还会自动为输出函数参数分配内存。因此,如果一个函数有一个或多个输入数组(cv::Mat 实例)和一些输出数组,则输出数组会被自动分配或重新分配。输出数组的大小和类型由输入数组的大小和类型决定。如果需要,函数会接收额外的参数,以帮助确定输出数组的属性。
示例
数组 frame 由 >> 运算符自动分配,因为视频帧分辨率和位深度对于视频捕获模块是已知的。数组 edges 由 cvtColor 函数自动分配。它与输入数组具有相同的大小和位深度。通道数为 1,因为传递了颜色转换代码 cv::COLOR_BGR2GRAY,这意味着从彩色到灰度的转换。请注意,frame 和 edges 在循环体首次执行时只分配一次,因为所有后续视频帧都具有相同的分辨率。如果您以某种方式更改视频分辨率,数组将自动重新分配。
这项技术的关键组件是 cv::Mat::create 方法。它接受所需的数组大小和类型。如果数组已经具有指定的大小和类型,该方法不执行任何操作。否则,它会释放之前分配的数据(如果有)(这部分涉及递减引用计数并与零进行比较),然后分配所需大小的新缓冲区。大多数函数都会为每个输出数组调用 cv::Mat::create 方法,从而实现了自动输出数据分配。
该方案的一些显著例外是 cv::mixChannels、cv::RNG::fill 以及其他一些函数和方法。它们无法分配输出数组,因此您必须提前进行此操作。
作为计算机视觉库,OpenCV 经常处理图像像素,这些像素通常以紧凑的每通道 8 位或 16 位形式编码,因此值范围有限。此外,某些图像操作,如色彩空间转换、亮度/对比度调整、锐化、复杂插值(双三次、Lanczos),可能会产生超出可用范围的值。如果您只存储结果的最低 8 (16) 位,这会导致视觉伪影,并可能影响进一步的图像分析。为了解决这个问题,采用了所谓的饱和算术。
例如,要将操作结果 r 存储到 8 位图像中,您需要找到 0..255 范围内的最近值:
\[I(x,y)= \min ( \max (\textrm{round}(r), 0), 255)\]
cv::saturate_cast<> 函数来完成。请看下面提供的公式的实现:Definition interface.h:51
模板是 C++ 的一个强大特性,它能够实现非常强大、高效且安全的数据结构和算法。然而,过度使用模板可能会显著增加编译时间和代码大小。此外,当独占使用模板时,很难分离接口和实现。这对于基本算法可能没问题,但对于计算机视觉库来说就不太好了,因为单个算法可能跨越数千行代码。由于这个原因,也为了简化 Python、Java、Matlab 等不具有模板或模板能力有限的其他语言的绑定开发,当前的 OpenCV 实现基于多态性和运行时调度,而非模板。在那些运行时调度会太慢(如像素访问运算符)、不可能(泛型 cv::Ptr<> 实现)或仅仅非常不方便(cv::saturate_cast<>())的地方,当前实现引入了小的模板类、方法和函数。在当前 OpenCV 版本的其他任何地方,模板的使用都是有限的。
多个元素的元组,其中所有元素具有相同类型(上述之一)。其元素为此类元组的数组称为多通道数组,与元素为标量值的单通道数组相对。最大可能通道数由 CV_CN_MAX 常量定义,目前设置为 512。
Definition interface.h:75
示例
#CV_32FC1 == #CV_32F, #CV_32FC2 == #CV_32FC(2) == #CV_MAKETYPE(CV_32F, 2),并且 #CV_MAKETYPE(depth, n) == ((depth&7) + ((n-1)<<3)。这意味着常量类型由深度(取最低 3 位)和通道数减 1(取接下来的 log2(CV_CN_MAX) 位)组成。Definition interface.h:85
色彩空间转换函数支持 8 位无符号、16 位无符号和 32 位浮点类型。
cv::Mat 作为参数,但在某些情况下,使用 std::vector<>(例如,用于点集)或 cv::Matx<>(例如,用于 3x3 单应性矩阵等)会更方便。为了避免 API 中出现大量重复,引入了特殊的“代理”类。基本“代理”类是 cv::InputArray。它用于在函数输入时传递只读数组。派生自 InputArray 的类 cv::OutputArray 用于指定函数的输出数组。通常,您无需关心这些中间类型(也不应显式声明这些类型的变量)——一切都将自动运行。您可以假定,除了 InputArray/OutputArray,您始终可以使用 cv::Mat、std::vector<>、cv::Matx<>、cv::Vec<> 或 cv::Scalar。当函数具有可选的输入或输出数组,而您没有或不想要时,请传递 cv::noArray()。OpenCV 使用异常来指示关键错误。当输入数据格式正确且属于指定值范围,但算法因某种原因(例如,优化算法未收敛)无法成功时,它会返回一个特殊错误代码(通常只是一个布尔变量)。
异常可以是 cv::Exception 类或其派生类的实例。反过来,cv::Exception 是 std::exception 的派生类。因此,可以使用其他标准 C++ 库组件在代码中优雅地处理它。
#CV_Error(errcode, description) 宏抛出,或其类似 printf 的 #CV_Error_(errcode, (printf-spec, printf-args)) 变体,或者使用 CV_Assert(condition) 宏,该宏检查条件并在不满足时抛出异常。对于性能关键的代码,有 CV_DbgAssert(condition),它只在 Debug 配置中保留。由于自动内存管理,所有中间缓冲区在发生意外错误时都会自动释放。如果需要,您只需添加 try 语句来捕获异常: