OpenCV 4.13.0
开源计算机视觉库 (Open Source Computer Vision)
正在加载...
正在搜索...
未找到匹配项
用于从图像中提取的线条的二进制描述符

详细说明

引言

计算机视觉中最具挑战性的任务之一是从给定图像中提取有用的信息。这些信息通常以点(例如,它们是尺度不变的)的形式出现,并且实际上代表了输入图像。

本模块的目标是在图像中寻找一种新的代表性信息,并提供其提取和表示的功能。特别是,与以前在图像中检测相关元素的方法不同,这里提取的是线而不是点;定义了一个新的类来汇总线的属性,用于重用和绘图目的。

二进制描述符的计算

为了获得代表从图像某个八度中检测到的特定线的二进制描述符,我们首先按照[321]中的描述计算一个非二进制描述符。该算法作用于使用EDLine检测器提取的线,如[295]中所述。给定一条线,我们考虑一个以该线为中心的矩形区域,称为线支持区域 (LSR)。该区域被划分为一组带 \(\{B_1, B_2, ..., B_m\}\),其长度等于线的长度。

如果我们用 \(\bf{d}_L\) 表示线的方向,则可以确定垂直于线并顺时针方向 \(\bf{d}_{\perp}\);这两个方向用于构建一个以线的中点为中心的参考系。LSR内像素的梯度 \(\bf{g'}\) 可以投影到新确定的坐标系中,得到它们在局部坐标系下的等效值 \(\bf{g'} = (\bf{g}^T \cdot \bf{d}_{\perp}, \bf{g}^T \cdot \bf{d}_L)^T \triangleq (\bf{g'}_{d_{\perp}}, \bf{g'}_{d_L})^T\)。

之后,沿 \(\bf{d}_\perp\) 方向对LSR的所有像素应用高斯函数;首先,我们为LSR中的第i行分配一个全局权重系数 \(f_g(i) = (1/\sqrt{2\pi}\sigma_g)e^{-d^2_i/2\sigma^2_g}\),其中 \(d_i\) 是第i行到LSR中心行的距离,\(\sigma_g = 0.5(m \cdot w - 1)\),而 \(w\) 是带的宽度(对每个带都相同)。其次,考虑一个带 \(B_j\) 及其相邻带 \(B_{j-1}, B_{j+1}\),我们分配一个局部权重 \(F_l(k) = (1/\sqrt{2\pi}\sigma_l)e^{-d'^2_k/2\sigma_l^2}\),其中 \(d'_k\) 是第k行到 \(B_j\) 中心行的距离,\(\sigma_l = w\)。通过使用全局和局部权重,我们同时实现了远离线的梯度作用的减弱以及边界效应的减弱。

LSR中的每个带 \(B_j\) 都有一个关联的带描述符 (BD),该描述符是考虑了前一个和后一个带(计算第一个和最后一个带的描述符时,顶部和底部的带将被忽略)来计算的。一旦每个带都被分配了其BD,线的LBD描述符就由下式给出:

\[LBD = (BD_1^T, BD_2^T, ... , BD^T_m)^T.\]

为了计算一个带描述符 \(B_j\),我们考虑其中的每一行k,并累加该行的梯度:

\[\begin{matrix} \bf{V1}^k_j = \lambda \sum\limits_{\bf{g}'_{d_\perp}>0}\bf{g}'_{d_\perp}, & \bf{V2}^k_j = \lambda \sum\limits_{\bf{g}'_{d_\perp}<0} -\bf{g}'_{d_\perp}, \\ \bf{V3}^k_j = \lambda \sum\limits_{\bf{g}'_{d_L}>0}\bf{g}'_{d_L}, & \bf{V4}^k_j = \lambda \sum\limits_{\bf{g}'_{d_L}<0} -\bf{g}'_{d_L}\end{matrix}.\]

其中 \(\lambda = f_g(k)f_l(k)\)。

通过堆叠先前的结果,我们得到带描述符矩阵 (BDM)

\[BDM_j = \left(\begin{matrix} \bf{V1}_j^1 & \bf{V1}_j^2 & \ldots & \bf{V1}_j^n \\ \bf{V2}_j^1 & \bf{V2}_j^2 & \ldots & \bf{V2}_j^n \\ \bf{V3}_j^1 & \bf{V3}_j^2 & \ldots & \bf{V3}_j^n \\ \bf{V4}_j^1 & \bf{V4}_j^2 & \ldots & \bf{V4}_j^n \end{matrix} \right) \in \mathbb{R}^{4\times n},\]

其中 \(n\) 是带 \(B_j\) 中的行数

\[n = \begin{cases} 2w, & j = 1||m; \\ 3w, & \mbox{else}. \end{cases}\]

每个 \(BD_j\) 可以通过 \(BDM_J\) 的标准差向量 \(S_j\) 和均值向量 \(M_j\) 获得。因此,最终

\[LBD = (M_1^T, S_1^T, M_2^T, S_2^T, \ldots, M_m^T, S_m^T)^T \in \mathbb{R}^{8m}\]

获得LBD后,必须将其转换为二进制形式。为此,我们考虑其中32对可能的BD;每对BD逐位进行比较,比较生成一个8位字符串。连接32个比较字符串,就得到了单个LBD的256位最终二进制表示。

类  cv::line_descriptor::BinaryDescriptor
 类同时实现了检测直线和计算其二进制描述符的功能。更多...
 
类  cv::line_descriptor::BinaryDescriptorMatcher
 提供所有用于查询用户提供或类内部(用户仍需填充)的数据集的功能,模型基于描述符匹配器更多...
 
结构体  cv::line_descriptor::DrawLinesMatchesFlags
 
结构体  cv::line_descriptor::KeyLine
 用于表示一条直线的类。更多...
 
类  cv::line_descriptor::LSDDetector
 
结构体  cv::line_descriptor::LSDParam
 

函数

void cv::line_descriptor::drawKeylines (const Mat &image, const std::vector< KeyLine > &keylines, Mat &outImage, const Scalar &color=Scalar::all(-1), int flags=DrawLinesMatchesFlags::DEFAULT)
 绘制关键线。
 
void cv::line_descriptor::drawLineMatches (const Mat &img1, const std::vector< KeyLine > &keylines1, const Mat &img2, const std::vector< KeyLine > &keylines2, const std::vector< DMatch > &matches1to2, Mat &outImg, const Scalar &matchColor=Scalar::all(-1), const Scalar &singleLineColor=Scalar::all(-1), const std::vector< char > &matchesMask=std::vector< char >(), int flags=DrawLinesMatchesFlags::DEFAULT)
 绘制两幅图像中找到的关键线匹配项。
 

函数文档 (Function Documentation)

◆ drawKeylines()

void cv::line_descriptor::drawKeylines ( const Mat & 图像,
const std::vector< KeyLine > & keylines,
Mat & outImage,
const Scalar & color=Scalar::all(-1),
int flags=DrawLinesMatchesFlags::DEFAULT )
Python
cv.line_descriptor.drawKeylines(image, keylines[, outImage[, color[, flags]]]) -> outImage

#include <opencv2/line_descriptor/descriptor.hpp>

绘制关键线。

参数
图像输入图像
keylines待绘制的关键线
outImage输出图像,用于绘制
color要绘制的线的颜色(如果设置为默认值,则随机选择颜色)
flags (标志)绘制标志

◆ drawLineMatches()

void cv::line_descriptor::drawLineMatches ( const Mat & img1,
const std::vector< KeyLine > & keylines1,
const Mat & img2,
const std::vector< KeyLine > & keylines2,
const std::vector< DMatch > & matches1to2,
Mat & outImg,
const Scalar & matchColor=Scalar::all(-1),
const Scalar & singleLineColor=Scalar::all(-1),
const std::vector< char > & matchesMask=std::vector< char >(),
int flags=DrawLinesMatchesFlags::DEFAULT )
Python
cv.line_descriptor.drawLineMatches(img1, keylines1, img2, keylines2, matches1to2[, outImg[, matchColor[, singleLineColor[, matchesMask[, flags]]]]]) -> outImg

#include <opencv2/line_descriptor/descriptor.hpp>

绘制两幅图像中找到的关键线匹配项。

参数
img1第一张图片
keylines1从第一张图像提取的关键线
img2第二张图片
keylines2从第二张图像提取的关键线
matches1to2匹配向量
outImg输出矩阵,用于绘制
matchColor匹配的绘制颜色(默认值时随机选择)
singleLineColor关键线的绘制颜色(默认值时随机选择)
matchesMask用于指示哪些匹配项需要绘制的掩码
flags (标志)绘制标志,请参阅 DrawLinesMatchesFlags
注意
如果 `matchColor` 和 `singleLineColor` 都设置为其默认值,则函数将以相同的颜色绘制匹配的线以及连接它们的线。