调试计算机视觉应用最常用的方法是什么？通常的答案是临时的、拼凑的自定义代码，这些代码在发布编译时必须从代码中移除。

在本教程中，我们将展示如何使用 cvv 模块 (opencv2/cvv.hpp) 的可视化调试功能来替代这种方式。

目标

在本教程中，您将学习如何

向您的应用程序添加 cvv 调试调用
使用可视化调试 GUI
在编译期间启用和禁用可视化调试功能（禁用时无运行时开销）

代码

示例代码

捕获图像 (videoio)，例如从网络摄像头捕获，
对每张图像应用一些滤镜 (imgproc)，
检测图像特征并将其与上一张图像进行匹配 (features2d)。

如果程序在没有可视化调试的情况下编译（参见下面的 CMakeLists.txt），唯一的结果是命令行中打印的一些信息。我们希望演示仅仅几行 cvv 命令能增加多少调试或开发功能。

// system includes
#include <iostream>
 
// library includes
#include <opencv2/imgproc.hpp>
#include <opencv2/features2d.hpp>
#include <opencv2/imgproc/types_c.h>
#include <opencv2/videoio.hpp>
#include <opencv2/videoio/videoio_c.h>
 
#define CVVISUAL_DEBUGMODE
#include <opencv2/cvv/debug_mode.hpp>
#include <opencv2/cvv/show_image.hpp>
#include <opencv2/cvv/filter.hpp>
#include <opencv2/cvv/dmatch.hpp>
#include <opencv2/cvv/final_show.hpp>
 
using namespace std;
using namespace cv;
 
template<class T> std::string toString(const T& p_arg)
{
 std::stringstream ss;
 
 ss << p_arg;
 
 return ss.str();
}
 
 
 
 
int
main(int argc, char** argv)
{
 cv::Size* resolution = nullptr;
 
 // parser keys
 const char *keys =
 "{ help h usage ? | | show this message }"
 "{ width W | 0| camera resolution width. leave at 0 to use defaults }"
 "{ height H | 0| camera resolution height. leave at 0 to use defaults }";
 
 CommandLineParser parser(argc, argv, keys);
 if (parser.has("help")) {
 parser.printMessage();
 return 0;
  }
 int res_w = parser.get<int>("width");
 int res_h = parser.get<int>("height");
 
 // setup video capture
 cv::VideoCapture capture(0);
 if (!capture.isOpened()) {
 std::cout << "Could not open VideoCapture" << std::endl;
 return 1;
  }
 
 if (res_w>0 && res_h>0) {
 printf("Setting resolution to %dx%d\n", res_w, res_h);
 capture.set(CV_CAP_PROP_FRAME_WIDTH, res_w);
 capture.set(CV_CAP_PROP_FRAME_HEIGHT, res_h);
  }
 
 
 cv::Mat prevImgGray;
 std::vector<cv::KeyPoint> prevKeypoints;
 cv::Mat prevDescriptors;
 
 int maxFeatureCount = 500;
 Ptr<ORB> detector = ORB::create(maxFeatureCount);
 
 cv::BFMatcher matcher(cv::NORM_HAMMING);
 
 for (int imgId = 0; imgId < 10; imgId++) {
 // capture a frame
 cv::Mat imgRead;
 capture >> imgRead;
 printf("%d: image captured\n", imgId);
 
 std::string imgIdString{"imgRead"};
 imgIdString += toString(imgId);
 cvv::showImage(imgRead, CVVISUAL_LOCATION, imgIdString.c_str());
 
 // convert to grayscale
 cv::Mat imgGray;
 cv::cvtColor(imgRead, imgGray, COLOR_BGR2GRAY);
 cvv::debugFilter(imgRead, imgGray, CVVISUAL_LOCATION, "to gray");
 
 // detect ORB features
 std::vector<cv::KeyPoint> keypoints;
 cv::Mat descriptors;
 detector->detectAndCompute(imgGray, cv::noArray(), keypoints, descriptors);
 printf("%d: detected %zd keypoints\n", imgId, keypoints.size());
 
 // match them to previous image (if available)
 if (!prevImgGray.empty()) {
 std::vector<cv::DMatch> matches;
 matcher.match(prevDescriptors, descriptors, matches);
 printf("%d: all matches size=%zd\n", imgId, matches.size());
 std::string allMatchIdString{"all matches "};
 allMatchIdString += toString(imgId-1) + "<->" + toString(imgId);
 cvv::debugDMatch(prevImgGray, prevKeypoints, imgGray, keypoints, matches, CVVISUAL_LOCATION, allMatchIdString.c_str());
 
 // remove worst (as defined by match distance) bestRatio quantile
 double bestRatio = 0.8;
 std::sort(matches.begin(), matches.end());
 matches.resize(int(bestRatio * matches.size()));
 printf("%d: best matches size=%zd\n", imgId, matches.size());
 std::string bestMatchIdString{"best " + toString(bestRatio) + " matches "};
 bestMatchIdString += toString(imgId-1) + "<->" + toString(imgId);
 cvv::debugDMatch(prevImgGray, prevKeypoints, imgGray, keypoints, matches, CVVISUAL_LOCATION, bestMatchIdString.c_str());
    }
 
 prevImgGray = imgGray;
 prevKeypoints = keypoints;
 prevDescriptors = descriptors;
  }
 
 cvv::finalShow();
 
 return 0;
}

cmake_minimum_required(VERSION 2.8)
 
project(cvvisual_test)
 
SET(CMAKE_PREFIX_PATH ~/software/opencv/install)
 
SET(CMAKE_CXX_COMPILER "g++-4.8")
SET(CMAKE_CXX_FLAGS "-std=c++11 -O2 -pthread -Wall -Werror")
 
# (un)set: cmake -DCVV_DEBUG_MODE=OFF ..
OPTION(CVV_DEBUG_MODE "cvvisual-debug-mode" ON)
if(CVV_DEBUG_MODE MATCHES ON)
set(CMAKE_CXX_FLAGS "${CMAKE_CXX_FLAGS} -DCVVISUAL_DEBUGMODE")
endif()
 
 
FIND_PACKAGE(OpenCV REQUIRED)
include_directories(${OpenCV_INCLUDE_DIRS})
 
add_executable(cvvt main.cpp)
target_link_libraries(cvvt
opencv_core opencv_videoio opencv_imgproc opencv_features2d
opencv_cvv
)

解释

我们通过使用上述 CmakeLists.txt 并设置选项 CVV_DEBUG_MODE=ON (cmake -DCVV_DEBUG_MODE=ON) 来编译程序，或者通过向编译器添加相应的定义 CVVISUAL_DEBUGMODE (例如 g++ -DCVVISUAL_DEBUGMODE) 来编译。
第一个 cvv 调用只是简单地显示图像（类似于 imshow），并以 imgIdString 作为注释。
cvv::showImage(imgRead, CVVISUAL_LOCATION, imgIdString.c_str());

图像被添加到可视化调试 GUI 的概览标签页中，并且 cvv 调用会阻塞。

image

然后可以选择并查看图像

image

无论何时您想在代码中继续执行，即解除 cvv 调用的阻塞，您可以选择继续直到下一个 cvv 调用 (Step)，继续直到最后一个 cvv 调用 (*>>*) 或运行应用程序直到其退出 (Close)。

我们决定按下绿色的 Step 按钮。

接下来的 cvv 调用用于调试各种滤镜操作，即以一张图片作为输入并返回一张图片作为输出的操作。
cvv::debugFilter(imgRead, imgGray, CVVISUAL_LOCATION, "to gray");

与每次 cvv 调用一样，您首先会进入概览。

image

我们决定不关心灰度转换，然后按下 Step。

cvv::debugFilter(imgGray, imgGraySmooth, CVVISUAL_LOCATION, "smoothed");

如果您打开滤镜调用，您将进入所谓的“DefaultFilterView”。两张图像会并排显示，您可以（同步地）放大它们。

image

当您放大到非常高的级别时，每个像素都会标注其数值。

image

我们按两次 Step 键，然后查看膨胀后的图像。

cvv::debugFilter(imgEdges, imgEdgesDilated, CVVISUAL_LOCATION, "dilated edges");

DefaultFilterView 显示两张图像

image

现在我们使用右上角的 View 选择器，选择“DualFilterView”。我们选择“变化像素”作为滤镜并应用它（中间图像）。

image

在我们仔细查看了这些图像，可能使用了不同的视图、滤镜或其他 GUI 功能之后，我们决定让程序继续运行。因此，我们按下黄色的 *>>* 按钮。

程序将在以下位置阻塞：

cvv::finalShow();

并显示在此期间传递给 cvv 的所有内容的概览。

image

cvv debugDMatch 调用用于在有两张图像且每张图像都带有一组相互匹配的描述符的情况下。

我们将两张图像、两组关键点及其匹配结果传递给可视化调试模块。
cvv::debugDMatch(prevImgGray, prevKeypoints, imgGray, keypoints, matches, CVVISUAL_LOCATION, allMatchIdString.c_str());

由于我们想查看匹配，我们使用概览中的过滤功能（*#type match*）来只显示匹配调用。

image

我们想仔细查看其中一个，例如调整使用匹配的参数。该视图有多种设置来显示关键点和匹配。此外，还有一个鼠标悬停提示。

image

我们看到（可视化调试！）有许多不好的匹配。我们决定只显示 70% 的匹配——那些匹配距离最低的 70%。

image

成功减少视觉干扰后，我们想更清楚地看到两张图像之间发生了什么变化。我们选择“TranslationMatchView”，它以不同的方式显示关键点匹配到的位置。

image

很容易看出，在这两张图像之间，杯子向左移动了。

尽管 cvv 主要是关于交互式地查看计算机视觉错误，但它还补充了“RawView”，允许查看底层的数值数据。

image

cvv GUI 中包含许多其他有用的功能。例如，可以对概览标签页进行分组。

image

结果

通过向我们的计算机视觉程序添加一些富有表现力的代码行，我们可以通过不同的可视化方式进行交互式调试。
一旦我们完成开发/调试，就不必删除这些代码行。我们只需禁用 cvv 调试（cmake -DCVV_DEBUG_MODE=OFF 或 g++ 不带 -DCVVISUAL_DEBUGMODE），我们的程序就会运行，没有任何调试开销。

享受计算机视觉！