OpenCV 4.11.0
开源计算机视觉库
加载中…
搜索中…
无匹配项
使用神经网络检测色卡

本教程将向您展示如何使用神经网络来提高色卡检测算法的准确性。

构建

构建OpenCV时,运行以下命令以构建所有contrib模块:

cmake -D OPENCV_EXTRA_MODULES_PATH=<opencv_contrib>/modules/

或者只构建mcc模块:

cmake -D OPENCV_EXTRA_MODULES_PATH=<opencv_contrib>/modules/mcc

或者确保在CMake的GUI版本中选中mcc模块:cmake-gui。

示例源码

您可以通过执行以下命令运行示例代码:

<opencv_build_directory>/bin/example_mcc_chart_detection_with_network -t=<色卡类型> -m=<神经网络路径> -pb=<模型pbtxt路径> -v=<可选视频路径,未提供则使用网络摄像头.mp4> --ci=<可选摄像头ID,仅在未提供视频时需要> --nc=<可选图像中色卡最大数量> --use_gpu <可选是否使用GPU>
``'
* -t=# 色卡类型,0(标准),1(DigitalSG),2(乙烯基)
* --ci=# 摄像头ID,0(默认为主摄像头),1(次摄像头)等
* --nc=# 默认值为1,表示只检测最佳色卡
示例

在CPU上简单运行(不使用GPU):/home/opencv/build/bin/example_mcc_chart_detection_with_network -t=0 -m=/home/model.pb –pb=/home/model.pbtxt -v=mcc24.mp4

在GPU上运行:/home/opencv/build/bin/example_mcc_chart_detection_with_network -t=0 -m=/home/model.pb –pb=/home/model.pbtxt -v=mcc24.mp4 –use_gpu

在GPU上运行并检测最佳5个色卡(检测结果可能少于5个,但不会超过5个):/home/opencv/build/bin/example_mcc_chart_detection_with_network -t=0 -m=/home/model.pb –pb=/home/model.pbtxt -v=mcc24.mp4 –use_gpu –nc=5

1#include <opencv2/core.hpp>
2
3#include <opencv2/highgui.hpp>
4#include <opencv2/mcc.hpp>
5#include <opencv2/dnn.hpp>
6#include <iostream>
7
8using namespace std;
9using namespace cv;
10using namespace mcc;
11
12const char *about = "使用神经网络进行基本色卡检测";
13const char *keys = {
14 "{ help h usage ? | | 显示此消息 }"
15 "{t | 0 | chartType: 0-标准, 1-DigitalSG, 2-乙烯基, 默认:0}"
16 "{m | | 模型文件路径,如果您没有模型,可以在文档中找到链接}"
17
18 "{pb | | pbtxt 文件路径,与模型文件一起提供}"
19 }"
20 "{v | | 视频文件输入,如果省略,则输入来自摄像头}"
21 "{ci | 0 | 如果输入不是来自视频 (-v),则为摄像头 ID}"
22 "{nc | 1 | 图像中色卡的最大数量}"
23 "{use_gpu | | 如果要使用GPU,请添加此标志}"};
24
25int main(int argc, char *argv[])
26{
27 // ----------------------------------------------------------
28 // 向下滚动一点 (~50 行) 即可找到实际相关的代码
29 // ----------------------------------------------------------
30
31 CommandLineParser parser(argc, argv, keys);
32 parser.about(about);
33
34 if (parser.has("help"))
35 {
36 parser.printMessage();
37 return -1;
38 }
39
40 int t = parser.get<int>("t");
41
42 CV_Assert(0 <= t && t <= 2);
43 TYPECHART chartType = TYPECHART(t);
44
45 string model_path = parser.get<string>("m");
46 string pbtxt_path = parser.get<string>("pb");
47
48 int camId = parser.get<int>("ci");
49 int nc = parser.get<int>("nc");
50
51 String video;
52
53 if (parser.has("v"))
54 video = parser.get<String>("v");
55
56 bool use_gpu = parser.has("use_gpu");
57
58 if (!parser.check())
59 {
60 parser.printErrors();
61 return 0;
62 }
63
64 VideoCapture inputVideo;
65 int waitTime;
66 if (!video.empty())
67 {
68 inputVideo.open(video);
69 waitTime = 10;
70 }
71 else
72 {
73 inputVideo.open(camId);
74 waitTime = 10;
75 }
76
77 //--------------------------------------------------------------------------
78 //-------------------------实际相关代码-----------------------------
79 //--------------------------------------------------------------------------
80
81 //加载网络
82
83 cv::dnn::Net net = cv::dnn::readNetFromTensorflow(model_path, pbtxt_path);
84
85 if (use_gpu)
86 {
87 net.setPreferableBackend(dnn::DNN_BACKEND_CUDA);
88 net.setPreferableTarget(dnn::DNN_TARGET_CUDA);
89 }
90
91 Ptr<CCheckerDetector> detector = CCheckerDetector::create();
92 if (!detector->setNet(net))
93 {
94 cout << "加载模型失败:终止" << endl;
95 return 0;
96 }
97
98 while (inputVideo.grab())
99 {
100 Mat image, imageCopy;
101 inputVideo.retrieve(image);
102
103 imageCopy = image.clone();
104
105 // 待检测的标记类型
106 if (!detector->process(image, chartType, nc, true))
107 {
108 printf("未检测到色卡\n");
109 }
110 else
111 {
112
113 // 获取色卡
114 std::vector<Ptr<mcc::CChecker>> checkers = detector->getListColorChecker();
115 for (Ptr<mcc::CChecker> checker : checkers)
116 {
117 // 当前色卡
118
119 Ptr<CCheckerDraw> cdraw = CCheckerDraw::create(checker);
120 cdraw->draw(image);
121 }
122 }
123
124 imshow("图像结果 | 按q或esc退出", image);
125 imshow("原始图像", imageCopy);
126 char key = (char)waitKey(waitTime);
127 if (key == 27)
128 break;
129 }
130
131 return 0;
132}
用于命令行解析。
定义 utility.hpp:890
N维密集数组类
定义 mat.hpp:829
CV_NODISCARD_STD Mat clone() const
创建数组和底层数据的完整副本。
用于从视频文件、图像序列或摄像头捕获视频的类。
定义 videoio.hpp:766
virtual bool open(const String &filename, int apiPreference=CAP_ANY)
打开视频文件或捕获设备或IP视频流进行视频捕获。
virtual bool retrieve(OutputArray image, int flag=0)
解码并返回抓取的视频帧。
virtual bool grab()
从视频文件或捕获设备抓取下一帧。
此类允许创建和操作全面的人工神经网络。
定义 dnn.hpp:475
void setPreferableBackend(int backendId)
要求网络使用支持的特定计算后端。
void setPreferableTarget(int targetId)
要求网络在特定目标设备上进行计算。
std::string String
定义 cvstd.hpp:151
std::shared_ptr< _Tp > Ptr
定义 cvstd_wrapper.hpp:23
#define CV_Assert(expr)
在运行时检查条件,如果失败则抛出异常。
定义 base.hpp:359
Net readNetFromTensorflow(CV_WRAP_FILE_PATH const String &model, CV_WRAP_FILE_PATH const String &config=String())
读取以TensorFlow框架格式存储的网络模型。
void imshow(const String &winname, InputArray mat)
在指定的窗口中显示图像。
int waitKey(int delay=0)
等待按键按下。
int main(int argc, char *argv[])
定义 highgui_qt.cpp:3
定义 core.hpp:107
STL 命名空间。

解释

  1. 设置头文件和命名空间

    #include <opencv2/mcc.hpp>
    using namespace std;
    using namespace cv;
    using namespace mcc;

    如果需要,您可以像上面的代码一样设置命名空间。

  2. 创建检测器对象

    Ptr<CCheckerDetector> detector = CCheckerDetector::create();

    这只是创建对象。

  3. 加载模型

    cv::dnn::Net net = cv::dnn::readNetFromTensorflow(model_path, pbtxt_path);

    加载模型,这里提供的模型是用TensorFlow训练的,所以我们用TensorFlow加载它,但如果您有在其他框架中训练的其他模型,也可以使用。

  4. (可选) 将DNN后端设置为CUDA

    net.setPreferableBackend(dnn::DNN_BACKEND_CUDA);
    net.setPreferableTarget(dnn::DNN_TARGET_CUDA);

    模型在CUDA上运行速度快得多,所以如果可能,请使用CUDA。

  5. 运行检测器

    detector->process(image, chartType, max_number_charts_in_image, true);

    如果检测器成功检测到至少一个图表,则返回true,否则返回false。在上面给出的代码中,如果未检测到任何图表,我们将打印一条失败消息。否则,如果成功,颜色图表列表将存储在检测器本身中,我们将在下一步中看到如何提取它。第四个参数用于决定是否使用网络。

  6. 获取颜色校正板列表

    std::vector<cv::Ptr<mcc::CChecker>> checkers;
    detector->getListColorChecker(checkers);

    所有检测到的颜色校正板现在都存储在“checkers”向量中。

  7. 将颜色校正板绘制回图像

    for(Ptr<mcc::CChecker> checker : checkers)
    {
    // 当前颜色校正板
    Ptr<CCheckerDraw> cdraw = CCheckerDraw::create(checker);
    cdraw->draw(image);
    }

    逐个循环遍历所有校正板,然后绘制它们。