OpenCV  4.10.0
开源计算机视觉库
加载中...
搜索中...
无匹配项
samples/cpp/peopledetect.cpp
// 此文件是 OpenCV 项目的一部分。
// 它受 LICENSE 文件中所述的许可条款约束,该文件位于此发行版的顶层目录中
// 以及 https://opencv.ac.cn/license.html
#include <iostream>
#include <iomanip>
using namespace cv;
using namespace std;
class Detector
{
enum Mode { Default, Daimler } m;
HOGDescriptor hog, hog_d;
public:
Detector() : m(Default), hog(), hog_d(Size(48, 96), Size(16, 16), Size(8, 8), Size(8, 8), 9)
{
hog.setSVMDetector(HOGDescriptor::getDefaultPeopleDetector());
hog_d.setSVMDetector(HOGDescriptor::getDaimlerPeopleDetector());
}
void toggleMode() { m = (m == Default ? Daimler : Default); }
string modeName() const { return (m == Default ? "Default" : "Daimler"); }
vector<Rect> detect(InputArray img)
{
// 使用默认参数运行检测器,以获得更高的命中率
// (以及更多误报,分别),降低 hitThreshold 和
// groupThreshold(将 groupThreshold 设置为 0 以完全关闭分组)。
vector<Rect> found;
if (m == Default)
hog.detectMultiScale(img, found, 0, Size(8,8), Size(), 1.05, 2, false);
else if (m == Daimler)
hog_d.detectMultiScale(img, found, 0, Size(8,8), Size(), 1.05, 2, true);
return found;
}
void adjustRect(Rect & r) const
{
// HOG 检测器返回的矩形略大于实际物体,
// 因此我们稍微缩小矩形以获得更好的输出。
r.x += cvRound(r.width*0.1);
r.width = cvRound(r.width*0.8);
r.y += cvRound(r.height*0.07);
r.height = cvRound(r.height*0.8);
}
};
static const string keys = "{ help h | | print help message }"
"{ camera c | 0 | capture video from camera (device index starting from 0) }"
"{ video v | | use video as input }";
int main(int argc, char** argv)
{
CommandLineParser parser(argc, argv, keys);
parser.about("This sample demonstrates the use of the HoG descriptor.");
if (parser.has("help"))
{
parser.printMessage();
return 0;
}
int camera = parser.get<int>("camera");
string file = parser.get<string>("video");
if (!parser.check())
{
parser.printErrors();
return 1;
}
if (file.empty())
cap.open(camera);
else
{
file = samples::findFileOrKeep(file);
cap.open(file);
}
if (!cap.isOpened())
{
cout << "Can not open video stream: '" << (file.empty() ? "<camera>" : file) << "'" << endl;
return 2;
}
cout << "Press 'q' or <ESC> to quit." << endl;
cout << "Press <space> to toggle between Default and Daimler detector" << endl;
Detector detector;
Mat frame;
for (;;)
{
cap >> frame;
if (frame.empty())
{
cout << "Finished reading: empty frame" << endl;
break;
}
vector<Rect> found = detector.detect(frame);
t = getTickCount() - t;
// 显示窗口
{
ostringstream buf;
buf << "Mode: " << detector.modeName() << " ||| "
<< "FPS: " << fixed << setprecision(1) << (getTickFrequency() / (double)t);
putText(frame, buf.str(), Point(10, 30), FONT_HERSHEY_PLAIN, 2.0, Scalar(0, 0, 255), 2, LINE_AA);
}
for (vector<Rect>::iterator i = found.begin(); i != found.end(); ++i)
{
Rect &r = *i;
detector.adjustRect(r);
rectangle(frame, r.tl(), r.br(), cv::Scalar(0, 255, 0), 2);
}
imshow("People detector", frame);
// 与用户交互
const char key = (char)waitKey(1);
if (key == 27 || key == 'q') // ESC
{
cout << "Exit requested" << endl;
break;
}
else if (key == ' ')
{
detector.toggleMode();
}
}
return 0;
}
专为命令行解析而设计。
定义 utility.hpp:820
n 维密集数组类
定义 mat.hpp:812
用于指定二维矩形的模板类。
定义 types.hpp:444
Point_< _Tp > tl() const
左上角
_Tp x
左上角的 x 坐标
定义 types.hpp:480
_Tp y
左上角的 y 坐标
定义 types.hpp:481
_Tp width
矩形的宽度
定义 types.hpp:482
_Tp height
矩形的高度
定义 types.hpp:483
Point_< _Tp > br() const
右下角
用于指定图像或矩形大小的模板类。
定义 types.hpp:335
用于从视频文件、图像序列或相机捕获视频的类。
定义 videoio.hpp:731
virtual bool open(const String &filename, int apiPreference=CAP_ANY)
打开视频文件或捕获设备或 IP 视频流以进行视频捕获。
virtual bool isOpened() const
如果已初始化视频捕获,则返回 true。
这是用于将只读输入数组传递到 OpenCV 函数的代理类。
定义 mat.hpp:160
int64_t int64
定义 interface.h:61
int cvRound(double value)
将浮点数四舍五入到最接近的整数。
定义 fast_math.hpp:200
double getTickFrequency()
返回每秒的刻度数。
int64 getTickCount()
返回刻度数。
void imshow(const String &winname, InputArray mat)
在指定的窗口中显示图像。
int waitKey(int delay=0)
等待按下的键。
void rectangle(InputOutputArray img, Point pt1, Point pt2, const Scalar &color, int thickness=1, int lineType=LINE_8, int shift=0)
绘制一个简单的、粗的或填充的正向矩形。
void putText(InputOutputArray img, const String &text, Point org, int fontFace, double fontScale, Scalar color, int thickness=1, int lineType=LINE_8, bool bottomLeftOrigin=false)
绘制一个文本字符串。
int main(int argc, char *argv[])
定义 highgui_qt.cpp:3
磁盘上与文件关联的文件存储的“黑盒”表示。
定义 core.hpp:102
STL 命名空间。
HOG(方向梯度直方图)描述符和目标检测器的实现。
定义 objdetect.hpp:403
virtual void setSVMDetector(InputArray svmdetector)
设置线性 SVM 分类器的系数。
virtual void detectMultiScale(InputArray img, std::vector< Rect > &foundLocations, std::vector< double > &foundWeights, double hitThreshold=0, Size winStride=Size(), Size padding=Size(), double scale=1.05, double groupThreshold=2.0, bool useMeanshiftGrouping=false) const
检测输入图像中不同大小的目标。检测到的目标以...列表形式返回。