类 OCRTesseract
- java.lang.Object
-
- org.opencv.text.BaseOCR
-
- org.opencv.text.OCRTesseract
-
public class OCRTesseract extends BaseOCR
OCRTesseract 类提供了一个与 C++ 中的 tesseract-ocr API (v3.02.02) 的接口。请注意,它仅在正确安装 tesseract-ocr 时才会被编译。注意:- (C++) OCRTesseract 识别与场景文本检测相结合的示例可以在 end_to_end_recognition 演示中找到:<https://github.com/opencv/opencv_contrib/blob/master/modules/text/samples/end_to_end_recognition.cpp>
- (C++) 另一个 OCRTesseract 识别与场景文本检测相结合的示例可以在 webcam_demo 中找到:<https://github.com/opencv/opencv_contrib/blob/master/modules/text/samples/webcam_demo.cpp>
- (C++) OCRTesseract 识别与场景文本检测相结合的示例可以在 end_to_end_recognition 演示中找到:<https://github.com/opencv/opencv_contrib/blob/master/modules/text/samples/end_to_end_recognition.cpp>
-
-
构造函数摘要
构造函数 修饰符 构造函数 描述 保护OCRTesseract(long addr)
-
方法摘要
所有方法 静态方法 实例方法 具体方法 修饰符和类型 方法 描述 static OCRTesseract__fromPtr__(long addr)static OCRTesseractcreate()创建 OCRTesseract 类的一个实例。static OCRTesseractcreate(java.lang.String datapath)创建 OCRTesseract 类的一个实例。static OCRTesseractcreate(java.lang.String datapath, java.lang.String language)创建 OCRTesseract 类的一个实例。static OCRTesseractcreate(java.lang.String datapath, java.lang.String language, java.lang.String char_whitelist)创建 OCRTesseract 类的一个实例。static OCRTesseractcreate(java.lang.String datapath, java.lang.String language, java.lang.String char_whitelist, int oem)创建 OCRTesseract 类的一个实例。static OCRTesseractcreate(java.lang.String datapath, java.lang.String language, java.lang.String char_whitelist, int oem, int psmode)创建 OCRTesseract 类的一个实例。protected voidfinalize()java.lang.Stringrun(Mat image, int min_confidence)使用 tesseract-ocr API 识别文本。java.lang.Stringrun(Mat image, int min_confidence, int component_level)使用 tesseract-ocr API 识别文本。java.lang.Stringrun(Mat image, Mat mask, int min_confidence)java.lang.Stringrun(Mat image, Mat mask, int min_confidence, int component_level)voidsetWhiteList(java.lang.String char_whitelist)-
从类继承的方法 org.opencv.text.BaseOCR
getNativeObjAddr
-
-
-
-
方法详细信息
-
__fromPtr__
public static OCRTesseract __fromPtr__(long addr)
-
run
public java.lang.String run(Mat image, int min_confidence, int component_level)
使用 tesseract-ocr API 识别文本。接收图像输入并在 output_text 参数中返回识别的文本。可以选择性地提供找到的各个文本元素(例如,单词)的矩形,以及这些文本元素及其置信度值的列表。- 参数
image- 输入图像 CV_8UC1 或 CV_8UC3 找到的文本元素(例如,单词或文本行)。识别找到的各个文本元素(例如,单词或文本行)。用于识别找到的各个文本元素(例如,单词或文本行)。component_level- OCR_LEVEL_WORD(默认),或 OCR_LEVEL_TEXTLINE。min_confidence- 自动生成- 返回
- 自动生成
-
run
public java.lang.String run(Mat image, int min_confidence)
使用 tesseract-ocr API 识别文本。接收图像输入并在 output_text 参数中返回识别的文本。可以选择性地提供找到的各个文本元素(例如,单词)的矩形,以及这些文本元素及其置信度值的列表。- 参数
image- 输入图像 CV_8UC1 或 CV_8UC3 找到的文本元素(例如,单词或文本行)。识别找到的各个文本元素(例如,单词或文本行)。用于识别找到的各个文本元素(例如,单词或文本行)。min_confidence- 自动生成- 返回
- 自动生成
-
setWhiteList
public void setWhiteList(java.lang.String char_whitelist)
-
create
public static OCRTesseract create(java.lang.String datapath, java.lang.String language, java.lang.String char_whitelist, int oem, int psmode)
创建 OCRTesseract 类的一个实例。初始化 Tesseract。- 参数
datapath- tessdata 父目录的名称,以“/”结尾,或者 NULL 以使用系统的默认目录。language- ISO 639-3 代码,或者 NULL 将默认为“eng”。char_whitelist- 指定用于识别的字符列表。 NULL 默认为 ""(将使用所有字符进行识别)。oem- tesseract-ocr 提供了不同的 OCR 引擎模式 (OEM),默认情况下使用 tesseract::OEM_DEFAULT。有关其他可能的值,请参阅 tesseract-ocr API 文档。psmode- tesseract-ocr 提供了不同的页面分割模式 (PSM),使用 tesseract::PSM_AUTO(完全自动的布局分析)。有关其他可能的值,请参阅 tesseract-ocr API 文档。注意:在 OpenCV 4.7.0/3.19.0 之后,char_whitelist 默认值从 "0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ" 更改为 ""。- 返回
- 自动生成
-
create
public static OCRTesseract create(java.lang.String datapath, java.lang.String language, java.lang.String char_whitelist, int oem)
创建 OCRTesseract 类的一个实例。初始化 Tesseract。- 参数
datapath- tessdata 父目录的名称,以“/”结尾,或者 NULL 以使用系统的默认目录。language- ISO 639-3 代码,或者 NULL 将默认为“eng”。char_whitelist- 指定用于识别的字符列表。 NULL 默认为 ""(将使用所有字符进行识别)。oem- tesseract-ocr 提供了不同的 OCR 引擎模式 (OEM),默认情况下使用 tesseract::OEM_DEFAULT。有关其他可能的值,请参阅 tesseract-ocr API 文档。(完全自动的布局分析)被使用。有关其他可能的值,请参阅 tesseract-ocr API 文档。注意:在 OpenCV 4.7.0/3.19.0 之后,char_whitelist 默认值从 "0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ" 更改为 ""。- 返回
- 自动生成
-
create
public static OCRTesseract create(java.lang.String datapath, java.lang.String language, java.lang.String char_whitelist)
创建 OCRTesseract 类的一个实例。初始化 Tesseract。- 参数
datapath- tessdata 父目录的名称,以“/”结尾,或者 NULL 以使用系统的默认目录。language- ISO 639-3 代码,或者 NULL 将默认为“eng”。char_whitelist- 指定用于识别的字符列表。 NULL 默认为 ""(将使用所有字符进行识别)。 tesseract::OEM_DEFAULT 被使用。有关其他可能的值,请参阅 tesseract-ocr API 文档。(完全自动的布局分析)被使用。有关其他可能的值,请参阅 tesseract-ocr API 文档。注意:在 OpenCV 4.7.0/3.19.0 之后,char_whitelist 默认值从 "0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ" 更改为 ""。- 返回
- 自动生成
-
create
public static OCRTesseract create(java.lang.String datapath, java.lang.String language)
创建 OCRTesseract 类的一个实例。初始化 Tesseract。- 参数
datapath- tessdata 父目录的名称,以“/”结尾,或者 NULL 以使用系统的默认目录。language- ISO 639-3 代码,或者 NULL 将默认为“eng”。 (将使用所有字符进行识别)。 tesseract::OEM_DEFAULT 被使用。有关其他可能的值,请参阅 tesseract-ocr API 文档。(完全自动的布局分析)被使用。有关其他可能的值,请参阅 tesseract-ocr API 文档。注意:在 OpenCV 4.7.0/3.19.0 之后,char_whitelist 默认值从 "0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ" 更改为 ""。- 返回
- 自动生成
-
create
public static OCRTesseract create(java.lang.String datapath)
创建 OCRTesseract 类的一个实例。初始化 Tesseract。- 参数
datapath- tessdata 父目录的名称,以“/”结尾,或者 NULL 以使用系统的默认目录。 (将使用所有字符进行识别)。 tesseract::OEM_DEFAULT 被使用。有关其他可能的值,请参阅 tesseract-ocr API 文档。(完全自动的布局分析)被使用。有关其他可能的值,请参阅 tesseract-ocr API 文档。注意:在 OpenCV 4.7.0/3.19.0 之后,char_whitelist 默认值从 "0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ" 更改为 ""。- 返回
- 自动生成
-
create
public static OCRTesseract create()
创建 OCRTesseract 类的一个实例。初始化 Tesseract。 系统的默认目录。 (将使用所有字符进行识别)。 tesseract::OEM_DEFAULT 被使用。有关其他可能的值,请参阅 tesseract-ocr API 文档。(完全自动的布局分析)被使用。有关其他可能的值,请参阅 tesseract-ocr API 文档。注意:在 OpenCV 4.7.0/3.19.0 之后,char_whitelist 默认值从 "0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ" 更改为 ""。- 返回
- 自动生成
-
-