opencv_practices:OPENCV实践 源码
OPENCV实践 第1部分。Tesseract的简单光学字符识别 Tesseract是OCR(光学字符识别)当前的顶级引擎,它由Google开发,具有开源许可Apache 2.0。 在第一部分中,我们应用引擎来构建一个简单的OCR程序。 机制 输入:二进制图像。 输出:文本信息。 端到端流程: 页面布局分析:识别“文本”区域中的组件轮廓。 斑点查找:识别“文本”区域中的字符轮廓。 查找文字行和单词:将字符轮廓组织到单词中。 识别单词Pass 1和Pass 2 :单词识别。 模糊空间分辨率。 单词识别过程: 步骤1. Blob检测器重新调节每个Blob对应于单词中的每个字符(在大多数情况下)。 步骤2.将结果呈现给词典搜索,然后为单词中的每个斑点选择分类器选择之一。 步骤3.将满意的每个单词作为训练数据传递到自适应分类器。 步骤4.剪切识别不佳的字符(称为片段),以提高分
下载地址
用户评论