Tesseract5.0 图像识别本地服务二【字库、训练识别模型】悟能的师兄的专栏-

18 六月

星期四, 18 六月 2020 14:13 Last Updated on 星期四, 18 六月 2020 14:13 0 Comments

一：简介

OCR(Optical Character Recognition)：光学字符识别，是指电子设备（例如扫描仪或数码相机）检查纸上打印的字符，通过检测暗、亮的模式确定其形状，然后用字符识别方法将形状翻译成计算机文字的过程。
Tesseract：开源的OCR识别引擎，初期Tesseract引擎由HP实验室研发，后来贡献给了开源软件业，后由Google进行改进、修改bug、优化，重新发布。

二：语言字库

书接上回，咱们先放字库地址：

1、Windows版本Tesseract各版本下载，https://github.com/tesseract-ocr/tesseract/wiki/Data-Files
2、懒得思考的人呐，直接来这里下载：https://tesseract-ocr.github.io/tessdoc/Data-Files
3、再放一个地址GIthub，直接来这里下载：https://github.com/tesseract-ocr/tessdata

再访问不了，那我也没办法了

链接：https://pan.baidu.com/s/1zolP6jiQFP1pABT8z9zh5Q
提取码：cxjt

Tesseract5.0 图像识别本地服务二【字库、训练识别模型】悟能的师兄的专栏-

各版本对应字库要识别简体中文需要下载chi_sim.traindata字库（【注意】根据版本下载对应字库）。

下载简体中文后放入你的字体库：

我的是：C:Program FilesTesseract-OCRtessdata

Tesseract5.0 图像识别本地服务二【字库、训练识别模型】悟能的师兄的专栏-

三：拿个图片来比划比划

Tesseract5.0 图像识别本地服务二【字库、训练识别模型】悟能的师兄的专栏- — books.jpg

 执行命令如下：tesseract books.jpg result -l chi_sim  解释器： -l chi_sim 表示用简体中文字库（需要下载中文字库文件，解压后，存放到tessdata目录下去,字库文件扩展名为 .raineddata 简体中文字库文件名为: chi_sim.traineddata）

1、执行过程：

Tesseract5.0 图像识别本地服务二【字库、训练识别模型】悟能的师兄的专栏-

2、执行结果：

Tesseract5.0 图像识别本地服务二【字库、训练识别模型】悟能的师兄的专栏-

随机拍摄的照片，识别效果不怎么样。标准化的图片应该会很好

四：遇到的问题处理

Tesseract5.0 图像识别本地服务二【字库、训练识别模型】悟能的师兄的专栏-

 语言库里面的简体中文有问题，解决办法就是 用命令：【tesseract --list-langs】来查看Tesseract-OCR支持语言，如果没有则自行添加对应库。

Tesseract5.0 图像识别本地服务二【字库、训练识别模型】悟能的师兄的专栏-

看到确实是简体中文的语言不存在，所以不能支持了。

正确情况如下：

Tesseract5.0 图像识别本地服务二【字库、训练识别模型】悟能的师兄的专栏-

展开阅读全文

1
评论
x
海报

扫一扫，海报
1
手机看

到微信朋友圈

x

扫一扫，手机阅读
- 打赏
打赏

悟能的师兄

“你的鼓励将是我创作的最大动力”

5C币 10C币 20C币 50C币 100C币 200C币

确定
关注

01-22 Tesseract5.0 图像识别本地服务二【字库、训练识别模型】悟能的师兄的专栏- 574

C# 使用Tesseract-OCR-v5.0，实现验证码，中文，身份证识别

OCR(Optical Character Recognition)：光学字符识别，是指对图片文件中的文字进行分析识别，获取的过程。Tesseract：开源的OCR识别引擎，初期Tesseract引擎由HP实验室研发，后来贡献给了开源软件业，后经由Google进行改进，消除bug，优化，重新发布。项目地址：https://github.com/tesseract-ocr本文使用最新版本Tes……

本页所有内容来自官方网站 https://www.imapbox.com 新闻来源：互联网搜索引擎和新闻站

本网页所有图片由 ImageBox 图片批量下载器,网页图片批量下载专家,网页图片批量下载器,获取到文章图片，下载并得到。

ImageBox 图片批量下载器工具地址: 网页图片批量下载工具-最新版本下载

非凡下载站地址：https://www.crsky.com/soft/35838.html

本网页所有视频内容由 imoviebox边看边下-网页视频下载, iurlBox网页地址收藏管理器下载并得到。

ImovieBox网页视频下载器下载地址: ImovieBox网页视频下载器-最新版本下载

本文章由: imapbox邮箱云存储,邮箱网盘,ImageBox 图片批量下载器,网页图片批量下载专家,网页图片批量下载器,获取到文章图片,imoviebox网页视频批量下载器,下载视频内容,为您提供.

阅读和此文章类似的: 全球云计算