您的位置:首页 > Web前端 > JavaScript

Tesseract.js相关整理

2016-10-29 10:52 197 查看
1.说明

什么是OCR

光学字符识别,或着说OCR,是指用电子的方式从图片中取出文字然后重用于其他领域,如文档编辑、自由文本搜索,或文本比对。

本教程中,你将学习怎样使用Tesseract,谷歌维护的一个开源OCR引擎。

Tesseract介绍

Tesseract十分强大,但有以下几点局限性:

不像其他OCR引擎(例如美国邮政业用于分类邮件的),Tesseract不能识别手写,而且只能识别一共大约64中字体的文本。

Tesseract需要一些处理来改善OCR结果,图像需要被放缩,图像有非常多的差异,另外还有水平排布的文字。

最后,Tesseract仅仅支持Liuux,Windows,Mac OS X。

2.Git地址

https://github.com/naptha/tesseract.js

3.其他demo

http://www.cocoachina.com/ios/20150708/12463.html
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: