您的位置：首页 > Web前端 > JavaScript

Tesseract.js相关整理

2016-10-29 10:52 197 查看

1.说明

什么是OCR

光学字符识别，或着说OCR，是指用电子的方式从图片中取出文字然后重用于其他领域，如文档编辑、自由文本搜索，或文本比对。

本教程中，你将学习怎样使用Tesseract，谷歌维护的一个开源OCR引擎。

Tesseract介绍

Tesseract十分强大，但有以下几点局限性：

不像其他OCR引擎（例如美国邮政业用于分类邮件的），Tesseract不能识别手写，而且只能识别一共大约64中字体的文本。

Tesseract需要一些处理来改善OCR结果，图像需要被放缩，图像有非常多的差异，另外还有水平排布的文字。

最后，Tesseract仅仅支持Liuux，Windows，Mac OS X。

2.Git地址

https://github.com/naptha/tesseract.js

3.其他demo

http://www.cocoachina.com/ios/20150708/12463.html

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航