Tesseract.js相关整理
2016-10-29 10:52
197 查看
1.说明
什么是OCR
光学字符识别,或着说OCR,是指用电子的方式从图片中取出文字然后重用于其他领域,如文档编辑、自由文本搜索,或文本比对。
本教程中,你将学习怎样使用Tesseract,谷歌维护的一个开源OCR引擎。
Tesseract介绍
Tesseract十分强大,但有以下几点局限性:
不像其他OCR引擎(例如美国邮政业用于分类邮件的),Tesseract不能识别手写,而且只能识别一共大约64中字体的文本。
Tesseract需要一些处理来改善OCR结果,图像需要被放缩,图像有非常多的差异,另外还有水平排布的文字。
最后,Tesseract仅仅支持Liuux,Windows,Mac OS X。
2.Git地址
https://github.com/naptha/tesseract.js
3.其他demo
http://www.cocoachina.com/ios/20150708/12463.html
什么是OCR
光学字符识别,或着说OCR,是指用电子的方式从图片中取出文字然后重用于其他领域,如文档编辑、自由文本搜索,或文本比对。
本教程中,你将学习怎样使用Tesseract,谷歌维护的一个开源OCR引擎。
Tesseract介绍
Tesseract十分强大,但有以下几点局限性:
不像其他OCR引擎(例如美国邮政业用于分类邮件的),Tesseract不能识别手写,而且只能识别一共大约64中字体的文本。
Tesseract需要一些处理来改善OCR结果,图像需要被放缩,图像有非常多的差异,另外还有水平排布的文字。
最后,Tesseract仅仅支持Liuux,Windows,Mac OS X。
2.Git地址
https://github.com/naptha/tesseract.js
3.其他demo
http://www.cocoachina.com/ios/20150708/12463.html
相关文章推荐
- Table相关整理(HTML/JS)
- Leafletjs学习教程和相关代码整理
- 整理js和jquery相关用法(待续)
- node.js相关整理
- js window对象属性和方法相关资料整理
- Leafletjs学习教程和相关代码整理
- 关于js中距离相关整理
- [整理] Node.JS 相关常用记录
- 第一篇Node.js+React相关总结整理
- js相关知识点整理
- js-ajax相关基础知识整理
- JS Math.random()相关整理
- 整理js常用按键相关代码
- js相关知识整理
- JS获取浏览器和和设备相关属性整理
- Ajax相关资源收集与整理...
- JS整理
- [资料整理] 质量管理相关资料索引
- js日历控件整理
- [WWF]相关资料整理