您的位置：首页 > 其它

Tesseract——OCR图像识别入门篇

2014-05-27 13:00 381 查看

最近leader给了我一个任务，让我研究图像识别，从我们项目的screenshot中识别文字信息，so我开始了学习，与大家分享下。

我看到目前OCR技术有很多，最主要的是Asprise OCR，Tesseract OCR和Java OCR。

Asprise OCR速度很快，Java实现很简单，但是它是商业的，要收费的，免费版每次都要弹出对话框，是个很麻烦的事情。

Tesseract OCR是C++的，要使用cmd命令的，速度也很快，质量也很好。当然Java也是可以使用的。

Java OCR是纯Java的，效率也不错。

今天先记录下Tesseract吧，后续再补充

1. 首先从官网上下载压缩包，最新版本是Tesseract 3.03，之前的版本可以从这里下载.

2. 解压下载好的压缩包到本地目录。

3. 打开cmd窗口，进入到tesseract目录下，然后就可以开始我们的测试之旅啦

1）选择好你所要识别的图片，并确定你所要输出的文件，然后输入下列命令:

tesseract letter.png 1

"letter.png": 需要识别的图片

"1": 输出的文件 1.txt

2) 我们已经把图片中的信息解析出来啦。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航

Tesseract——OCR图像识别 入门篇

Tesseract——OCR图像识别入门篇