Tesseract——OCR图像识别 入门篇
2014-05-27 13:00
381 查看
最近leader给了我一个任务,让我研究图像识别,从我们项目的screenshot中识别文字信息,so我开始了学习,与大家分享下。
我看到目前OCR技术有很多,最主要的是Asprise OCR,Tesseract OCR和Java OCR。
Asprise OCR速度很快,Java实现很简单,但是它是商业的,要收费的,免费版每次都要弹出对话框,是个很麻烦的事情。
Tesseract OCR是C++的,要使用cmd命令的,速度也很快,质量也很好。当然Java也是可以使用的。
Java OCR是纯Java的,效率也不错。
今天先记录下Tesseract吧,后续再补充
1. 首先从官网上下载压缩包,最新版本是Tesseract 3.03,之前的版本可以从这里下载.
2. 解压下载好的压缩包到本地目录。
3. 打开cmd窗口,进入到tesseract目录下,然后就可以开始我们的测试之旅啦
1)选择好你所要识别的图片,并确定你所要输出的文件,然后输入下列命令:
tesseract letter.png 1
"letter.png": 需要识别的图片
"1": 输出的文件 1.txt
2) 我们已经把图片中的信息解析出来啦。
我看到目前OCR技术有很多,最主要的是Asprise OCR,Tesseract OCR和Java OCR。
Asprise OCR速度很快,Java实现很简单,但是它是商业的,要收费的,免费版每次都要弹出对话框,是个很麻烦的事情。
Tesseract OCR是C++的,要使用cmd命令的,速度也很快,质量也很好。当然Java也是可以使用的。
Java OCR是纯Java的,效率也不错。
今天先记录下Tesseract吧,后续再补充
1. 首先从官网上下载压缩包,最新版本是Tesseract 3.03,之前的版本可以从这里下载.
2. 解压下载好的压缩包到本地目录。
3. 打开cmd窗口,进入到tesseract目录下,然后就可以开始我们的测试之旅啦
1)选择好你所要识别的图片,并确定你所要输出的文件,然后输入下列命令:
tesseract letter.png 1
"letter.png": 需要识别的图片
"1": 输出的文件 1.txt
2) 我们已经把图片中的信息解析出来啦。
相关文章推荐
- Tesseract-OCR图像识别引擎 windows10使用方法入门
- Tesseract——OCR图像识别 入门篇
- Tesseract——OCR图像识别 入门篇
- Java OCR tesseract 图像智能字符识别技术
- Java OCR tesseract 图像智能字符识别技术
- Java OCR tesseract 图像智能字符识别技术
- 利用开源程序(ImageMagick+tesseract-ocr)实现图像验证码识别
- Java OCR tesseract 图像智能字符识别技术 Java代码实现
- Java OCR tesseract 图像智能字符识别技术
- 利用开源程序(ImageMagick+tesseract-ocr)实现图像验证码识别
- Java OCR tesseract 图像智能字符识别技术 Java代码实现
- Java OCR tesseract 图像智能字符识别技术 Java代码实现
- Java OCR tesseract 图像智能字符识别技术 Java代码实现
- Java OCR tesseract 图像智能字符识别技术(一)
- Java OCR tesseract 图像智能字符识别技术 Java实现
- 利用开源程序(ImageMagick+tesseract-ocr)实现图像验证码识别
- 利用开源程序(ImageMagick+tesseract-ocr)实现图像验证码识别
- Java OCR tesseract 图像智能字符识别技术 Java代码实现
- Java OCR tesseract 图像智能字符识别技术
- Tesseract-OCR光学识别引擎 入门