您的位置:首页 > 编程语言 > Python开发

使用Python进行简单的验证码识别

2016-08-03 11:57 447 查看
0、环境

系统:Windows7 旗舰版 64位

Python:2.7.12

Pycharm: profession 2016.2

1、资源集合

Pillow-2.2.1.win-amd64-py2.7.exe: http://download.csdn.net/detail/ethantang520/9608443

tesseract-ocr-setup-3.02.02.exe: http://download.csdn.net/detail/ethantang520/9608447

pytesseract-0.1.6.tar.gz: http://download.csdn.net/detail/ethantang520/9608449

pytesser_v0.0.1.zip: http://download.csdn.net/detail/ethantang520/9608499

2、PIL/Pillow

由于PIL没有64位的安装包,所以用Pillow替代

这里使用Pillow-2.2.1.win-amd64-py2.7.exe进行安装

官方下载页:https://pypi.python.org/pypi/Pillow/2.2.1#downloads

3、tesseract-ocr

官方下载页:https://sourceforge.net/projects/tesseract-ocr,此处只有源码,需自行编译

这里使用tesseract-ocr-setup-3.02.02.exe进行安装

4、此处分为两套方案,任选其一

4-a、pytesseract

官方下载页:https://pypi.python.org/pypi/pytesseract

这里下载到的包名为: pytesseract-0.1.6.tar.gz

解压后,执行命令:python setup.py install

将解压目录下的pytesseract-0.1.6\build\lib\pytesseract 拷贝至Python安装路径下的
Lib\site-packages文件夹,如:

D:\Program Files (X86)\Python27\Lib\site-packages

该方案代码:

import pytesseract
from PIL import Image

image = Image.open("C:\Users\Ethan\Desktop\image_test.png")
# image.show()
text = pytesseract.image_to_string(image)
print text


4-b、pytesser

官方下载页:https://code.google.com/archive/p/pytesser/downloads

这里下载到的包名为:pytesser_v0.0.1.zip

将 pytesser_v0.0.1.zip 解压后全部文件与调用的代码文件放在一起,必须放在一起(拍黑板!!!)

修改解压出来的pytesser.py文件:第六行的 import Image ,改成 from PIL import Image

若使用PIL,是否需要修改则具体视Image模块的路径

该方案代码:

from pytesser import *
from PIL import Image

image = Image.open("C:\image_test.png")
# image.show()
text = image_to_string(image)
print text


参考文章:

http://www.cnblogs.com/xjin/p/4107720.html?utm_source=tuicool&utm_medium=referral

http://www.cnblogs.com/yeayee/p/4955506.html?utm_source=tuicool&utm_medium=referral

http://blog.csdn.net/nwpulei/article/details/8457738

http://vipscu.blog.163.com/blog/static/18180837220134234528457
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息