使用Python进行简单的验证码识别
2016-08-03 11:57
447 查看
0、环境
系统:Windows7 旗舰版 64位
Python:2.7.12
Pycharm: profession 2016.2
1、资源集合
Pillow-2.2.1.win-amd64-py2.7.exe: http://download.csdn.net/detail/ethantang520/9608443
tesseract-ocr-setup-3.02.02.exe: http://download.csdn.net/detail/ethantang520/9608447
pytesseract-0.1.6.tar.gz: http://download.csdn.net/detail/ethantang520/9608449
pytesser_v0.0.1.zip: http://download.csdn.net/detail/ethantang520/9608499
2、PIL/Pillow
由于PIL没有64位的安装包,所以用Pillow替代
这里使用Pillow-2.2.1.win-amd64-py2.7.exe进行安装
官方下载页:https://pypi.python.org/pypi/Pillow/2.2.1#downloads
3、tesseract-ocr
官方下载页:https://sourceforge.net/projects/tesseract-ocr,此处只有源码,需自行编译
这里使用tesseract-ocr-setup-3.02.02.exe进行安装
4、此处分为两套方案,任选其一
4-a、pytesseract
官方下载页:https://pypi.python.org/pypi/pytesseract
这里下载到的包名为: pytesseract-0.1.6.tar.gz
解压后,执行命令:python setup.py install
将解压目录下的pytesseract-0.1.6\build\lib\pytesseract 拷贝至Python安装路径下的
Lib\site-packages文件夹,如:
D:\Program Files (X86)\Python27\Lib\site-packages
该方案代码:
4-b、pytesser
官方下载页:https://code.google.com/archive/p/pytesser/downloads
这里下载到的包名为:pytesser_v0.0.1.zip
将 pytesser_v0.0.1.zip 解压后全部文件与调用的代码文件放在一起,必须放在一起(拍黑板!!!)
修改解压出来的pytesser.py文件:第六行的 import Image ,改成 from PIL import Image
若使用PIL,是否需要修改则具体视Image模块的路径
该方案代码:
参考文章:
http://www.cnblogs.com/xjin/p/4107720.html?utm_source=tuicool&utm_medium=referral
http://www.cnblogs.com/yeayee/p/4955506.html?utm_source=tuicool&utm_medium=referral
http://blog.csdn.net/nwpulei/article/details/8457738
http://vipscu.blog.163.com/blog/static/18180837220134234528457
系统:Windows7 旗舰版 64位
Python:2.7.12
Pycharm: profession 2016.2
1、资源集合
Pillow-2.2.1.win-amd64-py2.7.exe: http://download.csdn.net/detail/ethantang520/9608443
tesseract-ocr-setup-3.02.02.exe: http://download.csdn.net/detail/ethantang520/9608447
pytesseract-0.1.6.tar.gz: http://download.csdn.net/detail/ethantang520/9608449
pytesser_v0.0.1.zip: http://download.csdn.net/detail/ethantang520/9608499
2、PIL/Pillow
由于PIL没有64位的安装包,所以用Pillow替代
这里使用Pillow-2.2.1.win-amd64-py2.7.exe进行安装
官方下载页:https://pypi.python.org/pypi/Pillow/2.2.1#downloads
3、tesseract-ocr
官方下载页:https://sourceforge.net/projects/tesseract-ocr,此处只有源码,需自行编译
这里使用tesseract-ocr-setup-3.02.02.exe进行安装
4、此处分为两套方案,任选其一
4-a、pytesseract
官方下载页:https://pypi.python.org/pypi/pytesseract
这里下载到的包名为: pytesseract-0.1.6.tar.gz
解压后,执行命令:python setup.py install
将解压目录下的pytesseract-0.1.6\build\lib\pytesseract 拷贝至Python安装路径下的
Lib\site-packages文件夹,如:
D:\Program Files (X86)\Python27\Lib\site-packages
该方案代码:
import pytesseract from PIL import Image image = Image.open("C:\Users\Ethan\Desktop\image_test.png") # image.show() text = pytesseract.image_to_string(image) print text
4-b、pytesser
官方下载页:https://code.google.com/archive/p/pytesser/downloads
这里下载到的包名为:pytesser_v0.0.1.zip
将 pytesser_v0.0.1.zip 解压后全部文件与调用的代码文件放在一起,必须放在一起(拍黑板!!!)
修改解压出来的pytesser.py文件:第六行的 import Image ,改成 from PIL import Image
若使用PIL,是否需要修改则具体视Image模块的路径
该方案代码:
from pytesser import * from PIL import Image image = Image.open("C:\image_test.png") # image.show() text = image_to_string(image) print text
参考文章:
http://www.cnblogs.com/xjin/p/4107720.html?utm_source=tuicool&utm_medium=referral
http://www.cnblogs.com/yeayee/p/4955506.html?utm_source=tuicool&utm_medium=referral
http://blog.csdn.net/nwpulei/article/details/8457738
http://vipscu.blog.163.com/blog/static/18180837220134234528457
相关文章推荐
- python使用socket进行简单网络连接的方法
- 目前大家对Python都有一个共识,就是他对测试非常有用,自动化测试里Python用途也很广,但是Python到底怎么进行自动化测试呢?今天就简单的向大家介绍一下怎么使用Python进行自动化测试
- python:使用socket模块,进行服务器与客户端简单交互
- 使用Python进行二进制文件读写的简单方法(推荐)
- 使用python进行简单的分词与词云
- 【学习笔记】使用Python对文件进行简单操作
- 使用Python进行验证码识别
- 使用Python进行二进制文件读写的简单方法(推荐)
- Python中使用OpenCV库来进行简单的气象学遥感影像计算
- python 使用tesseract-ocr , pytesseract , PIL进行验证码识别
- 使用python及工具包进行简单的验证码识别
- 使用Python进行验证码识别
- [Python Fabric] [SSH] Mac OS X 10.9 + Vagrant虚拟环境使用Python Fabric进行SSH远程登录的简单实验
- 在Python中使用正则表达式同时匹配邮箱和电话并进行简单的分类
- 使用Python对Excel表格进行简单的读写操作(xlrd/xlwt)
- 在Python中使用正则表达式同时匹配邮箱和电话并进行简单的分类
- 使用python以及工具包进行简单的验证码识别
- Python 使用pdb进行简单调试
- [置顶] Python 使用itchat 对微信好友数据进行简单分析
- 简单数据预测—使用Python训练回归模型并进行预测(转自蓝鲸网站分析博客)