您的位置:首页 > 编程语言 > Python开发

python脚本实现《百万英雄》文字识别 自动搜索

2018-03-04 12:51 591 查看
最近《百万英雄》很火。笔者也一直在玩,不过高中的知识都还给老师了。10秒的答题时间让人根本来不及去百度搜索。于是我制作了这个脚本,对题目进行文字识别,自动打开网页进行搜索。首先来看一下测试结果:

这里还是要推荐下小编的Python学习群:483546416,不管你是小白还是大牛,小编我都欢迎,不定期分享干货,包括小编自己整理的一份2017最新的Python资料和0基础入门教程,欢迎初学和进阶中的小伙伴。在不忙的时间我会给大家解惑。






实现原理:

实现原理非常简单。安卓手机连接电脑,通过adb调试实现对手机答题页面的截屏,然后利用百度云AI进行文字识别,在返回结果中找到问题的文字,通过python库打开浏览器进行浏览。

准备工作:

安卓手机连接电脑,开启手机的调试模式。电脑上需要有adb调试工具和python3安装通过pip3 install baidu-aip安装百度的文字识别库在百度ai上注册,并申请一个文字识别的应用,获得下面第二步需要的三个密码。

代码实现:

第一步:引入需要的库

上面有两个函数,我们一会再说。第二步:实现登陆百度aip。这部分根据百度api文档写代码即可。

这部分代码百度文档上有,目的是连上百度ai。
第三步:截取屏幕

这部分是adb调试的语法。我们通过os.system()调用第四步:裁剪图片并发送图片到百度ai

这里用到了上面一开始的两个函数。在第三部获得问题图片后,我们对图片进行裁剪,裁剪出只有问题和选项的部分,这样可以大幅提高ai的反应速度。然后通过百度给出的函数get_file_content和client.basicGeneral获得数据。第五步:获得问题上网搜索

这里面我为了应对,“下面的哪些不是。。。”这样的问题,给了两种搜索方式,一种是只在百度上搜索问题,另一种是连着答案一起去百度搜索。最后通过webbrowser打开浏览器。

未解决的问题

现在这段代码在windows上执行是没有问题的。但在mac上最后一步打开浏览器中文会发生乱码的现象,我一直没有办法解决,是编码的问题呢还是大小端的问题呢,希望读者能指定一二。另外,也可以使用一些其他的本地库来实现文字识别,比如大名鼎鼎的tesseract-ocr,但需要进行训练。同时我看到网上有人用beautiful soup进行文字分析,也是很好的方向。另外,这个东西只是一个辅助工具,有些题很灵。但现在有些题很绕,10秒的时间又看题,又在百度上找答案,根本来不及,反而会失去通过思考得出正确答案的时间。总之,靠答题致富不过是宣传口号,调整心态,获得答题的快乐才是根本。这段代码也主要是我娱乐自己的产物。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息