您的位置：首页 > 编程语言 > Python开发

python脚本实现《百万英雄》文字识别自动搜索

2018-03-04 12:51 591 查看

最近《百万英雄》很火。笔者也一直在玩，不过高中的知识都还给老师了。10秒的答题时间让人根本来不及去百度搜索。于是我制作了这个脚本，对题目进行文字识别，自动打开网页进行搜索。首先来看一下测试结果：

这里还是要推荐下小编的Python学习群:483546416，不管你是小白还是大牛，小编我都欢迎，不定期分享干货，包括小编自己整理的一份2017最新的Python资料和0基础入门教程，欢迎初学和进阶中的小伙伴。在不忙的时间我会给大家解惑。

实现原理：

实现原理非常简单。安卓手机连接电脑，通过adb调试实现对手机答题页面的截屏，然后利用百度云AI进行文字识别，在返回结果中找到问题的文字，通过python库打开浏览器进行浏览。

准备工作：

安卓手机连接电脑，开启手机的调试模式。电脑上需要有adb调试工具和python3安装通过pip3 install baidu-aip安装百度的文字识别库在百度ai上注册，并申请一个文字识别的应用，获得下面第二步需要的三个密码。

代码实现：

第一步：引入需要的库

上面有两个函数，我们一会再说。第二步：实现登陆百度aip。这部分根据百度api文档写代码即可。

这部分代码百度文档上有，目的是连上百度ai。
第三步：截取屏幕

这部分是adb调试的语法。我们通过os.system()调用第四步：裁剪图片并发送图片到百度ai

这里用到了上面一开始的两个函数。在第三部获得问题图片后，我们对图片进行裁剪，裁剪出只有问题和选项的部分，这样可以大幅提高ai的反应速度。然后通过百度给出的函数get_file_content和client.basicGeneral获得数据。第五步：获得问题上网搜索

这里面我为了应对，“下面的哪些不是。。。”这样的问题，给了两种搜索方式，一种是只在百度上搜索问题，另一种是连着答案一起去百度搜索。最后通过webbrowser打开浏览器。

未解决的问题

现在这段代码在windows上执行是没有问题的。但在mac上最后一步打开浏览器中文会发生乱码的现象，我一直没有办法解决，是编码的问题呢还是大小端的问题呢，希望读者能指定一二。另外，也可以使用一些其他的本地库来实现文字识别，比如大名鼎鼎的tesseract-ocr，但需要进行训练。同时我看到网上有人用beautiful soup进行文字分析，也是很好的方向。另外，这个东西只是一个辅助工具，有些题很灵。但现在有些题很绕，10秒的时间又看题，又在百度上找答案，根本来不及，反而会失去通过思考得出正确答案的时间。总之，靠答题致富不过是宣传口号，调整心态，获得答题的快乐才是根本。这段代码也主要是我娱乐自己的产物。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签： Python学习 Python开发爬虫

相关文章推荐

新的分享

章节导航

python脚本实现《百万英雄》文字识别 自动搜索

实现原理：

准备工作：

代码实现：

未解决的问题

python脚本实现《百万英雄》文字识别自动搜索