《五分钟速学技巧_利用ip代理绕过ip访问限制防爬策略》
2017-04-20 22:05
1161 查看
0x00序言
批量获取代理IP详见上篇文章《分享项目_python爬取可用代理ip》,在大量爬取某个指定网站时,若该网站做了限制单位时间内同个ip的访问次数,则需要利用代理ip来帮助我们的爬虫项目完成请求。获取免费的代理IP很简单,百度免费代理IP即可,本文中在点击打开链接获取代理IP0x01关键代码实现机理
首先获取足够的代理IP池,这在上篇文章中分享的项目可以快速搭建一个爬取代理IP池。拿到足够的IP之后,我们即可用urllib库的request方法中的,ProxyHandler方法,build_opener方法,install_opener方法,这三个方法可以看做是使用代理IP的一个套路
截取官方文档的部分关键文档
class
urllib.request.
ProxyHandler(proxies=None)
Cause requests to go through a proxy. If proxies is given, it must be a dictionary mapping protocol names to URLs of proxies.
ProxyHandler官方文档翻译过来就是,通过代理方法请求,如果给定一个代理,它必须是一个字典映射,key为协议,value为URLs或者代理ip。
urllib.request.
build_opener([handler,
...])
Return an
OpenerDirectorinstance, which chains the handlers in the order given.
build_opener方法返回一个链接着给定顺序的handler的OpenerDirector实例。
urllib.request.
install_opener(opener)
Install an
OpenerDirectorinstance as the default global opener.
install_opener方法安装OpenerDirector实例作为默认的全局opener。
如果无法理解的话,可以把这三个方法当做一个套路来使用。
0x02整体代码思路
这次的思路很简单,就是以上方法的顺序使用。1.将代理IP及其协议载入ProxyHandler赋给一个opener_support变量
2.将opener_support载入build_opener方法,创建opener
3.安装opener
0x03具体代码实现
from urllib import requestdef ProxySpider(url, proxy_ip, header):
opener_support = request.ProxyHandler({'http': proxy_ip})
opener = request.build_opener(opener_support)
request.install_opener(opener)
req = request.Request(url, headers=header)
rsp = request.urlopen(req).read()
return rsp
好了,已经实现了使用代理ip访问url的方法了,这样就能绕过服务器对ip的限制访问次数。
你学会了吗?
相关文章推荐
- 利用Windows的本地安全策略限制指定的IP访问服务器
- 利用IP扩展访问列表实现应用服务的访问限制
- Tomcat中实现IP访问限制--实现代理访问
- 利用sqlnet.ora限制IP访问
- 我是如何绕过派卡网注册IP限制进行刷票的(IP限制绕过技巧)
- DNS Rebinding技术绕过SSRF/代理IP限制
- [操作系统设置]利用IPSec对指定的ip进行访问限制
- 利用Windows2003 IP安全策略实现服务器远程桌面端口(3389)访问控制
- 利用Windows2003 IP安全策略实现服务器远程桌面端口(3389)访问控制
- 恶意访问网站的策略处理,IP访问限制
- Centos7利用iptables,限制访问ip及端口提升服务器的安全性
- 利用IP安全策略阻止访问特定的IP网段共享文件夹
- 次数加时间限制及限制代理访问或在服务器上面禁掉可疑IP访问
- Tomcat中实现IP访问限制--实现代理访问
- Nginx配置location限制IP访问策略
- ORACLE利用sqlnet.ora限制IP访问
- [windows]利用IPSec对指定的ip进行访问限制
- 通过安全策略限制局域网部分IP访问我的电脑
- win7利用组策略设置电脑开机登录密码次数限制技巧图解
- 恶意访问网站的策略处理,IP访问限制