python多线程——采集ip并验证
2017-11-01 12:52
423 查看
Python因GIL的设计使得单CPU同一时刻只能执行一个线程,所以多线程在Python中主要用于IO较多的场景。前段时间需要采集一些免费IP代理,就应用多线程对采集来的代理进行目标网站的连通性进行批量验证。
Python通过两个标准库thread和threading提供对线程的支持。thread提供了低级别的、原始的线程以及一个简单的锁。
threading 模块提供的其他方法:
threading.currentThread(): 返回当前的线程变量。
threading.enumerate(): 返回一个包含正在运行的线程的list。正在运行指线程启动后、结束前,不包括启动前和终止后的线程。
threading.activeCount(): 返回正在运行的线程数量,与len(threading.enumerate())有相同的结果。
除了使用方法外,线程模块同样提供了Thread类来处理线程,Thread类提供了以下方法:
run(): 用以表示线程活动的方法。
start():启动线程活动。
join([time]): 等待至线程中止。这阻塞调用线程直至线程的join() 方法被调用中止-正常退出或者抛出未处理的异常-或者是可选的超时发生。
isAlive(): 返回线程是否活动的。
getName(): 返回线程名。
setName(): 设置线程名。
Python通过两个标准库thread和threading提供对线程的支持。thread提供了低级别的、原始的线程以及一个简单的锁。
threading 模块提供的其他方法:
threading.currentThread(): 返回当前的线程变量。
threading.enumerate(): 返回一个包含正在运行的线程的list。正在运行指线程启动后、结束前,不包括启动前和终止后的线程。
threading.activeCount(): 返回正在运行的线程数量,与len(threading.enumerate())有相同的结果。
除了使用方法外,线程模块同样提供了Thread类来处理线程,Thread类提供了以下方法:
run(): 用以表示线程活动的方法。
start():启动线程活动。
join([time]): 等待至线程中止。这阻塞调用线程直至线程的join() 方法被调用中止-正常退出或者抛出未处理的异常-或者是可选的超时发生。
isAlive(): 返回线程是否活动的。
getName(): 返回线程名。
setName(): 设置线程名。
# -*- coding: utf-8 -*- import sys reload(sys) sys.setdefaultencoding('utf-8') #import ...... def mt_validate(ip, port, target_urls): """ param:ip: param:port: param:target_urls: list return: """ for i in len(target_urls): exec('validate%d = 0' %i) for i, target_url in enumerate(target_urls): try: r = requests.get(target_url, proxies={"http": "http://%s:%s" % (ip, port), "https": "https://%s:%s" % (ip, port)}, timeout=8 , headers={}) except Exception: pass else: if r.status_code == 200: exec('validate%d = 1' %i) validate = reduce(lambda x, y: x+y, [eval('validate%d' %i) for i in len(target_urls)]) #if validate!='0'*len(target_urls): #...... #...... while True: if threading.active_count() < 200: t = threading.Thread(target=mt_validate, args=(ip, port)) t.start() logging.log(threading.active_count()) break else: time.sleep(0.3)
相关文章推荐
- python多线程验证ip
- 验证采集[Python]代理抓取并验证-多线程
- 【python】采集免费代理ip并验证可用性后存储到文件
- 使用Python多线程抓取并验证代理
- 发一个python写的多线程 代理服务器 抓取,保存,验证程序,希望喜欢python的朋友和我一起完善它
- python实现多线程采集的2个代码例子
- python 多线程采集网页
- Python 设置 IP 代理 访问网页 ( 用户名密码验证代理 )
- 使用python验证代理IP是否可用
- Python3 多线程数据采集中的一些坑
- python验证IP代理是否可用
- 【转】杰奇 jieqi 多线程自动采集同步源站 python源码
- 使用python 中的IPy 验证IP格式是否合法
- python:代理ip获取,验证,使用
- 【Python3.6爬虫学习记录】(十一)使用代理IP及用多线程测试IP可用性--刷访问量
- python数据采集与多线程效率分析
- python---多线程采集示例
- python学习之二 代理ip有效性验证
- Python采集代理ip并判断是否可用和定时更新的方法