Python里pycurl使用记录
2010-01-08 01:19
393 查看
原文:http://www.lpfrx.com/archives/205/
这阵子使用python里读rss保存到数据库里,但使用了一段时间urllib觉得慢,在网上说pycurl的速度比urllib快,于是尝试使用,记录下使用方法:
#!/usr/bin/env python
# -*- coding: utf-8 -*-
import StringIO
import pycurl
html = StringIO.StringIO()
c = pycurl.Curl()
myurl='http://www.lpfrx.com'
c.setopt(pycurl.URL, myurl)
#写的回调
c.setopt(pycurl.WRITEFUNCTION, html.write)
c.setopt(pycurl.FOLLOWLOCATION, 1)
#最大重定向次数,可以预防重定向陷阱
c.setopt(pycurl.MAXREDIRS, 5)
#连接超时设置
c.setopt(pycurl.CONNECTTIMEOUT, 60)
c.setopt(pycurl.TIMEOUT, 300)
#模拟浏览器
c.setopt(pycurl.USERAGENT, "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 1.1.4322)")
#访问,阻塞到访问结束
c.perform()
#打印出 200(HTTP状态码)
print c.getinfo(pycurl.HTTP_CODE)
#输出网页的内容
print html.getvalue()
#输出网页类型
print "Content-type:", c.getinfo(c.CONTENT_TYPE)
安装pycurl到http://pycurl.sourceforge.net/这里去找.
在windows安装的话http://pycurl.sourceforge.net/download/ , 看你使用的版本决定下载那个,我在 windows使用的是python2.4, 所以下载 pycurl-ssl-7.15.5.1.win32-py2.4.exe 。
这阵子使用python里读rss保存到数据库里,但使用了一段时间urllib觉得慢,在网上说pycurl的速度比urllib快,于是尝试使用,记录下使用方法:
#!/usr/bin/env python
# -*- coding: utf-8 -*-
import StringIO
import pycurl
html = StringIO.StringIO()
c = pycurl.Curl()
myurl='http://www.lpfrx.com'
c.setopt(pycurl.URL, myurl)
#写的回调
c.setopt(pycurl.WRITEFUNCTION, html.write)
c.setopt(pycurl.FOLLOWLOCATION, 1)
#最大重定向次数,可以预防重定向陷阱
c.setopt(pycurl.MAXREDIRS, 5)
#连接超时设置
c.setopt(pycurl.CONNECTTIMEOUT, 60)
c.setopt(pycurl.TIMEOUT, 300)
#模拟浏览器
c.setopt(pycurl.USERAGENT, "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 1.1.4322)")
#访问,阻塞到访问结束
c.perform()
#打印出 200(HTTP状态码)
print c.getinfo(pycurl.HTTP_CODE)
#输出网页的内容
print html.getvalue()
#输出网页类型
print "Content-type:", c.getinfo(c.CONTENT_TYPE)
安装pycurl到http://pycurl.sourceforge.net/这里去找.
在windows安装的话http://pycurl.sourceforge.net/download/ , 看你使用的版本决定下载那个,我在 windows使用的是python2.4, 所以下载 pycurl-ssl-7.15.5.1.win32-py2.4.exe 。
相关文章推荐
- Python里pycurl使用记录
- caffe python layer初次使用记录
- python pycurl 使用
- 使用Python读取TestTrack记录- Part2
- Python使用pycurl获取http的响应时间
- python itchat 使用记录(代码帖)
- windows10下使用pyopenssl, pycurl 访问https网站(python)
- python随机数的使用记录
- Python·Jupyter Notebook各种使用方法记录·持续更新
- python使用QtWebKit代码记录
- python 使用装饰器并记录log
- 使用python中logging模块记录日志
- Python pandas使用记录
- python使用小记录
- python 使用记录
- Python 多进程使用中的一些记录
- Python·Jupyter Notebook各种使用方法记录·持续更新
- Python·Jupyter Notebook各种使用方法记录
- Python:通过自定义系统级快捷键来控制程序开始或停止记录日志(使用小技巧解决一个貌似无解的问题)
- Linux平台下python链接数据库所需环境搭建记录(使用pip)