您的位置:首页 > 编程语言 > Python开发

Python爬虫(一)

2016-05-25 18:33 218 查看
import urllib2

response = urllib2.urlopen("http://www.baidu.com")
print response.read()

该代码抓取的是百度的源码



其实上面的urlopen参数可以传入一个request请求,它其实就是一个Request类的实例,构造时需要传入Url,Data等等的内容。比如上面的两行代码,我们可以这么改写

import urllib2

request = urllib2.Request("http://www.baidu.com")
response = urllib2.urlopen(request)
print response.read()


其结果完全一样

GET与POST数据传送的区别:

get是直接以链接方式访问、链接中包含了所有的参数,当然如果包含了密码的话是一种不安全的选择,不过你可以直观地看到自己提交了什么内容。POST则不会在网址上显示所有的参数,不过如果你想直接查看提交了什么就不太方便了,

有待更新、敬请关注
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: