Python爬虫(一)
2016-05-25 18:33
218 查看
import urllib2 response = urllib2.urlopen("http://www.baidu.com") print response.read()
该代码抓取的是百度的源码
其实上面的urlopen参数可以传入一个request请求,它其实就是一个Request类的实例,构造时需要传入Url,Data等等的内容。比如上面的两行代码,我们可以这么改写
import urllib2 request = urllib2.Request("http://www.baidu.com") response = urllib2.urlopen(request) print response.read()
其结果完全一样
GET与POST数据传送的区别:
get是直接以链接方式访问、链接中包含了所有的参数,当然如果包含了密码的话是一种不安全的选择,不过你可以直观地看到自己提交了什么内容。POST则不会在网址上显示所有的参数,不过如果你想直接查看提交了什么就不太方便了,
有待更新、敬请关注
相关文章推荐
- igraph安装(R/Python)
- 海龟作图—用Python 绘图
- python海龟绘图实例教程
- 【python练习】截取网页里最新的新闻
- python 装饰器和 functools 模块
- Python中pass、continue、break、exit()的区别
- Python菜鸟之路:Python基础(三)
- 【转载】python 模块 - random生成随机数模块
- python3 reqeuests给OSC全站用户刷积分
- 【pandas】[4] 数据清洗(数据合并,重塑,转换,离散化,过滤,采样)
- 根据本地文件,生成百度云文件列表
- 人脸验证算法Joint Bayesian详解及实现(Python版)
- 0603 python 基础02
- 用Python+Django1.9在Eclipse环境下开发web网站
- python scrapy环境搭建总结
- 【python】django-celery 实现django项目定时任务
- 0527 python 基础01
- Python模块探秘之EasyGui
- Python模块探秘之EasyGui
- Python-文件对象常用的API