您的位置:首页 > 编程语言 > Python开发

python爬虫入门-开发环境与小例子

2018-01-11 22:36 429 查看

python爬虫入门

开发环境

ubuntu 16.04

sublime

pycharm

requests库

requests库安装:

sudo pip install requests


第一个例子

import requests
r=requests.get("http://www.baidu.com")
r.encoding="utf-8"
print r.text


运行结果如下,成功抓取了百度的源代码



现在来详细讲解

import requests


就是导入了requests库,这是一个爬虫库

r=requests.get("http://www.baidu.com")


r是一个Response 对象。我们可以从这个对象中获取所有我们想要的信息。requests.get函数参数是url,返回值是一个Response 对象。

r.encoding="utf-8"


设置了网页编码,如果不加,汉字会乱码



print r.text


打印网页内容

获取请求状态码

import requests
r=requests.get("http://www.baidu.com")
print r.status_code


运行结果

200


200表示访问成功
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: