您的位置:首页 > 编程语言 > Python开发

Python爬虫学习(1)

2018-02-05 21:09 337 查看
使用Python爬取网页中html内容

# coding=utf-8
import urllib
import urllib2
import re
url = "http://3ms.huawei.com/km/blogs/details/5171043"
request = urllib2.Request(url)
page = urllib2.urlopen(url)
html = page.read()
print html
命令详解:
urlopen()可以接收三个参数即[code]urlopen(url, data, timeout)
 
url即你要请求的url地址,data是访问这个url需要传送的数据,timeout是超时时间 
url是必填参数,其余两个是可选参数 
urllib.request.urlopen(url)会返回一个http.client.HTTPResponse对象 
这个返回的对象可以使用read()方法,来返回数据
[/code]

                                            
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: