Python爬虫学习(1)
2018-02-05 21:09
337 查看
使用Python爬取网页中html内容
# coding=utf-8 import urllib import urllib2 import re url = "http://3ms.huawei.com/km/blogs/details/5171043" request = urllib2.Request(url) page = urllib2.urlopen(url) html = page.read() print html命令详解:
urlopen()可以接收三个参数即[code]urlopen(url, data, timeout)
url即你要请求的url地址,data是访问这个url需要传送的数据,timeout是超时时间
url是必填参数,其余两个是可选参数
urllib.request.urlopen(url)会返回一个http.client.HTTPResponse对象
这个返回的对象可以使用read()方法,来返回数据
[/code]
相关文章推荐
- 史上最全PHP,JAVA+Hadoop,Android,python爬虫,C++,Unity 3D最全学习视频,链接长期有效!
- Python爬虫学习3
- Python 简单网页爬虫学习
- Python学习 第7天 爬虫-1 构思
- Python 爬虫学习
- Python3.x学习笔记[1]:2种简单爬虫获取京东价格
- python库学习笔记——爬虫常用的BeautifulSoup的介绍
- Python 爬虫学习系列教程
- python爬虫学习第十五天
- Python爬虫学习1
- Python网络爬虫框架scrapy的学习
- python爬虫学习第三十六天
- python爬虫学习——爬取糗百页面段子
- Python的学习笔记DAY8---爬虫练习之煎蛋网妹子图爬虫
- python 爬虫相关学习资料
- python爬虫系统学习十一:常见反爬虫机制与应对方法
- 【python学习笔记】7:用python实现爬虫-基础
- python爬虫:下载百度贴吧图片学习笔记
- python爬虫学习第三十四天
- 【Python3.6爬虫学习记录】(十四)多线程爬虫模板总结