爬取网页的通用代码框架
2017-05-25 16:15
253 查看
#-*- coding:UTF-8 -*- import requests def getHTMLText(url): try: r = requests.get(url, timeout = 30) r.raise_for_status() #如果状态不是200,引发HTTPError异常 r.encoding = r.apparent_encoding return r.text except: return '产生异常' if __name__ == '__main__': url = 'http://www.baidu.com' #url = 'www.baidu.com' print getHTMLText(url)
相关文章推荐
- 爬取网页的通用代码框架
- Python网页爬取的通用代码框架
- 3 使用requests爬取豆瓣点评及爬取网页通用框架完整代码
- easyui弹出层在最顶层显示跳出iframe框架通用javascript代码
- 防止网页被嵌入框架的JS代码
- 支持通用框架的threadpool代码
- 防止网页被嵌入框架的代码(续)
- linux epoll机制对TCP 客户端和服务端的监听C代码通用框架实现
- Android通用网络请求解析框架.4(代码实现,分支部分)
- easyui弹出层在最顶层显示跳出iframe框架通用javascript代码
- 防止网页被嵌入框架的代码
- 通用PHP动态生成静态HTML网页的代码
- JavaScript实现防止网页被嵌入Frame框架的代码分享
- 一个通用的单元测试框架的思考和设计08-实现篇-在testcase代码中执行sql语句
- Winform开发框架之通用人员信息管理实现代码介绍
- 防止网页被嵌入框架的代码(续)
- TCP粘包处理通用框架--C代码
- 让网页框架透明 底部对齐的代码
- JavaScript实现防止网页被嵌入Frame框架的代码分享
- 网页框架代码