您的位置：首页 > 编程语言

爬取网页的通用代码框架

2017-05-25 16:15 253 查看

#-*- coding:UTF-8 -*-
import requests

def getHTMLText(url):
try:
r = requests.get(url, timeout = 30)
r.raise_for_status() #如果状态不是200，引发HTTPError异常
r.encoding = r.apparent_encoding
return r.text
except:
return '产生异常'

if __name__ == '__main__':
url = 'http://www.baidu.com'
#url = 'www.baidu.com'
print getHTMLText(url)

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

爬取网页的通用代码框架
Python网页爬取的通用代码框架
3 使用requests爬取豆瓣点评及爬取网页通用框架完整代码
easyui弹出层在最顶层显示跳出iframe框架通用javascript代码
防止网页被嵌入框架的JS代码
支持通用框架的threadpool代码
防止网页被嵌入框架的代码（续）
linux epoll机制对TCP 客户端和服务端的监听C代码通用框架实现
Android通用网络请求解析框架.4（代码实现，分支部分）
easyui弹出层在最顶层显示跳出iframe框架通用javascript代码
防止网页被嵌入框架的代码
通用PHP动态生成静态HTML网页的代码
JavaScript实现防止网页被嵌入Frame框架的代码分享
一个通用的单元测试框架的思考和设计08-实现篇-在testcase代码中执行sql语句
Winform开发框架之通用人员信息管理实现代码介绍
防止网页被嵌入框架的代码（续）
TCP粘包处理通用框架--C代码
让网页框架透明底部对齐的代码
JavaScript实现防止网页被嵌入Frame框架的代码分享
网页框架代码

新的分享

世界上第一门编程语言究竟是谁？
Kitex源码阅读——脚手架代码是如何通过命令行生成的(二)
Kitex源码阅读——脚手架代码是如何通过命令行生成的(一)
图解拓扑排序+代码实现
小白福利！教你用低代码实现一个简单的页面跳转功能
函数式编程
图解Tire树+代码实现
图解KMP字符串匹配算法+代码实现
图解BM（Boyer-Moore）字符串匹配算法+代码实现
专门为小白准备的入门级mybatis-plus-generator代码自动生成器，提高开发效率。值得收藏
聊聊并发编程的12种业务场景
【面试普通人VS高手系列】讲一下wait和notify这个为什么要在synchronized代码块中？

章节导航