对获取简单网页数据方法进行封装
2016-08-29 17:24
453 查看
对获取简单网页数据方法进行封装
# coding: utf-8
import urllib2
import urllib
import sys
reload(sys)
sys.setdefaultencoding("utf-8")
import re
class BasicsQequest():
def __init__(self):
self.user_agent = 'Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)'
self.headers = {'User-Agent': self.user_agent}
def basics_quest(self, url):
try:
# 构建请求的request
request = urllib2.Request(url, headers=self.headers)
# 利用urlopen获取页面代码
response = urllib2.urlopen(request)
# 将页面转化为UTF-8编码
pageCode = response.read().decode('utf-8')
# print pageCode
return pageCode
except urllib2.URLError, e:
if hasattr(e, "reason"):
print u"连接失败,错误原因", e.reason
return None
def basics_re(self, url, str_re):
pageCode = self.basics_quest(url)
if not pageCode:
print "页面加载失败...."
return None
pattern = re.compile(str_re, re.S)
items = pattern.findall(pageCode)
# for item in items:
# print item
return list(items)
# coding: utf-8
import urllib2
import urllib
import sys
reload(sys)
sys.setdefaultencoding("utf-8")
import re
class BasicsQequest():
def __init__(self):
self.user_agent = 'Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)'
self.headers = {'User-Agent': self.user_agent}
def basics_quest(self, url):
try:
# 构建请求的request
request = urllib2.Request(url, headers=self.headers)
# 利用urlopen获取页面代码
response = urllib2.urlopen(request)
# 将页面转化为UTF-8编码
pageCode = response.read().decode('utf-8')
# print pageCode
return pageCode
except urllib2.URLError, e:
if hasattr(e, "reason"):
print u"连接失败,错误原因", e.reason
return None
def basics_re(self, url, str_re):
pageCode = self.basics_quest(url)
if not pageCode:
print "页面加载失败...."
return None
pattern = re.compile(str_re, re.S)
items = pattern.findall(pageCode)
# for item in items:
# print item
return list(items)
相关文章推荐
- 1个比较简单的使用java反射机制获取前台数据进行数据封装的例子
- Android获取网页数据的方法总结
- 简单方法获取数据连接的字符串(UDL文件)
- Android获取网页数据的方法总结
- php获取网页中图片、DIV内容的简单方法
- 如何简单的下载一些小文件并保存在一个路径中(有些方法进行了封装)
- 简单方法获取数据连接的字符串(UDL文件)
- 对网页进行简繁字体转换的简单方法
- 使用简单的json.dumps方法对简单数据类型进行编码
- php获取网页中图片、DIV内容的简单方法
- 使用Mono Cecil 动态获取运行时数据 (Atribute形式 进行注入 用于写Log) [此文报考 xxx is declared in another module and needs to be imported的解决方法]-摘自网络
- 转载 Android获取网页数据的方法总结
- 【android初级】之Android获取网页数据的方法总结
- android初级之Android获取网页数据的方法总结
- 利用ASM进行方法拦截中获取相关数据的实现
- Android之提交数据到服务端方法简单封装
- android初级之Android获取网页数据的方法总结
- 使用简单的方法进行批量删除数据
- C++使用POST方法向网页提交数据-----C++发送HTTP数据获取Google天气预报
- 简单方法获取数据连接的字符串(UDL文件)