您的位置:首页 > 编程语言 > Python开发

Python小练习-采集天气预报

2013-03-18 13:49 381 查看
View Code

#!/usr/bin/env python
#coding=utf-8
import urllib
import re
def gethtml(url):
page = urllib.urlopen(url)
html = page.read()
page.close()
return html
def getweather(html):
reg = '<a title=.*?>(.*?)</a>.*?<span>(.*?)</span>.*?<b>(.*?)</b>'
weatherlist = re.compile(reg).findall(html)
return weatherlist
getml = gethtml('http://sd.weather.com.cn/index.shtml')
list_all = getweather(getml)
for i in list_all:
print i[0],i[1],i[2]
#    for item in i:
#        print item


代码很简单没什么好说的,主要就是正则匹配和乱码问题。
抓下来的页面是utf-8的 但是由于findall返回的是列表 如果直接输出列表 列表中有字符串的话会有乱码。
试过先转unicode再转gb2312也不可以。i.decode(‘utf-8′).encode(‘gb2312′)
单个输出就没问题了。

运行截图

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: