您的位置:首页 > 其它

爬虫系列15、为链接添加一个回调函数类

2017-11-13 11:36 344 查看
class ScrapeCallback:
def __init__(self):
self.writer = csv.writer(open('countries.csv','w'))
# 表头
self.fields = ('area', 'ranked', 'university')
self.writer.writerow(self.fields)
def __call__(self, url, html):
if re.search('/view/',url):
tree = lxml.html.fromstring(html)
row = []
for field in self.fields:
row.append(tree.cssselect('table > tr#places_{}_row > td.w2p_fw'.format(field))
[0].text_content())
self.writer.writerow(row)
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: