[Python爬虫]2.豆瓣图书Top250
2017-06-24 21:34
931 查看
# 豆瓣图书Top250 import requests from bs4 import BeautifulSoup for page in range(10): url = 'https://book.douban.com/top250?start={}'.format(page*25) r = requests.get(url).text bsObj = BeautifulSoup(r,'html.parser') td_tags = bsObj.find_all('td',{'valign':'top','width':None}) #print(td_tags) for td_tag in td_tags: try: name = td_tag.find('a').get_text().strip('\n').replace('\n','').replace(' ','') info = td_tag.find('p',{'class':'pl'}).get_text() rating_nums = td_tag('div',{'class':'star clearfix'})[0].get_text().replace('\n','').replace(' ','') jianjie = td_tag.find('span',{'class':'inq'}).get_text() dd = name + '\n' + info + '\n' + rating_nums + '\n' + jianjie + '\n' #print(dd) with open('E:/豆瓣图书Top250.txt','a+',encoding='utf-8') as f: f.write(dd + '\n') except: continue
相关文章推荐
- python 爬虫实战(一)爬取豆瓣图书top250
- 简单的python爬虫爬豆瓣图书TOP250
- python爬虫实现获取豆瓣图书的top250的信息-beautifulsoup实现
- Python爬虫(二)—— 再探豆瓣Top250
- Python 采用Scrapy爬虫框架爬取豆瓣电影top250
- [python爬虫入门]爬取豆瓣电影排行榜top250
- [Python爬虫]1.豆瓣电影Top250
- Python爬虫初学(1)豆瓣电影top250评论数
- 实践Python的爬虫框架Scrapy来抓取豆瓣电影TOP250
- Python爬虫----抓取豆瓣电影Top250
- Python爬虫实战——豆瓣电影Top250
- python 爬虫 保存豆瓣TOP250电影海报及修改名称
- 【Python数据分析】Python3多线程并发网络爬虫-以豆瓣图书Top250为例
- Python爬虫实战——豆瓣电影top250
- Python爬虫豆瓣电影top250
- 1.【python爬虫学习笔记】爬取豆瓣电影top250
- Python爬虫——豆瓣电影Top250
- (7)Python爬虫——爬取豆瓣电影Top250
- python第一只爬虫:爬豆瓣top250
- 【Python数据分析】Python3操作Excel-以豆瓣图书Top250为例