今天写的一个用爬虫爬猫眼电影top100的完整代码
2018-04-02 17:03
711 查看
这个是今天写的一个爬取猫眼电影top100的一个完整的代码
# coding:utf-8 import json import requests from bs4 import BeautifulSoup def get_one_page(url): try: headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:59.0) Gecko/20100101 Firefox/59.0'} Response = requests.get(url,headers=headers) if Response.status_code == 200: return Response.text return None except Exception: return None def parse_one_page(html): Soup=BeautifulSoup(html,'html.parser',from_encoding='utf-8') board_wrapper=Soup.find('dl',class_='board-wrapper') dd_wag=board_wrapper.find_all('dd') list=[] for i in dd_wag: rate=i.find('i').get_text(strip=True) figure=i.find('a',class_='image-link').find('img',class_='board-img')['data-src'] movie=i.find('p',class_='name').find('a',attrs={'data-act':'boarditem-click'}).get_text(strip=True) cast=i.find('p',class_='star').get_text(strip=True)[3:] releasetime=i.find('p',class_='releasetime').get_text(strip=True)[5:] mark=i.find('i',class_='integer').string+i.find('i',class_='fraction').get_text(strip=True) x = {'rate':rate, 'figure':figure, 'movie':movie, 'cast':cast, 'releasetime':releasetime, 'mark':mark } list.append(x) return list def write_content(content): with open('D:/猫眼电影5.txt','a',encoding='utf-8') as f: for i in content: f.write(json.dumps(i,ensure_ascii=False)+'\n') f.close() if __name__=='__main__': for i in range(10): html=get_one_page('http://maoyan.com/board/4?offset=%s'%(i*10)) content=parse_one_page(html) write_content(content)
相关文章推荐
- python爬虫实战:抓取猫眼电影TOP100存放到MongoDB中
- python爬虫爬取猫眼电影top100
- Python爬虫-爬取猫眼电影Top100榜单
- 一个简单的python爬虫程序 爬取豆瓣热度Top100以内的电影信息
- 【爬虫】爬取猫眼电影top100
- Python爬虫之三:抓取猫眼电影TOP100
- python 爬虫抓取猫眼电影 top100 源码
- python爬虫实战--selenium验证码保存+多线程多标签+自动点击+完整代码
- [微信小程序]组件化开发,以一个自定义模块框组件当做示例(附完整示例代码和效果图)
- 【Heritrix基础教程之4】开始一个爬虫抓取的全流程代码分析
- //一个计算 “100+40-10+26=”的代码
- 用java写的一个图片爬虫脚本_代码分享
- c++windows编程,启动一个窗口完整代码
- 一个完整的代码调试页
- 一个完整的爬虫入门程序
- python之爬取猫眼电影TOP100
- python 爬虫项目-爬取猫眼top100电影
- 今天突然想到的一个关于代码注释和函数的想法
- 【Heritrix基础教程之4】开始一个爬虫抓取的全流程代码分析
- 今天一个数据结构的代码自己想出来,开心!!