使用python爬取京东评论(json)
2017-10-25 20:37
281 查看
任务:爬取京东某手机的评论
这次爬取的内容是动态的所以不能直接爬源代码中的内容打开网页按下F12在Network里找到productPageComments文件
打开这个文件
这个文件是由json保存的(这里面就是要爬取的内容)
先用读取网页
url='https://club.jd.com/comment/productPageComments.action?callback=fetchJSON_comment98vv17182&productId=4554969&score=0&sortType=5&page=0&pageSize=10&isShadowSku=0&fold=1' #这里是上面网页的url request=urllib2.Request(url) response=urllib2.urlopen(request) html =response.read().decode('GBK')
5 . 处理字符串使它可以使用json.loads语句
html=html.replace('fetchJSON_comment98vv17182(','') html=html.replace(');','') b=json.loads(html)
6 .整体代码:
#--*--coding:utf-8--*-- import urllib2 import json import sys reload(sys) sys.setdefaultencoding('utf8') f = open('01.txt','w') for i in range(0,10): url='https://club.jd.com/comment/productPageComments.action?callback=fetchJSON_comment98vv17182&productId=4554969&score=0&sortType=5&page='+str(i)+'&pageSize=10&isShadowSku=0&fold=1' #实现爬多页 print url request=urllib2.Request(url) response=urllib2.urlopen(request) html =response.read().decode('GBK') html=html.replace('fetchJSON_comment98vv17182(','') html=html.replace(');','') #去掉多余的字符 b=json.loads(html) for k in b['comments']: content = k["content"].encode('utf-8') print content f.write(k["content"].encode('utf-8')+'\n') referenceName=k["referenceName"].encode('utf-8') print referenceName f.write(k["referenceName"].encode('utf-8')+'\n') referenceTime=k["referenceTime"].encode('utf-8') print referenceTime f.write(k["referenceTime"].encode('utf-8')+'\n\n')
相关文章推荐
- python json 爬京东商品评论
- 使用python解析json文件 分类: python 小练习 2014-03-21 18:17 354人阅读 评论(0) 收藏
- [置顶] [爬虫]使用python抓取京东全站数据(商品,店铺,分类,评论)
- python json使用
- 使用reduce函数 分类: python 2013-04-18 20:34 316人阅读 评论(0) 收藏
- 使用StringIO 分类: python 小练习 2013-06-14 16:00 233人阅读 评论(0) 收藏
- 使用glob模块,遍历E盘下的mp3文件 分类: python 小练习 2013-05-15 15:40 405人阅读 评论(0) 收藏
- python——使用yaml数据格式,PK --> XML,JSON
- 使用python解析json文件
- 使用os.walk()方法 分类: python 小练习 2013-08-14 10:52 1465人阅读 评论(0) 收藏
- 使用正则表达式替换文件内容 分类: python 小练习 2013-08-13 15:07 332人阅读 评论(0) 收藏
- #小练习 使用sys.argv 分类: python 小练习 2013-09-10 17:44 318人阅读 评论(0) 收藏
- python simplejson模块的使用方法
- 使用os.popen/commands.getoutput查询指定端口号的服务 分类: python 小练习 open()文件读写 python基础学习 2013-09-17 17:49 798人阅读 评论(0) 收藏
- 使用set()求出列表交集 分类: python基础学习 2013-06-16 17:00 241人阅读 评论(0) 收藏
- python中map()函数的使用 分类: python 2012-12-20 16:18 121人阅读 评论(0) 收藏
- python使用json格式进行数据封装
- 计数时使用Counter计数对象 分类: python 2013-01-18 16:11 163人阅读 评论(0) 收藏
- python使用json格式进行数据封装
- python simplejson模块的使用方法