圣诞节,哪里的女生最幸福——由京东评论看幸福指数
2016-12-25 15:52
337 查看
又是一年圣诞节,幸福的女生又到了拿花拿到手软的时候了。作为屌丝的我,突然想知道那个地方收到鲜花的人多呢?难不倒我,我就用Python爬取京东同城鲜花评论过万的前15个商品的评论,来看看哪里收到圣诞节鲜花的人多,看看那里的女生幸福度高~
我的依据是:一是获得12月24日,12月25日两天的购买信息,提取带有省份信息的数据;二是依据数据进行分析,要素有“一个省份,如果12月24日和12月25日的购买量大于平时日均购买量,就说明这个地方圣诞节女生较幸福”,“如果一个省份的日均购买量都很大,说明这个地方购买量大,但是由于人口基数不同,再结合人口数量进行对比分析”。好了,下面开始进入正题:
一、获取评论信息
利用之前做过的一个京东评论爬虫,直接爬出鲜花评论数前15的所有评论数据,提取出省份信息,汇总到excel中。
图1,2,3,4 评论数前15的商品
一共获取到了2万多的有效评论,其中每一条信息包括会员类型、省份、颜色(支数)、购买时间、购物客户端等信息。
图5 获取到的信息
二、数据处理,将数据导入处理软件
1.购买时间与当日订单数量
正如所料,在2月14日,3月8日,5月20日,七夕,教师节双十一,圣诞节附近都能形成小高峰,但是12月1日附近的高峰,是什么呢?是因为世界艾滋病日么?
图6时间与订单分布
2.省市与订单数量分布
图中可以看出,除去无法查询到省份信息的订单,已知省份的订单中,北京、广东、江苏、上海、四川、山东靠前,这与这些省市原本人口基数就大有关,另一方面也与当地经济发展有关。毕竟河南人口最多,但是排名却在中等。
图7 省份与订单数量分布
3.各重要节日期间各省份订单增长率
下面我们重点分析在重要节日期间,各省份订单量的增长百分比,来判断哪一个地方在这些节日收到鲜花的女生占得比重大,一次来判断某一省份女生幸福指数。以订单数前六的北京、广东、江苏、上海、四川、山东为例。
图8 北京
图9广东
图10江苏
图11上海
图12四川
图13山东
图14 6省对比
4.朵数与订单
先看看玫瑰花语:
1朵:你是我的唯一
9朵:长相守、坚定
11朵:一心一意的爱
19朵:爱的最高点
33朵:三生三世
36朵:我的爱只留给你
99朵:天长地久
可是,问题来了,38朵是什么鬼?是三八节送的吧?!
图15 朵数与订单
但是38朵是在6,7两个月销量最大啊!并不是在3月!不懂了。
经过百度多方查证,应该是“意思是:三个词,八个字母:I love you!”这表白,太含蓄!
图16 38朵玫瑰的月销量
总体来说,在各相关节日里,19朵的销量都不错;33朵的在十一月份销骤增
好了,分析暂时先到这里了。
那么,那里的女生幸福指数高呢?
相关文章推荐
- 【分享】京东小米手机用户评论
- 评论:中国软件输在哪里?
- 《Tomcat内核设计剖析》京东评论过百
- 爬取京东商品价格和评论数
- 评论:手机游戏的出路在哪里?
- 爬取京东评论、分词+词频统计、词云图展示
- 1024,千家公司程序员幸福指数大比拼!最“幸福”的程序员是你吗?
- 【程序员之战】女生从事iOS开发VS男生的优势在哪里!
- 手把手教你写电商爬虫-第五课 京东商品评论爬虫 一起来对付反爬虫
- 爬取京东评论、分词+词频统计、词云图展示
- python json 爬京东商品评论
- Scrapy学习笔记(4)分布式爬取京东商品详情,评论和评论总结
- 一个89后女生张雱成了京东52家公司法人!!刘强东搞出了什么?
- Rcurl小应用,爬取京东评论
- [置顶] [爬虫]使用python抓取京东全站数据(商品,店铺,分类,评论)
- 基于selenium和requests的京东商品信息和评论爬虫
- scrapy爬虫之抓取京东机械键盘评论量并画图展示
- 就马云对京东评论的看法
- python 爬虫-京东用户评论数据和用户评分