有哪些网站用爬虫爬取能得到很有价值的数据?
2017-12-03 13:35
260 查看
0、IT桔子和36Kr在专栏文章中(http://zhuanlan.zhihu.com/p/20714713),抓取IT橘子和36Kr的各公司的投融资数据,试图分析中国各家基金之间的互动关系。
1、知乎沧海横流,看行业起伏,抓取并汇总所有的答案,方便大家阅读,找出2015年最热门和最衰落的行业。
2、汽车之家大数据画像:宝马车主究竟有多任性?利用论坛发言的抓取以及NLP,对各种车型的车主做画像。
3、天猫、京东、淘宝等电商网站超越咨询顾问的算力,在用户理解和维护,抓取各大电商的评论及销量数据,对各种商品(颗粒度可到款式)沿时间序列的销量以及用户的消费场景进行分析。甚至还可以根据用户评价做情感分析,实时监控产品在消费者心目中的形象,对新发布的产品及时监控,以便调整策略。
4、58同城的房产、安居客、Q房网、搜房等房产网站下半年深圳房价将如何发展 ,抓取房产买卖及租售信息,对热热闹闹的房价问题进行分析。
5、大众点评、美团网等餐饮及消费类网站黄焖鸡米饭是怎么火起来的?抓取各种店面的开业情况以及用户消费和评价,了解周边变化的口味,所谓是“舌尖上的爬虫”。以及各种变化的口味,比如:啤酒在衰退,重庆小面在崛起。
6、58同城等分类信息网站花10万买贡茶配方,贵不贵?抓取招商加盟的数据,对定价进行分析,帮助网友解惑。
7、拉勾网、中华英才网等招聘网站互联网行业哪个职位比较有前途?抓取各类职位信息,分析最热门的职位以及薪水。
8、挂号网等医疗信息网站如何评价挂号网? 抓取医生信息并于宏观情况进行交叉对比。
9、应用宝等App市场你用 Python 做过什么有趣的数据挖掘/分析项目? 对各个App的发展情况进行跟踪及预测。(顺便吹一下牛,我们这个榜单很早就发现小红书App的快速增长趋势以及在年轻人中的极佳口碑)
10、携程、去哪儿及12306等交通出行类网站,对航班及高铁等信息进行抓取,能从一个侧面反映经济是否正在走入下行通道。
11、雪球等财经类网站抓取雪球KOL或者高回报用户的行为,找出推荐股票
12、58同城二手车、易车等汽车类网站一年当中买车的最佳时间为何时?什么品牌或者型号的二手车残值高?更保值?反之,什么类型的贬值较快? - 二手车,找出最佳的买车时间以及最保值的汽车。
13、神州租车、一嗨租车等租车类网站抓取它们列举出来的租车信息,长期跟踪租车价格及数量等信息
14、各类信托网站通过抓取信托的数据,了解信托项目的类型及规模
1、知乎沧海横流,看行业起伏,抓取并汇总所有的答案,方便大家阅读,找出2015年最热门和最衰落的行业。
2、汽车之家大数据画像:宝马车主究竟有多任性?利用论坛发言的抓取以及NLP,对各种车型的车主做画像。
3、天猫、京东、淘宝等电商网站超越咨询顾问的算力,在用户理解和维护,抓取各大电商的评论及销量数据,对各种商品(颗粒度可到款式)沿时间序列的销量以及用户的消费场景进行分析。甚至还可以根据用户评价做情感分析,实时监控产品在消费者心目中的形象,对新发布的产品及时监控,以便调整策略。
4、58同城的房产、安居客、Q房网、搜房等房产网站下半年深圳房价将如何发展 ,抓取房产买卖及租售信息,对热热闹闹的房价问题进行分析。
5、大众点评、美团网等餐饮及消费类网站黄焖鸡米饭是怎么火起来的?抓取各种店面的开业情况以及用户消费和评价,了解周边变化的口味,所谓是“舌尖上的爬虫”。以及各种变化的口味,比如:啤酒在衰退,重庆小面在崛起。
6、58同城等分类信息网站花10万买贡茶配方,贵不贵?抓取招商加盟的数据,对定价进行分析,帮助网友解惑。
7、拉勾网、中华英才网等招聘网站互联网行业哪个职位比较有前途?抓取各类职位信息,分析最热门的职位以及薪水。
8、挂号网等医疗信息网站如何评价挂号网? 抓取医生信息并于宏观情况进行交叉对比。
9、应用宝等App市场你用 Python 做过什么有趣的数据挖掘/分析项目? 对各个App的发展情况进行跟踪及预测。(顺便吹一下牛,我们这个榜单很早就发现小红书App的快速增长趋势以及在年轻人中的极佳口碑)
10、携程、去哪儿及12306等交通出行类网站,对航班及高铁等信息进行抓取,能从一个侧面反映经济是否正在走入下行通道。
11、雪球等财经类网站抓取雪球KOL或者高回报用户的行为,找出推荐股票
12、58同城二手车、易车等汽车类网站一年当中买车的最佳时间为何时?什么品牌或者型号的二手车残值高?更保值?反之,什么类型的贬值较快? - 二手车,找出最佳的买车时间以及最保值的汽车。
13、神州租车、一嗨租车等租车类网站抓取它们列举出来的租车信息,长期跟踪租车价格及数量等信息
14、各类信托网站通过抓取信托的数据,了解信托项目的类型及规模
相关文章推荐
- 【精华阅读】目的性越强,你的网站/应用数据分析越有价值
- Scrapy爬虫抓取网站数据
- 爬虫数据来源网站
- [Python爬虫] 之二十二:Selenium +phantomjs 利用 pyquery抓取界面网站数据
- 爬虫数据分析-美食网站最爱甜点top10
- 通过wireshark获取应用接口并使用爬虫爬取网站数据(三)
- 爬虫笔记 : Python提取网站数据总概括
- 如何应对网站反爬虫策略?如何高效地爬大量数据?
- 利用爬虫爬取看看豆网站站的数据信息
- 反反爬虫|应对网站反爬虫策略,更高效地爬大量数据
- 手把手教你用Node.js爬虫爬取网站数据的方法
- 有哪些可以获取数据的网站?[大数据]
- 一个100万数据(MYSQL)的网站,目前访问速度慢,如果让你优化,你会从哪些方面进行考虑,谈谈你的思路
- python爬取携程和蚂蜂窝的景点评论数据\python爬取携程评论数据\python旅游网站评论数据爬虫
- 四周实现爬虫系统(1)-抓取tripadvisor猫途鹰网站数据信息
- 一个 100 万数据( MYSQL )的网站,目前访问速度慢,如果让你优化,你会从哪些方 面进行考虑,谈谈你的思路
- 爬虫爬取电商网站的商品数据并保存成json文件
- 网站运营看哪些数据
- 需要分析竞争对手的网站哪些SEO数据