拉勾网招聘数据分析
2016-11-06 15:58
197 查看
背景
大数据概念越来越火爆,很多学生开始学习大数据,社会人士也蠢蠢欲动准备转行,对这个新兴职业充满期待。在感性背后,我们来理性看待下目前的数据挖掘岗位需求,如果您确定要进入数据挖掘行业,您要学习哪些知识。本文主要探索的话题为:
数据挖掘岗位市场需求量
数据挖掘岗位诱惑力
数据挖掘岗位对求职者的要求
数据获取
数据源:通过爬虫的方式,从拉钩网爬取数据挖掘频道下前10页的招聘岗位,公司,职能要求等相关数据。
详细数据字段与内容预览为:
数据清洗
• 对薪水字段的清洗我们将薪水范围(如15k-20k)清洗成最低薪水,最高薪水,平均薪水三个特征。在清洗的过程中,我们发现存在着“K”分大小写的情况,因此,我们优先将字母统一转化成小写。
对公司简介的清洗公司简介一般由公司属于行业(如移动互联网,电子商务)加上公司发展阶段(如成熟型)构成。我们将公司简介字段清洗成行业+发展阶段。此外,我们还对学历和工作经验进行拆分
需求现状
• 说明,未进行时序动态爬取数据,对需求量的变化我们暂且不做描述分析。
• 样本容量:150
• 在经验方面,主要为1-5年,占82%。其中,3-5年工作经验需求量最大。
• 大数据概念13年底开始火爆,目前的人才要求在经验上并无特别长的要求,大部分是1-5年。so,如果你想从事大数据,并不晚哦。
需求现状- 行业分布
• 说明:企业可以同属多个行业,我们在数据处理时,如果一个企业属于N个行业,我们按照N个企业进行计算。
• 数据挖掘在移动互联网,金融,电商需求量大,传统行业需求量较少。
• 催生了一批专文做数据服务的企业,这块需求量也较大。
需求现状- 公司发展
• 从公司发展阶段来说,各个阶段都需求数据挖掘岗位,利用数据挖掘进行数据驱动。需求分布比较均匀。
需求现状-学历要求
• 目前数据挖掘岗位主要要求本科及以上学历,大部分都是要求本科学历,要求硕士学历的并不多。
• 大专学历特别优秀也可。
薪资现状
87% 的岗位需求,薪资待遇超过10K.
平均薪水为 20.51 K,主要集中在10-30K区间段,薪资水平极差为 41.5,薪资水平悬殊较大。
经验与薪水之间的关系
• 工作年限越长,薪水越高。工作3年差不多可以达到20K水平,4年差不多25K。
• 数据挖掘待遇起点高。刚入门(0年工作经验)已过10K。2年差不多在20K,和晓哥从网上查到的互联网公司薪水还是挺吻合的哈。
学历与薪水的关系
• 去掉学历“不限”的样本后,大专生与本科及以上学历,在薪水方面差异明显,读大学还是有用的哈;本科生平均水平为21.6798246K,研究生为19.7105263K,大专生为10.5384615
• 本科生水平比硕士还高??我们发现本科生水平比硕士高2K;这可能与 1.IT行业本身,本科生已足矣胜任,硕士学历优势不够明显。2、样本有篇,工作年限等水平不一致
看看不同阶段的公司,他们给出的待遇水平
• 随着公司的发展壮大,薪资水平也会组建提升。提升最快的阶段当属初创到成长,企业快速发展时。
• 企业在成长到成熟阶段,薪资水平高于其他阶段,尤其是成熟(D轮)阶段,薪水冠绝整个阶段,可能因为这个阶段的企业为冲击上市,高薪招揽良才。在上市后,由于有上市企业这个title作为背书吸引人才,薪水上并不具有绝对吸引力。刚上去与现阶段BAT,美团,携程,饿了么,滴滴等的情况很符合啊。
企业的用人要求
• 从词云上看,主要要求数据挖掘从业者需要掌握编程工具,python,R,java,sql等。有相应工作经验优先。
• 需要熟悉算法,决策树,贝叶斯,回归等
• 从工作内容上看,主要是用户行为分析,用户画像,建模,制作报告与方案。
• 数据挖掘是一门综合性多学科的职位。既要具有计算机编程能力,数学推理能力,还需要和产品等多团队合作。
当我们在谈论数据挖掘时,还会谈些什么?
数据科学–工具篇
欢迎预定晓哥整理撰写的《数据科学-工具篇之R语言》。目录为:
数据科学-分析篇
R语言入门
R语言基础数据结构与语法
R语言数据探讨
R语言数据处理
R语言高级数据处理
R语言数据可视化
R语言数据可视化-交互篇
R语言搭建数据产品
R语言报告自动化
R语言爬虫
R语言并行计算
数据科学-挖掘篇
R语言回归分析
R语言分类预测
R语言聚类分类
R语言时序分析
R语言异常挖掘
R语言文本挖掘入门
R语言复杂网络分析
预定方式
预定:关注“17找蜜”微信公众号,留言“预定”加群。
获取本文数据,关注微信公众号,留言“招聘数据”获取本文数据及html交互版
大数据概念越来越火爆,很多学生开始学习大数据,社会人士也蠢蠢欲动准备转行,对这个新兴职业充满期待。在感性背后,我们来理性看待下目前的数据挖掘岗位需求,如果您确定要进入数据挖掘行业,您要学习哪些知识。本文主要探索的话题为:
数据挖掘岗位市场需求量
数据挖掘岗位诱惑力
数据挖掘岗位对求职者的要求
数据获取
数据源:通过爬虫的方式,从拉钩网爬取数据挖掘频道下前10页的招聘岗位,公司,职能要求等相关数据。
详细数据字段与内容预览为:
数据清洗
• 对薪水字段的清洗我们将薪水范围(如15k-20k)清洗成最低薪水,最高薪水,平均薪水三个特征。在清洗的过程中,我们发现存在着“K”分大小写的情况,因此,我们优先将字母统一转化成小写。
对公司简介的清洗公司简介一般由公司属于行业(如移动互联网,电子商务)加上公司发展阶段(如成熟型)构成。我们将公司简介字段清洗成行业+发展阶段。此外,我们还对学历和工作经验进行拆分
需求现状
• 说明,未进行时序动态爬取数据,对需求量的变化我们暂且不做描述分析。
• 样本容量:150
• 在经验方面,主要为1-5年,占82%。其中,3-5年工作经验需求量最大。
• 大数据概念13年底开始火爆,目前的人才要求在经验上并无特别长的要求,大部分是1-5年。so,如果你想从事大数据,并不晚哦。
需求现状- 行业分布
• 说明:企业可以同属多个行业,我们在数据处理时,如果一个企业属于N个行业,我们按照N个企业进行计算。
• 数据挖掘在移动互联网,金融,电商需求量大,传统行业需求量较少。
• 催生了一批专文做数据服务的企业,这块需求量也较大。
需求现状- 公司发展
• 从公司发展阶段来说,各个阶段都需求数据挖掘岗位,利用数据挖掘进行数据驱动。需求分布比较均匀。
需求现状-学历要求
• 目前数据挖掘岗位主要要求本科及以上学历,大部分都是要求本科学历,要求硕士学历的并不多。
• 大专学历特别优秀也可。
薪资现状
87% 的岗位需求,薪资待遇超过10K.
平均薪水为 20.51 K,主要集中在10-30K区间段,薪资水平极差为 41.5,薪资水平悬殊较大。
经验与薪水之间的关系
• 工作年限越长,薪水越高。工作3年差不多可以达到20K水平,4年差不多25K。
• 数据挖掘待遇起点高。刚入门(0年工作经验)已过10K。2年差不多在20K,和晓哥从网上查到的互联网公司薪水还是挺吻合的哈。
学历与薪水的关系
• 去掉学历“不限”的样本后,大专生与本科及以上学历,在薪水方面差异明显,读大学还是有用的哈;本科生平均水平为21.6798246K,研究生为19.7105263K,大专生为10.5384615
• 本科生水平比硕士还高??我们发现本科生水平比硕士高2K;这可能与 1.IT行业本身,本科生已足矣胜任,硕士学历优势不够明显。2、样本有篇,工作年限等水平不一致
看看不同阶段的公司,他们给出的待遇水平
• 随着公司的发展壮大,薪资水平也会组建提升。提升最快的阶段当属初创到成长,企业快速发展时。
• 企业在成长到成熟阶段,薪资水平高于其他阶段,尤其是成熟(D轮)阶段,薪水冠绝整个阶段,可能因为这个阶段的企业为冲击上市,高薪招揽良才。在上市后,由于有上市企业这个title作为背书吸引人才,薪水上并不具有绝对吸引力。刚上去与现阶段BAT,美团,携程,饿了么,滴滴等的情况很符合啊。
企业的用人要求
• 从词云上看,主要要求数据挖掘从业者需要掌握编程工具,python,R,java,sql等。有相应工作经验优先。
• 需要熟悉算法,决策树,贝叶斯,回归等
• 从工作内容上看,主要是用户行为分析,用户画像,建模,制作报告与方案。
• 数据挖掘是一门综合性多学科的职位。既要具有计算机编程能力,数学推理能力,还需要和产品等多团队合作。
当我们在谈论数据挖掘时,还会谈些什么?
数据科学–工具篇
欢迎预定晓哥整理撰写的《数据科学-工具篇之R语言》。目录为:
数据科学-分析篇
R语言入门
R语言基础数据结构与语法
R语言数据探讨
R语言数据处理
R语言高级数据处理
R语言数据可视化
R语言数据可视化-交互篇
R语言搭建数据产品
R语言报告自动化
R语言爬虫
R语言并行计算
数据科学-挖掘篇
R语言回归分析
R语言分类预测
R语言聚类分类
R语言时序分析
R语言异常挖掘
R语言文本挖掘入门
R语言复杂网络分析
预定方式
预定:关注“17找蜜”微信公众号,留言“预定”加群。
获取本文数据,关注微信公众号,留言“招聘数据”获取本文数据及html交互版
相关文章推荐
- 使用Spark分析拉勾网招聘信息(二): 获取数据
- 对拉勾网招聘信息做一次数据分析(上)--40行代码拿下所有数据
- python爬取拉勾网招聘信息并利用pandas做简单数据分析
- 使用Spark分析拉勾网招聘信息(二): 获取数据
- 拉勾网大数据相关岗位数据爬虫分析
- 基于某知名招聘网站的上海财务岗位数据分析
- 招聘数据分析<三>
- 一个疑似高德数据分析的招聘要求
- 【ML项目】基于网络爬虫和数据挖掘算法的web招聘数据分析(一)——数据获取与处理
- Python数据分析--数据分析岗位最新招聘情况
- 数据开源 - Boss直聘、拉勾网岗位和招聘信息数据
- 拉勾网爬取的招聘数据解读--大数据分析师要掌握的工具与语言
- Python爬虫之实习僧招聘信息及数据分析
- 使用Spark分析拉勾网招聘信息(四): 几个常用的脚本与图片分析结果
- 爬拉勾网数据,存Elasticsearch进行归类分析
- 对招聘网站进行简单的数据分析找到合适的工作
- 使用Spark分析拉勾网招聘信息(四): 几个常用的脚本与图片分析结果
- 100%教会爬取全国保险业务员微信号码和拉勾网招聘数据
- 招聘数据分析<一>
- 爬取拉勾网,并进行数据分析