首席数据官

Hi, 请登录

基于拉勾网的成都市数据科学职位分析报告

本文通过查询相关资料,明确了市场上数据科学的相关职位,继而确定了搜索职位为:数据分析师、算法工程师、数据挖掘、数据运营、数据产品经理、大数据工程师等。通过分析求职者的需求,确定了爬虫的关键词为工作经验、学历要求、公司发展阶段、公司规模、薪资待遇、岗位职责、任职要求等。采用Python软件对拉钩网的数据进行了爬取,接着将爬取的数据进行去重等清洗工作,得到可供直接分析的数据;最后通过Python和Excel等工具对数据进行分析和探索,最终得到该分析报告,以期为求职者提供高价值的参考。

1 总体指标分析1.1学历要求

学历要求包括本科、硕士、博士、大专和不限这五类,考虑到数据行业的入门门槛较高的特点,大专以下学历能够从事相关工作属于小概率事件,因此将不限归于大专这一档。最终分析得出招聘单位对求职者的学历要求情况如下图:

图1 学历要求分布图

由图1可见,招聘岗位要求学历为本科的占比最高,达到3/4;其次为大专,占比近20%;而要求求职者为硕士及以上学历的企业占比较低,仅为6%。对原始数据进一步分析发现:学历要求为硕士及以上的职位则主要集中在算法工程师、数据挖掘等对数学要求比较高的岗位。

1.2工作经验

原始数据中存在“不限”和“1年以下”两类工作经验,从含义上讲,“不限”显然是对招聘单位对求职者的经验不作要求,因此将两者合并为 “一年以下”工作经验。最终分析得出招聘单位对求职者的工作经验要求情况如下图:

图2 工作经验分布图

由图2可知,1)要求求职者具备3-5年工作经验的岗位最多,占比达到46%;2)要求工作经验达为1-3年和5-10年的岗位分居2、3位,占比分别为28%和13%;3)对于具备1年以下工作经验的岗位也达到12.5%。可见,求职市场对具备一定工作经验,能够独立胜任工作或者具备带团队工作的人才非常需要,而对1年以下工作经验的需求,也表明该行业对人才具有一定的缺口。

1.3薪资分布

由于网站上同一岗位的薪资并不是一个确定值,而是一个范围值,为了便于进行数学上的分析,取薪资范围的上限与下限的均值作为该岗位的薪资待遇情况,同时将所得的薪资分为[0k,5k)、[5k,10k)、10k,15k)、[15k,20k)、[20k,+∞)这五个档位。最终分析得出招聘单位对求职者提供的薪资情况如下图:

图3 薪资情况分布图

由图3可知,平均月薪位于[10k,15k)范围的占比最大,超过30%;而平均月薪位于[15k,20k)范围内以及[5k,10k)范围内的占比也超过0%;值得注意的是月薪在[20k,+∞)范围内占比也达到了17%;而[0k,5k)的占比极少。

从领取的薪水与工作能力相关的角度来看成都专业数据分析团队,招聘岗位除了需要对业务熟练的有经验员工,也非常渴望能够带领团队的骨干型人才(薪水对应着[20k,+∞)范围)。

1.4企业规模

通过对原始数据的企业规模分析,得出招聘单位的企业规模情况如下图:

图4 企业规模分布图

从公司规模来看,职工人数在150-550人数的公司数量最多,达到220家,而15人到500人范围内的公司占比超过80%,可见招聘企业主要以中小型企业为主。

1.5企业发展阶段

通过分析原始数据的企业发展阶段,得出招聘单位的企业发展规模情况如下图:

图5 企业发展阶段分布图

从公司发展阶段来看,成长型企业和初创型企业的占比接近90%,而成熟型企业数量只占10%,可见新型企业是数据科学相关职位招聘主力军。

图6 所属行业分布图

1.6所属行业

很多企业的所属行业包含多个,并且很多行业指代不清(比如移动互联网行业),应对方式如下:1)包含多个行业的情况,认为第一个行业是其主要行业,取第一行业为其所属行业;2)对于第一个行业指代不明的情况(例如“移动互联网”),采用第二行业为其行业所属。通过分析得出招聘单位所属行业情况如下图示:

图6 所属行业分布

可见,数据相关职位需求最大的行业是电子商务、数据服务、金融等三个行业,其占比超过50%,同时需求量最大的前四个行业占比达到60%。

1.7结论

通过对拉勾网成都市数据相关岗位的分析,可以得出:

1)本科和大专学历能够满足市场上绝大多数岗位要求,要求学历为本科和大专的占比分别为70%和20%;

2)招聘岗位比较看重求职者工作经验:要求求职者具备3-5年和1-3年工作经验的岗位达到85%;但是对1年以下工作经验的人员也有一定需求,占比达到12.5%;

3)总体薪资待遇偏高:主要集中在[5k,10k)、[10k,15k)、[15k,20k)这三个区间范围内,占比达到80%;而[20k,+∞)范围的占比也能达到17.6%;

4)招聘企业主要以中小企业为主,员工人数为15-500人的公司占比达到80%;

5)绝大多数公司为成长型和初创型企业,占比达到90%:

6)从企业所处行业来看,电子商务、数据服务、金融是需求量最大的行业,占比超过50%。

2 数据探索

求职者比较关心职位要求的工作经验、学历要求和薪资待遇方面的问题,那么从统计学的角度来看,企业发展阶段和公司规模与这些因素是否具备相关性?如果具备,具体是怎样的关系?

2.1 相关性检验

很多情况下,采用参数检验的方法进行统计量的推断,但是本课题下,由于信息太少等原因,无法对总体分布形态做简单假定,因此此处采用非参数检验的方法进行相关性探讨;同时,考虑到我们分析变量为多项分类型变量,因此考虑采用卡方检验的方式进行相关性检验,其目的是通过对样本的分析,推断其总体分布是否与理论分布相吻合,从而判断两个或多个变量之间的关联性。

其基本判断过程如下:

1)假设:H0,理论次数与实际次数相符,即是卡方值χ2为0;

显著水平确定:设定该犯错误概率(即显著水平)为0.05;

计算期望值:

根据样本,采用极大似然估计计算出两两变量的期望值,并通过双向表的形式列出,双向表内部表格直接列出。

检验计算:

计算出两类变量的自由度n,并计算自由度为n,显著水平为0.05条件下的临界卡方值;通过双向表列出样本的实际次数f0。

计算卡方值:

西游记中团队角色分析_成都专业数据分析团队_大数据团队组织架构

卡方值计算公式

并比较,计算卡方值与临界卡方值,如果卡方值小于临界值,则表明这两类变量具备统计学意义上的相关性。此时可进行进一步的规律分析。

2.2 企业发展阶段探索

本节讨论企业发展阶段与学历要求、工作经验和薪资待遇等因素间的相关性,并提炼出基本规律,以指导求职者。

2.2.1 学历要求探索1)相关性检验:

假设:H0:理论次数与实际次数相符,即是卡方值χ2为0;

显著水平确定:按照惯例,设定该犯错误概率(即显著水平)为0.05;

计算期望值:

期望值采用极大似然估计进行计算,最后达到如下期望值fe:

表1 不同类型企业学历需求期望值

检验计算:

本问题中企业的发展阶段分为三类,而工作经验分为四类,所以自由度为6;样本实际次数f0如下图所示:

表2 不同类型企业学历要求实际值

计算卡方值:

通过查表知道,自由度为6,显著水平为0.05的临界卡方值为12.59,显然计算卡方值小于临界卡方值,所以其公司发展阶段与工作经验具备统计学意义上的相关性。

2)学历要求规律分析

图7 学历要求需求量分布

图8 学历要求需求比例分布

由图7知,成长型企业招聘总人数是所以类型企业中最多,同时不同学历的需求量也是最大;由图8可知,1)不同发展阶段企业对本科学历和大专学历的要求均非常高;总占比超过90%;且随着企业的不断发展,对本科学历需求比例递增,大专学历需求比例递减;2)初创型企业和成长型企业对硕士及博士学位有一定需求,而成熟型企业需求极少;

2.2.2工作经验探索

通过卡方检验,企业发展阶段与薪资待遇具有统计学意义上的关联性。因此对其进行如下分析:

图9 工作经验需求量分布

图10 工作经验需求比例分布

由图9知,无论是对总人数的需求还是对不同经验人员的需求,成长型企业的需求量均是最多,初创型企业需求量其次;

由图10知:1)不同阶段企业对3-5年工作经验的需求比例最大,其次是1-3年工作经验,但是对两者的需求比例之和无差异,占比均为75%;2)成长型企业对3-5年工作经验人员需求比例很大,是1-3年工作经验需求比例的2倍,远超其他发展阶段企业;3)不同阶段企业对1年以下和5-10工作经验人员的需求比例相对稳定,并无大的差异。

2.2.3 薪资探索

通过卡方检验,企业发展阶段与薪资待遇具有统计学意义上的相关性。因此对其进行如下分析:

图11 薪资待遇的需求量分布图

图12 薪资待遇的需求比例分布图

由图11知,无论从总需求量还是从各个经验阶段的需求量看,呈现规律:成长型>初创型>成熟型。由图12可知,1)初创型企业对[10k,15k)范围内的需求比例最高,为其他各个范围需求量的1.7倍余;2)成长型企业对[5k,20k)范围人才的需求比例最大,且呈现规律:[10k,15k) > [15k,20k) >[5k,10k);3)成熟型企业对各个薪资待遇范围的人才需求相对均衡;4)横向对比来看,成长型企业对[20k,+∞)范围的高端人才和[0k,5k)入门级别人员的需求比例明显少于其他阶段企业。

2.2.4 结论

1)本科和大专学历可以应付绝大多数的职位需求;

2)对工作经验小于1年的求职者的需求比例超过12%,因此依然有机会;

3)无论是在求职市场上的需求总人数,还是对不同学历、工作经验和薪资情况的需求人数来说,招聘数量均呈现如下规律:成长型企业>初创型企业>成熟型企业,因此选择进入企业的优先级别如下:成长型企业>初创型企业>成熟型企业。

4)从稀缺表明价值越大的角度来看,企业对不同类型人才的需求比例越高,表明该类人才在该企业越稀缺,因而其发展空间也会相对更大。基于此,得到更进一步的择业建议:

a.本科学历更应该去成熟型企业,大专学历更应该去初创型企业,硕士及以上学历者应该选择初创或成长型企业。

b.对于3-5年工作经验人员,应优先选择成长性企业;对于1-3年工作经验优先选择初创型企业;其余工作经验人员按照3)中方法进行选择;

c.薪资要求在[10k,15k)和[20k,+∞)范围的求职者,应优先选择初创型企业,而薪资要求在[15k,20k)范围的求职者,应优先考虑成长型企业和成熟型企业,其余薪资要求求职者按照3)中方法进行选择;

2.3公司规模探索2.3.1 学历要求探索

通过卡方检验,公司规模与学历之间具备数学统计意义上的相关性。现对其进行进一步分析,结果如下图示:

图13 不同层次学历需求量

从图13知,1)企业规模在15-500人范围内时,随着规模的扩大,其招聘人数不断增加,其中本科学历人数增多明显,大专学历需求人数基本不变;2)150-500人规模的企业对硕士学历的需求大于其他规模企业,但是需求量依然很少;3)500人以上规模企业对人才需求较少。

西游记中团队角色分析_大数据团队组织架构_成都专业数据分析团队

图14 不同层次学历需求比例

从图14来看,1)随着公司规模的扩大,对本科学历的需求比例逐渐增加成都专业数据分析团队,对大专学历的需求比例逐渐降低,其中,500-2000人规模的企业,本科需求比例最高,超过85%,大专需求比例最低,仅为8.5%;2)除少于15人规模的企业外,其余规模企业对本科及大专学历的需求超过90%,而对硕士及以上学历的需求极少,为6%左右;2.3.2 工作经验探索

通过卡方检验,公司规模与工作经验具备统计学意义上的相关性。现对工作经验做如下分析:

图15 不同层次工作经验需求量

由图15可知,1)企业规模小于500人时,随着企业规模的增大,其人员总需求量及不同工作经验人员的需求量均不断增加,其中150-500人规模的企业对人才的需求最大;2)不同规模企业对3-5年工作经验的求职者需求最为旺盛,其次是1-3年工作经验的求职者;3)500人以上的企业对人才需求量相对较少。

图16 不同层次工作经验需求比例

由图16知,1)规模小于500人的企业,对5-10年及1年以下工作经验人员的需求比例相对稳定,为25%;而对1-5年范围工作经验人员需求比例维持在75%;2)规模小于500人的企业,随着规模的扩大,对3-5年工作经验需求比例不断增加,对1-3年工作经验需求比例不断降低,150-500人规模的企业对3-5年工作经验的需求比例是1-3年工作经验的2.5倍;3)500-2000人规模企业对1年以下工作经验的需求比例极少;4)2000人以上规模企业对大专学历的需求最少,而对5-10年工作经验人员的需求最高。2.3.3 薪资探索

通过卡方检验,公司发展规模与薪资待遇存在统计学意义上的相关性。进一步分析,得到如下结果:

图17 不同薪资的需求量

由图17知,1)15到500人规模的企业,随着企业规模的增大,对人才需求量也越大,而500人以上企业对人才的需求相对较小;2)各类企业对薪资待遇位于[5k, 20k)范围的职位需求量最大,而大于20k的高端人才,需求量相对较小;

图18 不同薪资的需求比例

由图18知,1)规模大于15人的企业,对薪资待遇位于[5k, 20k)范围的职位需求最大,占比接近80%;2)15-50人规模的企业对[10k, 15k)范围的需求旺盛,占比超过40%,超过其他薪资范围比例的2倍;3)各类企业对高端人才的需求比较稳定,其占比为15%~20%;4)人数少于15人的企业,虽然总的需求数量较少,对[10k, +∞)范围内的人才需求比较旺盛,其占比超过80%,为所有企业之最。

2.3.4 结论

1)无论是在求职市场上的需求总人数,还是对不同学历、工作经验和薪资情况的需求人数来说,招聘数量均呈现如下规律:150-500人企业>50-150人企业>15-50人企业>500-2000人企业>2000人以上企业,若不考虑其他因素的情况下,求职者在选择企业时,其选择的优先级别应按照上述顺序;

2)随着企业规模的增大,对本科学历的需求比例不断增大,并且在15-500人范围内,企业规模越大,需求人数越多,因此,本科学历求职者的最优选择是150-500人规模的企业。虽然15-50人和50-150规模企业对本科学历的需求人数远多于500人以上规模企业,但是由于企业规模较小,处于发展初期,其抗风险能力可能较差,此时的选择需要求职者自行平衡风险和发展前景;

3)企业规模越大,对大专学历求职者的需求人数并没有发生明显变化,其需求比例反而下降,因此,对于大专学历求职者而言,选择规模较小的企业进行历练可能是一个比较好的选择;

4)对3-5年工作经验的求职者来说,由于不同规模企业的需求量和需求比例均是最高的,考虑上企业的平台和抗风险能力,最优选择是150-500人规模企业;

5)对于1-3年工作经验求职者,虽然随着企业规模

试看结束,如继续查看请付费↓↓↓↓
打赏0.5元才能查看本内容,立即打赏

来源【首席数据官】,更多内容/合作请关注「辉声辉语」公众号,送10G营销资料!

版权声明:本文内容来源互联网整理,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 jkhui22@126.com举报,一经查实,本站将立刻删除。

相关推荐

二维码
评论