成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

用爬蟲分析互聯網大數據行業薪資情況

大數據
隨著互聯網大數據行業的日漸興盛,越來越多的人投身其中,也有很多的朋友對此有著濃厚的興趣,想要投身其中。從本期開始我們將分四期帶大家走進互聯網大數據行業,分別了解數據挖掘&機器學習、數據分析、算法&深度學習、數據產品經理這四個不同的與大數據相關的職位。

前言:

隨著互聯網大數據行業的日漸興盛,越來越多的人投身其中,也有很多的朋友對此有著濃厚的興趣,想要投身其中。從本期開始我們將分四期帶大家走進互聯網大數據行業,分別了解數據挖掘&機器學習、數據分析、算法&深度學習、數據產品經理這四個不同的與大數據相關的職位。

數據來源:

我們未來四期的數據主要來源于拉勾網,目前比較火的招聘網站獵聘、boss直聘、拉勾都有比較多的互聯網職位介紹。我們基于以下幾點原因選擇拉勾:1.薪資大多有直接的范圍,較少為面議 2. 企業數量較全,基本上涵蓋了互聯網相關公司 3.url地址相對比較規整,方便進行批量爬取。數據展示頁面如下:

用爬蟲分析互聯網大數據行業薪資情況

該部分使用Python中Selenium爬取,部分代碼如下:

 

  1. while True 
  2. try:  
  3. for j in range(15):  
  4. xpath = '//*[@id="s_position_list"]/ul/li['+str(j+1)+']'  
  5. a = driver.find_element_by_xpath(xpath)  
  6. job_desc.append(a.text)  
  7. job_code.append(a.find_element_by_class_name('position_link' ).get_attribute('data-lg-tj-cid'))  
  8. js="var q=document.documentElement.scrollTop=10000"  
  9. driver.execute_script(js)  
  10. driver.find_element_by_class_name('pager_next').click()  
  11. except 
  12. break 

薪資情況:

我們將從多個角度去了解大家所關注的薪資情況,首先看一下各個城市的機會多少與平均月薪,如下圖(氣泡大小表示職位數量,柱形圖高度表示平均月薪):

用爬蟲分析互聯網大數據行業薪資情況

可以看到,排名第八的武漢職位數量已經是北京的四十分之一了,排名靠后的城市職位數量小于20個。這一定程度體現了數據挖掘&機器學習職位在北上廣深杭的集中性,除了五大城市之外,成都、南京、武漢未來也有著無限潛力。

下面看一下不同的工作經驗所對應的職位數量與薪資情況:

用爬蟲分析互聯網大數據行業薪資情況

可以看到拉勾網上大多的工作機會是針對于有工作經驗的求職者。3年、5年工作經驗也成為了兩個比較重要的門檻,薪資會有明顯的提示,這樣說明了企業對于經驗的看重

下面看一企業對于學歷的要求:

用爬蟲分析互聯網大數據行業薪資情況

需要注意的是,拉勾網上的學歷要求為最低要求,實際工作中大家的平均學歷會遠高于圖上所顯示的。

我們來結合城市和經驗看一下不同城市工作經驗的提升對薪資的提升幅度:

用爬蟲分析互聯網大數據行業薪資情況

北京在各個工作經驗層面的薪資均處于全國領先位置,這也表明了帝都互聯網中心的地位。在工作經驗5-10年的對比上,廣州的漲幅落后于其他幾大城市,有在廣州工作的朋友可以與我們分享下,這是否具有一定的現實性。

各大公司拉勾網提供平均月薪:

用爬蟲分析互聯網大數據行業薪資情況

我們選取了在拉勾網上提供職位最多的十五家公司,BAT&TMD均在其中,也包括了搜狗、微博、網易這些知名互聯網公司。出人意料的是提供職位薪資最高的是新浪微博,眾所周知,一個企業內的實際平均薪資情況十分復雜,上述數據也只是其在拉勾網上放出職位的情況,僅供參考。

以上圖表我們使用R語言ggplot繪制,代碼如下(以公司薪資圖為例):

  1. ggplot(company_com,aes(x=reorder(company,-salary),y=salary,fill=as.character(rep(1:5,each=3))))+ 
  2.   geom_bar(stat= 'identity' )+ 
  3.   geom_text(aes(label=round(salary,2),y= salary+1),size=5)+ 
  4.   theme_wsj()+ 
  5.   scale_fill_wsj()+ 
  6.   scale_color_wsj()+ 
  7.   ggtitle('各類公司拉勾網職位平均月薪(K)')+ 
  8.   theme(axis.text.x = element_text(size=12), 
  9.         axis.text.y = element_blank(), 
  10.         plot.title = element_text(hjust=0.5,size=25), 
  11.         legend.position='none'
  12.         panel.grid = element_blank(), 
  13.         axis.title  = element_blank(), 
  14.         axis.text = element_text(face='bold',hjus=0.8,size=10,angle=15
  15.   ) 

期望月薪計算:

我們用線性回歸模型,簡易地幫助大家計算一下所可以期待的薪資情況(數據為月薪,單位為K),我們僅選取了經驗、城市、學歷三個因素,并沒有考慮交互項、高次項等因素,結果僅供參考,實際情況要復雜很多:

用爬蟲分析互聯網大數據行業薪資情況

所需技能&福利:

想要得到不錯的年薪,除了上述一些硬件條件,個人所掌握的實際技能實際上會起到更加重要的作用,我們就來看一下入職數據挖掘&機器學習所需掌握的技能:

用爬蟲分析互聯網大數據行業薪資情況

順利入職之后,我們又可以得到什么樣的福利呢,可以看一下下圖:

用爬蟲分析互聯網大數據行業薪資情況

我們可以看到除了傳統的福利,技術氛圍好、大牛云集、海量數據也成為了數據挖掘&機器學習職位用來吸引求職者的重要籌碼。

最后祝愿目前已經從事和有志于從事數據挖掘工作的同學都能有一份滿意的工作。

作者介紹:徐麟,目前就職于上海唯品會產品技術中心,哥大統計數據狗,從事數據挖掘&分析工作,喜歡用R&Python玩一些不一樣的數據

責任編輯:未麗燕 來源: 數據森麟
相關推薦

2018-10-31 11:06:48

2022-01-05 16:45:22

互聯網裁員危機

2021-11-22 10:03:47

互聯網薪資技術

2013-08-19 14:50:53

互聯網大會AdTime大數據

2019-10-15 15:30:03

互聯網大數據物聯網

2015-07-27 14:34:35

互聯網大會互聯網行業

2015-08-06 13:34:47

互聯網大會互聯網行業

2017-03-14 10:30:58

智慧交通互聯網

2015-10-29 10:06:11

CIO時代網

2021-09-27 15:16:56

大數據互聯網人工智能

2018-03-26 10:19:09

互聯網大數據網絡

2017-06-04 14:18:06

社???/a>大數據互聯網

2015-08-20 09:10:26

物聯網大數據

2013-08-02 09:26:25

大數據時代云加速服務

2019-12-09 16:09:00

互聯網

2015-03-04 09:30:02

2021-12-23 15:21:15

互聯網大佬隱退

2011-09-05 13:59:15

中國網民互聯網

2021-12-16 10:32:04

APP會員互聯網大廠用戶

2015-12-17 11:27:28

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产精品激情小视频 | 成年人在线电影 | 99综合在线 | 国产成人综合亚洲欧美94在线 | 国产1页 | 天天插天天操 | 欧美影院久久 | 亚洲在线视频 | 国产成人精品午夜视频免费 | 欧美一级免费看 | 免费成人av | 亚洲精品成人免费 | 一级做a爰片性色毛片16美国 | 国产精品久久久久久久久污网站 | 久久网站黄 | 国产亚洲欧美日韩精品一区二区三区 | 一区二区三区四区在线视频 | wwwxxx日本在线观看 | 欧美精品在线观看 | 紧缚调教一区二区三区视频 | 久久黄色网 | 日韩一级黄色毛片 | 日韩中文字幕久久 | 网色| 国产精品成人久久久久 | 国产精品99久久久久久动医院 | 日韩欧美网 | 日韩国产精品一区二区三区 | 日韩精品视频在线 | 西西裸体做爰视频 | 中文字幕av免费 | 午夜成人免费视频 | 欧美a在线 | 亚洲视频二区 | 91亚洲免费 | 成人欧美一区二区三区黑人孕妇 | 中文字幕日韩一区 | 美女国内精品自产拍在线播放 | 日韩在线视频一区二区三区 | 色资源在线 | 国产亚洲精品综合一区 |