如何成為一名數據科學家?
如果人們對數據科學的職業感興趣,那么需要了解數據科學家的薪酬、熱門的就業市場、技術培訓等方面的有關信息。
如今,企業對數據科學家的需求量很大。數據科學家在Glassdoor公司發布的美國工作排行榜連續4年名列榜首,并且表示擁有適當技能的數據科學家薪酬很高。2012年,《哈佛商業評論》表示數據科學家是“21世紀好工作”之一。
Glassdoor公司社區專家表示:“對數據科學家的需求旺盛的一個重要原因是,很多企業都致力成為一家科技公司。在必須處理數字化數據、擁有應用程序或在線狀態的行業中,都需要能夠幫助支持所有這些數據并從數據中找到見解的人員。”
然而,現在面臨數據科學人才短缺的情況:據IBM公司預測,到2020年,美國所有精通數據的人士的每年職位空缺數量將增加到270萬個。人才招募機構LinkedIn公司的數據顯示,截至2019年1月,具有數據科學技能的人在美國的平均年薪為130,000美元,比上一年增加56%。
為了幫助那些對數據科學領域感興趣的人員更好地了解如何進入數據科學的職業生涯,在此創建了一個包含最重要細節和資源的指南。
執行摘要
- 為什么對數據科學家的需求日益增加?很多公司現在都有能力收集數據,并且數據量越來越大。這導致對具有特定技能的員工的更高需求,他們可以有效地組織和分析這些數據,以收集業務見解。
- 數據科學家的工作角色有哪些?核心數據科學家、研究人員和大數據專家是數據科學領域的好職位。
- 成為數據科學家需要哪些技能?Glassdoor公司表示,掌握Python、R、SQL語言是數據科學工作列表中的三大技能。Glassdoor公司指出,每10個數據科學職位發布中就有9個需要掌握至少一種語言。
- 哪些行業擁有數據科學家最熱門的市場?預計數據科學家的需求將在未來幾年增長。據IBM公司稱,目前約有59%的數據科學和分析工作需求來自金融和保險、專業服務和IT行業。
- 數據科學家的平均薪酬是多少?據LinkedIn公司稱,截至2019年1月,美國的數據科學家平均年薪為130,000美元。Glassdoor公司的調查表明,其平均年薪為108,000美元。其薪酬因地而異,舊金山、圣何塞、西雅圖和紐約市的數據科學家薪酬很高。
- 數據科學工作的典型面試問題是什么?其問題可能包括讓面試人員了解應聘者曾經做過的項目,描述其與團隊合作的經歷,以及與領導溝通的情況,并完成面試人員進行的測試。
- 在哪里可以找到數據科學職業的資源?美國數據科學協會、運籌學和管理科學研究所以及國際分析研究所是這樣的國家組織和國際組織,行業人士可以在那里查找有關該專業的信息以及認證和培訓選項。許多提供商都提供許多編程語言的在線課程,如Python、R和SQL。
為什么對數據科學家的需求增加?
隨著很多公司在某種程度上成為一家科技公司,對能夠分析數據和收集業務洞察力的熟練人員的需求也在增加。
“隨著企業數據規模越來越大,對具有特定技能的員工的需求也越來越高,他們可以有效地組織和分析這些數據。”Glassdoor公司經濟研究員Pablo Ruiz Junco表示,“與此同時,擁有這些技能的人數與需求相比仍然相對較低,從而導致更高的薪酬。”
塔夫茨大學研究生工程學院的IEEE研究員、院長Karen Panetta表示,技術進步和大量可用的在線數據影響著每個行業和部門,并對經濟產生了巨大的影響。這種所謂的“數據雪崩”不僅涉及龐大的數據量,還涉及其變化和增長的速度,以及可用的各種數據類型。
Panetta 表示,“在新興的大數據革命里,了解如何使用電子表格和傳統數據庫還不夠。分析需要實時完成,決策可能至關重要。了解如何使用軟件工具只是這一挑戰的一部分。了解跨學科的數據,能夠傳達其意義,以及使用統計數據將是傳統數字處理器的差異化因素。”
數據科學家的工作角色是什么?
一般來說,數據科學家挖掘采購數據,并根據特定的公司利益對其進行分析,然后與市場部門合作以利用這些知識。這些工作人員必須熟悉數據收集軟件、編程和倉儲技術。
根據Glassdoor公司的研究,數據科學工作分為三個主要角色:核心數據科學家、研究人員、大數據專家。
核心數據科學家占到這些工作職位的71%,并且具有Python、R和SQL等方面的技能。這些人士在美國的平均年薪估計為116203美元。研究人員聲稱有15%的空缺職位,并且可能具備SAS、Matlab、Java、Hadoop、Python和R的技能。研究人員的平均年薪是112346美元。Glassdoor公司的調查發現,大數據專家占據了剩下14%的數據科學工作崗位,并掌握SARK、Hadoop、Java、Python等技能,他們的平均年薪估計為121246美元。
據IBM公司介紹,在這些職位中,包括數據工程師之類的人員,他們需要諸如Apache Hadoop、Java和Python之類的技能,以及財務和風險分析經理,他們使用諸如風險管理、財務分析、規劃和SQL等技能。
成為一名數據科學家需要哪些技能?
根據2019年4月的一份主要報告,以下是數據科學職位招聘中最常提到的五項技能:
- 機器學習
- Python
- R
- SQL
- Hadoop
Glassdoor公司2017年發布的調查報告發現,職位招聘中的前10項技能是Python、R、SQL、Hadoop、Java、SAS、Spice、Matlab、HiVe和TabLeAU。Glassdoor公司的調查發現,樣本中每10個職位發布中就有9個至少需要Python、R和/或SQL技能。根據該報告,這些技能密切相關,這使得它們成為每個數據科學求職者應該學習的必需技能。
“如果想進入數據科學領域,并建立一個堅實的經驗基礎,在未來的雇主眼中,應聘者需要三種核心技能:Python,R和SQL。”Glassdoor公司經濟研究員Pablo Ruiz Junco表示。有了這些技能,應聘者將有資格申請超過70%的數據科學家職位。另外,將這些技能擴展到這些基礎語言之外,可以使應聘者獲得更高的薪水,并允許其投入更廣泛的網絡申請。
根據Kaggle公司的一份報告,大約32%的全職數據科學家通過大規模開放在線課程(MOOC)開始學習機器學習或數據科學,而27%的人表示他們開始自己學習所需的技能。 30%的受訪者表示,他們在大學開始從事數據科學的學習和研究。
哪些行業擁有數據科學家最熱門的市場?
IBM公司在2017年5月預測,到2020年,美國所有精通數據的人士的每年職位空缺數量將增加到270萬個。大約59%的數據科學和分析工作需求來自金融和保險、專業服務和IT行業。到2020年,對快速增長的數據科學家、數據開發人員和數據工程師新角色的需求將達到近70萬個。
據Prime公司主管Shu Wu表示,對具有數據科學技能的開發人員的需求目前在企業中非常強勁, 在過去四年中,數據科學家的職位空缺出現大幅增長。
Shu Wu表示,“雖然未來幾年數據科學家的工作前景依然強勁,而且這些人員可以獲得高薪,競爭也很激烈。可以使整個組織都能理解數據專家是偉大的。”
數據科學家的平均年薪是多少?
美國數據科學家的平均年薪略有不同,具體取決于其工作地點。LinkedIn公司調查的平均年薪為130,000美元,Glassdoor公司調查的平均年薪為108,000美元。
根據Indeed公司的數據,舊金山的數據科學家年薪很高,平均年薪為166,519美元,其次是圣何塞(153,535美元)、西雅圖(146,088美元)和紐約市(146,067美元)。
如上所述,由于核心數據科學家、研究人員和大數據專家之間的薪酬差異,個別數據科學家提出的技能可能會對薪酬產生很大影響。求職者應該考慮他們最感興趣的角色,并對哪些技能值得花時間學習進行成本效益分析。
數據科學職業的典型面試問題是什么?
“為了評估應聘者是否能夠成為一名數據科學家,可以通過這些進行衡量:基礎知識、創造性和科學地思考現實世界問題的能力,關于高技術主題的特殊溝通,以及不斷的好奇心。”Umbel公司高級工程總監Kevin Safford說。
根據Forrester公司分析師Kjell Carlsson的說法,一名初級數據科學家可以在求職面試中遇到以下問題:
介紹一下所完成的最為自豪的項目,在哪里使用數據/數據科學/機器學習/高級分析。應聘者在這個項目中的角色是什么?在每個步驟中都做了什么?
- 應聘者參加的項目(在此處采用的語言或技能,例如Python、R)。
- 應聘者與數據科學項目不精通數據的人合作的時間。
- 應聘者解釋數據科學,例如數據科學主題、交叉驗證、無監督學習等。
- 應聘者處理非常混亂的數據的時間。
- 應聘者在原有團隊中工作的經歷。
- 應聘者快速成為新技術專家的時間。
應聘者可能會根據團隊開展的數據科學項目進行小型案例研究,其問題包括:需要哪些數據?想測試哪些假設?將使用什么技術來評估它們?
Carlsson說,面試還可能包括一個練習,在這個練習中,應聘者會得到一組數據和一個廣泛的問題,并被要求陳述他們的調查結果。
根據Empowered Staffing公司招聘副總裁Daniel Miller的說法,對于更高級的職位,這些問題可能會出現:
- 應聘者是否從頭開始構建數據倉庫?如果是這樣,為成功實施數據倉庫而創建的流程(如果從頭開始沒有參與其中,可以詢問應聘者是否是處理公司合并或數據采集的部門的一員,以及是如何處理的)。
- 應聘者構建了哪些類型的定制儀表盤,以及通過儀表盤提供了哪些信息/分析?
- 應聘者完成的最復雜的數據項目,以及其為實現成功所能做的事情。
- 應聘者如何向執行和高級領導解釋和呈現數據?
在哪里可以找到數據科學職業的資源?
美國數據科學協會、運籌學和管理科學研究所,以及國際分析研究所是國家組織和國際組織,人們可以在那里尋求有關該專業的信息以及認證和培訓選項。
一些教育機構創建了數據科學學位課程,其中包括加州大學伯克利分校、西北大學、卡內基梅隆大學和肯尼索州立大學。其中一些學校提供在線課程。
人員可以從許多提供商處找到許多在線編程課程,例如Python、R和SQL中的課程。IEEE計算機學會也提供課程和研討會。
此外,還提供了一些數據科學方面的認證。其中包括供應商中立的認證分析專家(CAP)、Dell EMC認證專家認證計劃、Microsoft認證解決方案專家(MCSE)和SAS數據科學認證。