如何成為數據科學家? 數據科學家的職責技能要求和薪水構成
如何成為一名數據學家?不僅取決于你的技能和經驗,還有教育和培訓,都是你成為數據學家的過程中的重要因素。如果全部具備,那么你的數據科學事業將會變得更加順利。

什么是數據科學家?
Data scientists are responsible for discovering insights from massive amounts of structured and unstructured data to help shape or meet specific business needs and goals. The data scientist role is becoming increasingly important as businesses rely more heavily on data analytics to drive decision-making and lean on automation and machine learning as core components of their IT strategies.
數據科學家的目標
通常使用專門設計的軟件來組織和分析大量的數據。數據科學家分析的最終結果應該讓投資者能夠輕易的理解,最好通俗易懂, 尤其是對于非專業人士。
數據科學家所運營的數據分析方法一般取決于他們的具體需求。在數據科學家從數據中發現個性化之前,業務負責人必須告訴他們需要什么。因此,數據科學家必須具備足夠的專業知識才能將目標轉化為可交付的數據成果,如預測引擎,模式檢測分析,優化算法等。
數據科學家的職責
數據科學家的主要職責是數據分析,這是一個從數據收集開始,到以最終數據分析結果為基礎做出業務決策的流程。
數據科學家分析的數據,通常稱為大數據。有兩類數據屬于大數據:結構化數據和非結構化數據。結構化數據通常按照類別進行組織,使計算機可以輕松進行排序,自動閱讀和組織。這包括由服務,產品和電子設備收集的數據,但很少從人類輸入收集數據。通過智能手機收集的網站流量數據,銷售數據,銀行賬戶或GPS坐標 - 這些都是結構化的數據形式。
非結構化數據是大數據增長最快的形式,一般來源于客戶評論,電子郵件,視頻,社交媒體帖子等。這些數據通常難以通過技術進行分類。由于沒有簡化,非結構化數據可能需要大量人力來管理。一般是依靠關鍵字來理解非結構化數據,以此作為使用可搜索條件提取相關數據的一種方式。
通常情況下,企業需要數據科學家來處理這些非結構化數據,而其他人員將負責管理和維護結構化數據。所以數據科學家可能會在他們的職業生涯中處理大量結構化數據,但企業越來越希望利用非結構化數據來服務他的利潤目標。
數據科學家的薪水
數據科學是一個快速增長和利潤豐厚的行業,BLS預測到這個行業職位將在2024年前增長11%。數據科學家目前正是一個熱門的職業。在Glassdoor的美國50年最佳職位報告中,數據科學家的職位空缺,薪水和總體滿意度評級,在各行業中均名列前茅。
根據Robert Half's 2018年技術與IT薪資指南的數據,數據科學家根據經驗得出的平均薪水分解如下:
- 25th percentile: $100,000
- 50th percentile: $119,000
- 75th percentile: $142,750
- 95th percentile: $168,000
數據科學家的要求
每個行業都有自己的大數據資料供數據科學家分析。根據BLS,以下是每個行業中更常見的大數據形式,以及數據科學家可能需要執行的分析類型。
- 業務:今天,數據驅動業務幾乎成為每家公司的戰略 - 但企業需要數據科學家來理解信息。業務數據的數據分析可以提供更高效率,更合理庫存,更少生產錯誤以及登高的客戶忠誠度等方面的決策信息。
- 電子商務:網站收集的不僅僅是購買數據,數據科學家還可以幫助電子商務企業改善客戶服務,發現趨勢從而開發更合理的服務或產品。
- 金融:在金融行業,關于賬戶、信用、借記交易以及類似財務數據的數據,對于正常運營的業務至關重要。但對于這一領域的數據科學家來說,包括欺詐檢測在內的安全性和規范性也是主要關注點。
- 政府:大數據有助于政府制定決策,支持三方成員并監督總體滿意度。像金融部門一樣,安全和規范是數據科學家最關心的問題。
- 科學:科學家一直處理數據,但通過現在的技術,他們可以更好地收集、分享和分析實驗中的數據。這一過程中數據學家可以發揮他們優勢。
- 社交網絡:社交網絡數據能夠幫助推送更加智能化和針對性的廣告,提高客戶滿意度。對帖子,推文,博客和其他社交媒體進行持續的數據分析可以幫助企業不斷改進服務。
- 醫療保?。弘娮俞t療記錄現在成為醫療機構的標準,這些都是大數據對于安全性和規范化的奉獻。在這里,數據科學家可以幫助改善醫療服務,并發現可能不被注意到的趨勢。
- 電信:所有電子收集數據需要被存儲,管理,維護和分析。數據科學家通過提供他們想要的功能,幫助公司打擊錯誤,改進產品并讓客戶滿意。
- 其他:沒有一個行業能夠抵御大數據的驅動,BLS指出你會在各個行業找到工作,例如政治,公用事業,智能家電等等。
數據科學家的技能
根據Quora數據科學經理William Chen的說法,數據科學家的五大技能包括硬和軟技能的混合:
- 程序設計:Chen將此引用為“數據科學家技能集合的最基本”,并指出它為數據科學技能增添了價值。編程提高了你的統計技能,幫助你“分析大型數據集”,并使你能夠創建自己的工具。
- 定量分析:分析大型數據集的一項重要技能,定量分析將提高你運行實驗分析的能力,擴展你的數據策略并幫助你實現機器學習。
- 產品直覺:理解產品將有助于你進行定量分析,它還將幫助你預測系統行為,建立指標并提高調試技能。
- 溝通:可能是所有行業中最重要的軟技能,強大的溝通技巧將幫助你“充分利用以前列出的所有技能”。
- 團隊合作:就像溝通一樣,團隊合作對于成功的數據科學事業至關重要。它需要無私,接受反饋并與團隊分享你的知識。
如何成為數據科學家
如果你沒有計算機科學或數據分析方面的背景,那么新手訓練營,學位課程或認證可以提供轉換為數據科學家所需的技能。
你需要弄清楚你想要的行業和職位要求是否需要高等教育學位,或者認證和培訓是否能夠滿足應聘的要求。花一些時間研究職位要求,找到你想要的職位的共同點。從那里,你可以制定一個策略,成為一名具備教育,技能和經驗的數據科學家來獲得這份工作。
數據科學家的教育和培訓
成為數據科學家有很多方法,但最傳統的途徑是獲得學士學位。根據BLS的數據,大多數數據科學家擁有碩士學位或更高的學位,但對于每位數據科學家來說并非如此,還有其他方法可以開發數據科學技能。在你進入高等教育課程之前,你需要知道你將從事什么行業以找出最重要的技能,工具和軟件。
由于數據科學需要一些業務領域的專業知識,數據科學家的角色將因行業而異,如果你在高技術行業工作,則可能需要進一步培訓。例如,如果你在醫療保健,政府或科學領域工作,你需要與從事市場營銷,商業或教育工作相關的技能。
如果你想培養某些技能以滿足特定的行業需求,那么可以參加在線課程,新手訓練營和專業發展課程,以幫助磨練你的技能。
數據科學認證
除了新手訓練營和專業發展課程外,還有大量有價值的大數據認證和數據科學認證可以提升你的簡歷和薪水。
一些流行的數據科學認證包括以下內容:
- 認證分析專家(CAP) - 上限計劃
- 預測分析認證專家(CSPA) - 中科院研究院
- Cloudera認證專家:CCP數據工程師 - Cloudera
- 數據科學證書 - 哈佛擴展學院
- DASCA數據科學證書 - 美國數據科學委員會
- IAPA分析憑證 - IAPA
- SAS數據科學學院 - SAS學院
- SAS認證的大數據專家/數據科學家 - SAS研究所
- Simplilearn數據科學認證培訓 - Simplilearn
- Teradata Aster Analytics認證 - Teradata
要深入了解有價值的認證,請參閱我們的數據科學認證和大數據和數據分析認證指南。
數據科學學位課程
如果你想走傳統的學位路線,那么在數據科學方面有很多碩士課程可供選擇。即使沒有科學相關的本科學位,你仍然可以申請數據科學碩士課程,但它可能需要額外的學分,考試或計算機科學經驗。
根據美國新聞和世界報道,這些是數據科學領域的頂尖研究生學位課程:
- 統計學碩士:斯坦福大學數據科學
- 信息與數據科學碩士:伯克利信息學院
- 計算數據科學碩士:卡內基梅隆大學
- 數據科學碩士:哈佛大學John A. Paulson工程與應用科學學院
- 數據科學碩士:華盛頓大學
- 數據科學碩士:約翰霍普金斯大學懷廷工程學院
- 分析碩士:芝加哥大學格雷厄姆學院
其他數據科學工作
數據科學家只是數據科學領域中的一個職位,并不是每個使用數據科學的公司都在為數據科學家本身招聘。根據PayScale的數據,以下是一些與數據科學相關的最受歡迎的職位以及每個職位的平均薪水:
- 分析經理 - $ 92,249
- 商業智能分析師 - 66,003美元
- 數據分析師 - 57,768美元
- 數據架構師 - 112,790美元
- 數據工程師 - $ 90,811
- 研究分析師 - 52970美元
- 研究科學家 - 77,330美元
- 統計員 - 71,374美元
如果你正在尋找建立數據科學的職業,這些職位你可能也想考慮。數據分析是一個廣闊的領域,所以在開始申請工作之前,你需要弄清楚你的特點。一旦你知道你想如何處理數據,就可以更容易地縮小與你的技能相匹配的最佳職位空缺。