KDnuggets:未來4至10年內對數據科學家的需求將開始減少
根據近1200份投票的統計結果顯示,KDnuggets的讀者認為對數據科學家/機器學習專家的需求將在未來4至10年內開始減少。最常見的一種回答是4-6年,中值是8-9年。
KDnuggets問卷:對數據科學家/機器學習專家的需求何時會開始衰減?
這是一張很重要也很有意思的圖表,看完之后我的想法如下……
注意:需求下降的起始點緊隨著需求高峰,所以我們需要交換著使用這兩個術語。
在2012年被譽為“21世紀最性感的工作”之后,市場對于數據科學家的需求開始迅速增長。這一需求的填補體現在兩個方面:
教育:很多大學及其他教育平臺(例如Coursera,、edX和Udemy)開始增加提供數據科學與機器語言的教育。
自動化:如同DataRobot這樣的公司提供“自動化數據科學/機器學習”的平臺一樣,這些平臺可以讓商業用戶自己去建模,或者在某一商業流程中嵌入模型來完全自動化數據科學(比如自動化的廣告競價)。
但目前的需求下面卻潛藏著一個巨大的泡沫,這個泡沫很可能在未來的某一個時間點破裂,隨后需求開始迅速下降。而且如同其它的泡沫一樣,這個泡沫同樣難以預測。所以需求高峰期(需求開始下降的點)出現在未來4-9年,是一個很合理的假設。但是,這并不意味著數據科學家會失業,這只是讓這種工作變得常規化,使薪資水平變得平穩下來,如同互聯網發展初期,網頁開發者是一個炙手可熱的工作,現在卻成了一個稀疏平常的工作了。
問卷也調查了受訪者在數據科學和機器學習方面的相關經驗,以及他們所屬的社會群體(產業界/學生/科研/政府/其他)。
從圖中我們可以看到:60%的受訪者有2年以內的相關經歷,62%的被調查者來自產業界,19.5%是學生,9.2%是科研人員,4.5%來自政府及公益組織。
在檢驗高峰需求的預測與受訪者經驗、所屬社會群體的關系時,我得到了驚人的相似曲線。一個高峰期是在未來4-6年和7-10年,另一個小一些的高峰出現在25年及以后。為了簡單理解這個圖表,我將曲線分組為“小于1年經驗”,“1-2年的經驗”和“2-4年的經驗”,無論哪種情況,這些曲線看起來都非常相似。
對數據科學家/機器學習的高峰需求vs.受訪者在數據科學/機器學習領域的相關經驗
讓我們把那些“預測對數據科學家的需求在25年后開始衰減”的人稱為樂觀主義者,而將另一部分人歸類為悲觀主義者吧!
我們發現,經驗最多的(16年以上)這一群體占據了樂觀主義者的絕大多數,而且這一群體有超過35%的人認為需求在25年之后才會逐漸減緩。
接下來,讓我們看看預測高峰需求曲線與受訪者所屬社會群體的關系。

數據科學家/機器學習專家的高峰需求預測vs社會群體
再一次,我們出乎意料地發現:這些曲線都很相似。
其中,學生是所有群體里最樂觀的,政府工作人員是最悲觀的,產業界人士居于其中。
最后,我們看一下不同區域的分布。各地區參與者包括:
- US/Canada, 40%
- Europe, 33%
- Asia, 16%
- other, 11%
- 美國/加拿大 40%
- 歐洲 33%
- 亞洲 16%
- 其他 11%

對數據科學家/機器學習專家的高峰需求vs地域
這一次,我們又雙叒叕發現曲線依然十分相似。而一個顯著的差異是:美國/加拿大的受訪者相比其他區域的受訪者更樂觀,他們最多的選擇是認為需求將在未來7-10年內飽和,而其他區域則認為是4-6年。在所有區域里面,認為25年甚至更久的受訪者百分比為(18.3%-19.8%),這也是讓人難以置信的相似。
如何解釋這樣及其相似的分布?
有一種假設是,樂觀主義或者悲觀主義是天生的,這會影響到他們做預測的結果。所以當我們想對“社會趨勢”做預測的時候,由于這種主題的問題不能通過物理事實測量,更多的只是取決于人們的想法和直覺。所以問卷設計應該以某種方法來檢測樂觀主義或者悲觀主義特質。
如果這個結論是真的,那么我們可以認為:樂觀主義的百分比在各個不同的區域、社會群體的群組里面是相似的,而且這個相似不會隨著經驗發生變化。