譯者 | 趙青窕
審校 | 梁策 孫淑娟
開始學習數據科學時,我以為找到一個對口工作就萬事大吉了。然而,工作了幾年之后,我開始意識到當初的想法實在是大錯特錯。
我認識不少數據科學家在入職后的幾個月內就離職了,而我本人,因為認為領導分配的任務與自己辛苦所學的技能毫無關系,在數據科學崗實習了一周后也遞上了辭呈。
在同我一樣在職業生涯早期就離職的業界人士交談后,我意識到數據科學領域員工流失率如此之高有以下兩個主因:
1. 個人期望與公司崗位期望不符
想象一下,你花了數千小時學習統計數據和不同機器學習算法,然后申請了幾十個不同的數據科學崗位,接著經歷了大量的面試,最終被一家中型公司錄用。
當你滿心歡喜地以為自己終于可以開始研究現實中的機器學習問題,想著多年所學終于可以付諸實踐,結果上班第一天就發現公司的系統中有大量未經處理的非結構化數據。
在領導心里,你就是“搞數據”的人,所以每天收集的大量數據你都要負責分析,以此來幫助他們提高業績。
最后你發現,自己的工作完全不像期望的那樣可以構建負責的算法和模型,而是將所有時間都花在“復習”SQL 和數據準備工作上,以把數據從系統中提取為不同的格式,并將這些數據呈現給領導,讓他們可以使用這些數據來做出相應的業務決策。
盡管崗位叫作“數據科學家”,但你卻沒有扮演自己想象中的角色。你不甘心只做公司里管數據的人,而是希望從事一個可以讓自己辛苦習得的技能有用武之地的項目。
最終,你只剩下兩個選擇?——?要么在公司待幾年并繼續執行不喜歡的任務,要么離職去找一個更符合個人發展目標的公司。
可能你并沒有碰到這樣的情況,但從我周圍的數據科學家那里了解到,這幾乎是他們最多的抱怨之一。 他們中的許多人對自己的工作范圍都有著不同的期望,但最終每天都是執行數據報告和分析的任務。
在這樣的公司待了一段時間后,因為多年未從事真正的機器學習項目,許多數據科學家最終喪失了之前掌握的機器學習技能。
在尋找另一份工作時,他們也無法申請中級或高級數據科學職位,因為自己已經不再具有所需的專業知識。這些人通常不得不轉換職業發展方向,繼續從事著數據或報告的分析工作。
2. 無法增加商業價值
大多數數據科學家不滿的另一個常見原因是無法通過他們的機器學習模型增加商業價值。
在我看來,這個問題比上一個問題更普遍,?因為目前具有明確定義的工作范圍和合適的數據管道(Data Pipeline)的組織也面臨著這個問題。
以下是數據科學家未能構建用來增加商業價值模型的幾個原因:
技術與商業之間存在鴻溝
利益相關者和高層管理人員也許不了解技術,也不能意識到什么情況可以引入機器學習模型。 此外,這個領域炒作的太厲害,作為一名數據科學家,你可能會從領導那里聽到一些比較有野心的需求。
數據科學家們這種情況下就需要就一個項目能否成功,能否帶來期望結果向領導解釋,從而確保其預期能與潛在的結果保持一致,這樣以后大家對結果都不會太失望。
在從事任何機器學習項目之前,最好先分析其預估成本和效益情況,這樣公司就可以集體決定針對該項目來分配時間和資源是否值得。
沒有提出正確的問題
作為一名數據科學家,你需要知道自己構建的模型是否會為業務增加價值。
我所見過的大多數數據科學家都會根據得到的指示快速地開始一個項目,可他們卻可能沒有提出正確的問題,也不會試圖去理解經理的思路。
當你僅僅是根據別人的安排而工作,那么你也不會清晰了解對自己可能會帶來什么價值,假如這時有人問你的工作價值何在,可能你也很難答出。
如果你一開始就不知道自己的產品為什么要做,你又怎能讓別人相信你的產品是可行的呢?
缺乏相應的知識
要正確提出問題,需要先了解業務運作模式。
你的模型構建應該針對特定領域,同時還需要了解它對最終用戶可能產生的影響。
例如,如果你正在為一家服裝公司構建模型,就必須要知道季節性等因素會影響你給客戶的建議。
我從事市場營銷工作,大部分專業知識都是通過直接與業務團隊合作獲得,此外還有一些來自在線課程,而當中很多是基于我與人們的日常互動以及對其行為方式的理解。
根據個人工作領域差異,花些時間來獲取特定行業知識是很明智的做法。這些知識在數據科學工作流程中的每一步都可能會用到,包括預處理、特征選擇、特征權重,以及在模型部署之后的微調等等。
那要怎樣才能成為一個對工作有熱情的數據科學家呢?
首先,選擇一家可以讓自己發揮所長的公司很重要,避開那些在職位描述中列出了很多工具的公司。在申請崗位之前,可以在招聘平臺上查一查,看看他們之前是否招聘過數據科學人員。
如果沒有,那我建議你遠離這類公司,因為這意味著所有與數據相關的工作都可能由你來做。
如果有,可以查查他們數據科學家的個人資料,看看他們為對該職位的描述是否符合你的期望。
其次,在面試中不要只是單方面被問,你需要盡可能多地向面試官詢問有關工作范圍和工作內容的問題。如果它與期望不符,最好繼續找找其他機會。
最后,花些時間來獲取從事領域的專業知識。利用這些知識向經理提出正確的問題,并確保他們的期望與潛在的項目成果保持一致。
譯者介紹
趙青窕,51CTO社區編輯,從事多年驅動開發。研究興趣包含安全OS和網絡安全領域,發表過網絡相關專利。
原文標題:??Why Are So Many Data Scientists Quitting Their Jobs???,作者:Natassha Selvaraj