職業(yè)生涯十字路口:數(shù)據(jù)科學(xué)崗位眾多,到底哪種適合你?
本文轉(zhuǎn)載自公眾號(hào)“讀芯術(shù)”(ID:AI_Discovery)。
2012年,《哈佛商業(yè)評(píng)論》將數(shù)據(jù)科學(xué)稱為“21世紀(jì)最性感的工作”,現(xiàn)在已經(jīng)過去了近十年,這個(gè)領(lǐng)域仍然沒有失去它的魅力。互聯(lián)網(wǎng)上成千上萬的視頻和文章,為數(shù)據(jù)科學(xué)領(lǐng)域描繪了一幅美麗的圖景。這些文章和視頻告訴人們,這一行業(yè)將提供豐厚的薪水和靈活的工作時(shí)間。
他們說:“你所要做的就是學(xué)習(xí)技能A、B、C,報(bào)名參加一個(gè)訓(xùn)練營,再參加幾個(gè)在線課程,就可以在數(shù)據(jù)科學(xué)領(lǐng)域找到工作了。“
由于這樣的宣傳,許多人對(duì)這個(gè)領(lǐng)域的真正本質(zhì)產(chǎn)生了不切實(shí)際的期望。在缺乏相應(yīng)研究的情況下,他們最終做出了一個(gè)可能永遠(yuǎn)改變他們生活的職業(yè)決定。
本文的目的并不是要詆毀數(shù)據(jù)科學(xué)領(lǐng)域,我不想阻止任何人在這個(gè)領(lǐng)域追求事業(yè)。我個(gè)人認(rèn)為,只要投入適當(dāng)?shù)墓ぷ髁亢凸ぷ鲿r(shí)間,任何人都可以成為數(shù)據(jù)科學(xué)家。然而,人們需要享受正在從事的工作。如果在不了解自己要從事行業(yè)的情況下倉促跳槽,人可能會(huì)浪費(fèi)生命中的數(shù)年時(shí)間去做不喜歡的事情。
一個(gè)有創(chuàng)造力,有藝術(shù)天賦的人,那這個(gè)人會(huì)選擇文科還是理科呢?我猜應(yīng)該會(huì)選擇藝術(shù)專業(yè),因?yàn)檫@才是他更有興趣的方向。
當(dāng)面臨這個(gè)選擇的時(shí)候,我選擇了從事數(shù)據(jù)科學(xué)。然而因?yàn)檫^量關(guān)于數(shù)據(jù)科學(xué)的炒作,我?guī)缀醪恢肋@領(lǐng)域真正需要什么。和數(shù)據(jù)科學(xué)課上的所有學(xué)生一樣,在選擇專業(yè)之前我?guī)缀鯖]有做過需要的研究。
但我很幸運(yùn),對(duì)我來說這個(gè)決定很棒。我恰巧很喜歡盲選的數(shù)據(jù)科學(xué)。但是人與人之間不盡相同,與我同班的很多學(xué)生后悔他們的決定,想要換專業(yè)。正如上方提到的,所有的一切都可以歸結(jié)為一件事,是否對(duì)所做的事情充滿激情。
在本文中,筆者將詳細(xì)介紹數(shù)據(jù)科學(xué)領(lǐng)域。筆者將解釋數(shù)據(jù)科學(xué)中可以選擇的不同職業(yè)道路,并且描述不同道路需要做些什么。如果讀者覺得這些職業(yè)道路具有吸引力,那么無論職業(yè)或教育背景如何,都可以去追求數(shù)據(jù)科學(xué)。
數(shù)據(jù)科學(xué)中的各種職業(yè)
“數(shù)據(jù)科學(xué)家”是一個(gè)涵蓋性術(shù)語,用于描述各種不同的職業(yè)。這些職業(yè)可以互換,并且可能根據(jù)所在的組織有所不同。本文只是對(duì)一些數(shù)據(jù)科學(xué)中的常見職業(yè)的簡要概述。
1. 數(shù)據(jù)工程師
不知道你之前有沒有聽過一句話,“真實(shí)世界的數(shù)據(jù)是混亂的。”這些數(shù)據(jù)來自于各種不同的渠道——如手機(jī)、閉路電視以及其他的設(shè)備。這些真實(shí)的數(shù)據(jù)是非結(jié)構(gòu)化的,需要被清理、流水線化,并以一種結(jié)構(gòu)化的格式儲(chǔ)存,方便數(shù)據(jù)科學(xué)家和分析人員進(jìn)行處理。做數(shù)據(jù)工程師并不需要機(jī)器學(xué)習(xí)或數(shù)據(jù)分析的知識(shí),他們的工作是創(chuàng)建一個(gè)管理大數(shù)據(jù)的基礎(chǔ)設(shè)施。
所需技能:數(shù)據(jù)工程師通常需要編寫非常復(fù)雜的查詢語句對(duì)大型數(shù)據(jù)集進(jìn)行管理。因此需要非常了解查詢所需的語言。根據(jù)合作的公司不同,可以使用SQL或NoSQL語言。
所需工具:MySQL,MongoDB,Cassandra等。
圖源:unsplash
2. 數(shù)據(jù)分析
數(shù)據(jù)分析師是從數(shù)據(jù)工程師所清理過的數(shù)據(jù)中洞察出信息的人。分析人員在數(shù)據(jù)中尋找模式值與異常值,并得出規(guī)律,回答復(fù)雜的數(shù)據(jù)問題。
請(qǐng)想象這樣一個(gè)情境——A公司賣糖果,想得知禁售前后糖果的銷量是否發(fā)生變化。數(shù)據(jù)分析師根據(jù)公司需求,將查詢數(shù)據(jù),查看禁售前、禁售期間、禁售后的糖果銷售趨勢(shì)。為了更好地展示數(shù)據(jù),分析師還可以采用可視化的方法——統(tǒng)計(jì)圖和統(tǒng)計(jì)表來表達(dá)糖果銷售的增長與下降。
這只是一個(gè)非常基本的例子,但是足以描述公司中數(shù)據(jù)分析師的職業(yè)。數(shù)據(jù)分析師可能還需要具備一些業(yè)務(wù)領(lǐng)域的知識(shí),以便于理解客戶的請(qǐng)求并根據(jù)他們的需求交付結(jié)果。分析師不需要具備機(jī)器學(xué)習(xí)的知識(shí),也不需要?jiǎng)?chuàng)建任何類型的預(yù)測(cè)模型。
所需技能:分析師需要了解一種查詢語言,這將根據(jù)公司的不同而不同。掌握一種或多種編程語言至關(guān)重要。分析師的主要任務(wù)是從數(shù)據(jù)中洞察出信息,因此沒有必要對(duì)數(shù)據(jù)創(chuàng)建表或?qū)懭氡怼S锌梢暬ぞ叩闹R(shí)將會(huì)非常有用。
所需工具:MySQL,Hive, Python, Tableau, Excel, PowerBI(根據(jù)工作的公司不同)。
3. 數(shù)據(jù)科學(xué)家
數(shù)據(jù)科學(xué)家是應(yīng)用機(jī)器學(xué)習(xí)技術(shù)提出預(yù)測(cè)模型的人。數(shù)據(jù)科學(xué)家設(shè)計(jì)算法,根據(jù)所提供的數(shù)據(jù)做出預(yù)測(cè),建立統(tǒng)計(jì)模型,做類創(chuàng)建推薦系統(tǒng)或是欺詐檢測(cè)之類的事情。根據(jù)所在公司的不同,數(shù)據(jù)科學(xué)家可能也需要具備分析師的技能——接受業(yè)務(wù)請(qǐng)求、獲得數(shù)據(jù)特性、完成可視化之類的事情。
我們常看到“數(shù)據(jù)科學(xué)獨(dú)角獸”這個(gè)詞,這個(gè)詞指能夠:
- 提出機(jī)器學(xué)習(xí)模型并做出預(yù)測(cè)
- 具有特定領(lǐng)域知識(shí),能夠?qū)⑻囟I(yè)務(wù)需求轉(zhuǎn)化為數(shù)據(jù)問題
- 分析數(shù)據(jù)并提出商業(yè)見解
- 能夠向客戶展示/傳達(dá)這些見解
綜上所述,數(shù)據(jù)科學(xué)獨(dú)角獸指懂得機(jī)器學(xué)習(xí)和數(shù)據(jù)分析、擁有領(lǐng)域相關(guān)知識(shí)、能夠表達(dá)自己見解的人。然而在大多數(shù)數(shù)據(jù)為核心驅(qū)動(dòng)的公司中,這幾種工作是分開的。數(shù)據(jù)科學(xué)家的主要任務(wù)仍然是建立機(jī)器學(xué)習(xí)模型,并做出預(yù)測(cè)。
所需技能:一種或多種編程語言,較強(qiáng)的數(shù)學(xué)背景,統(tǒng)計(jì)學(xué),機(jī)器學(xué)習(xí)。
所需工具:R,Python(工具包,如Caret和Scikit-Learn)。
你應(yīng)該選擇什么職業(yè)?
圖源:unsplash
在數(shù)據(jù)科學(xué)的生命周期中,還有很多可以扮演的職業(yè),如機(jī)器學(xué)習(xí)工程師,商業(yè)洞察師等。筆者上方列出了三個(gè)主要職位,在做出最后的職業(yè)決定前,你也應(yīng)該對(duì)其他的職位也做一些調(diào)查。上文提到的所有職業(yè)都需要一些編程和查詢的知識(shí),這些并不難學(xué)習(xí)。
數(shù)據(jù)工程師可能是這三種角色中技術(shù)含量最高的,因?yàn)檫@需要比其他任何一種都需要更多的編程。如果讀者更傾向于編程,并且了解數(shù)據(jù)庫的來龍去脈,可以考慮成為一名數(shù)據(jù)工程師。
數(shù)據(jù)科學(xué)家的角色更注重于數(shù)學(xué)本身。如果喜歡數(shù)學(xué),并對(duì)建立堅(jiān)實(shí)的統(tǒng)計(jì)學(xué)基礎(chǔ)感興趣,可以考慮成為一名數(shù)據(jù)科學(xué)家。如果想成為一名數(shù)據(jù)科學(xué)家,則需要一個(gè)更強(qiáng)的學(xué)術(shù)背景,花更多的時(shí)間進(jìn)行學(xué)習(xí)。需要了解編程知識(shí)(用R或Python編寫),并使用工具包構(gòu)建機(jī)器學(xué)習(xí)模型。
最后,數(shù)據(jù)分析師需要對(duì)數(shù)據(jù)具有洞察力的人。要成為分析師,則需要知道如何查詢數(shù)據(jù)并找到符合顧客需求的見解。這在三個(gè)職業(yè)中最需要?jiǎng)?chuàng)意。從事這個(gè)職業(yè)需要將業(yè)務(wù)需求轉(zhuǎn)化為洞察力,并進(jìn)行可視化。還可能需要對(duì)客戶進(jìn)行展示。如果你是一個(gè)有創(chuàng)造力的人,有良好的表達(dá)和溝通技巧,數(shù)據(jù)分析可能相當(dāng)適合你。
歸根結(jié)底,做你喜歡的事,興趣是第一生產(chǎn)力。