不能成為數(shù)據(jù)科學家?沒關(guān)系,你還可以擁有數(shù)據(jù)思維
原文作者: Christian Bonilla
選文&翻譯: 吳佳樂 薛菲
校對:Aileen
數(shù)據(jù)科學家日益突顯的影響力令人驚嘆——每次讀到這種論調(diào)的文章我都感到好笑。雖然不是所有文章都像《哈佛商業(yè)評論》一樣宣稱數(shù)據(jù)科學家將是“21世紀最熱門的職業(yè)”,但是,幾乎都是千篇一律的“我們預(yù)見了未來”的語氣。我認為這種觀點并沒有錯,但是在這種趨勢中,我沒有發(fā)現(xiàn)什么是值得驚奇或者是新鮮的。如果《洋蔥報》(The Onion, 美國***的幽默諷刺雜志)要報道,我想標題應(yīng)該是:
“***研究表明,精通數(shù)學和編程的人被大量地雇傭”。
這有什么新鮮的呢?自從上世紀70年代以來,擅長數(shù)學和編程的人們就在華爾街發(fā)家致富了。隨著越來越多的公司產(chǎn)生海量的數(shù)據(jù),對于數(shù)學和編程技能的需求已經(jīng)延伸到了新興的行業(yè),更不必說技術(shù)部門了。但是,數(shù)學和編程只是價值正在迅速上升的量化分析能力中的一部分。去年8月紐約時報的一篇文章是一個極好的例子,能夠說明新聞媒體對此的熱切關(guān)注度:一位在舊金山工作的服務(wù)生Paul Minton,在決心成為一名數(shù)據(jù)科學家后,經(jīng)過3個月的編程和數(shù)據(jù)分析課程,年薪就從2萬變成了六位數(shù)??磪?,一個數(shù)據(jù)科學的奇跡!
補充一點細節(jié)(這篇文章指出了此點非常值得贊揚,雖然只是略帶而過):Minton擁有數(shù)學專業(yè)的本科學位。換句話說,他是一位非常聰明的服務(wù)生。我不了解Minton,也不想妄加評論他本人或者紐約時報或者服務(wù)生。但是,大多數(shù)人是沒有天資在如此短的時間內(nèi)實現(xiàn)同樣的轉(zhuǎn)變的。我在以前的博客和書中曾經(jīng)說過,我是編程學校和非傳統(tǒng)學習平臺的忠實擁護者。但是不能只注意到Minton“僅僅3個月”就完成了他的非凡轉(zhuǎn)變,卻忽略了他之前數(shù)年的教育中包含了微積分,統(tǒng)計學,概率論和其他這些除了編程技術(shù)以外的高深課程,這些都是取得數(shù)學本科學位所必須的。我猜Minton至少對MATLAB有一點印象。對于大多數(shù)人而言,他們不僅沒有數(shù)年的相關(guān)訓練,而且即使接受免費培訓他們也不一定能夠掌握編程能力。我就是其中之一。
相比于我大學時期,現(xiàn)在的就業(yè)市場需要數(shù)學和統(tǒng)計學能力已經(jīng)不再是秘密,但是這并不意味著它們更容易學習。在我大學的朋友中,我的量化分析能力至多是略高于平均水平。雖然我的微積分和統(tǒng)計學學得非常好,但是良好的數(shù)學基礎(chǔ)使我能夠應(yīng)付我的經(jīng)濟學專業(yè)的同時,也讓我發(fā)現(xiàn)擅長數(shù)學不再是我的長期優(yōu)勢。我清楚地認識到,我的職業(yè)生涯無法僅僅建立在我比其他人數(shù)學更好的基礎(chǔ)上。對于數(shù)學,我想大多數(shù)人有這樣的意識后都會比周圍人更加困擾。
我之所以提出這些是希望當你為自己的數(shù)學學位感到害羞,聽到數(shù)據(jù)科學家的需求量巨大就如聽到國家橄欖球聯(lián)盟的四分衛(wèi)收入很高一樣時,能夠清醒地說,“是的,當然如此。”
好消息是,即使不能成為一位數(shù)據(jù)科學家,通過培養(yǎng)自己的數(shù)據(jù)思維,你仍然能夠提升自身價值,使工作更出色。
當今職場秘密武器:用數(shù)據(jù)說話
這些年有一件讓事情讓我震驚:大多數(shù)人對自己公司的數(shù)據(jù)的了解少之又少。我接觸過的大多數(shù)公司里根本沒有幾個人有能力用最基本的方法分析他們的數(shù)據(jù),更別提有足夠的數(shù)據(jù)科學家人手了。最近有個大型酒店集團的營銷經(jīng)理向我吐槽:公司里“也就2-3個人”可以分析原始的銷售數(shù)據(jù),只有他們對業(yè)務(wù)和內(nèi)部信息系統(tǒng)都有足夠的了解。我接觸的另一個商用品分銷公司有幾萬名員工,但是只有5、6個人可以快速地回答公司高層提出的問題,其他的人要么不夠了解數(shù)據(jù)庫要么不夠了解公司業(yè)務(wù)。還有一個大型零售連鎖集團里只有很小一撮人可以很快地分析他們的原始數(shù)據(jù)。很多公司甚至專門設(shè)立了”客戶洞察”部門。他們的使命是專門幫助其他部門解決跟那些該死的數(shù)據(jù)有關(guān)的問題。
是什么造成了這種現(xiàn)象呢?
這些公司的信息系統(tǒng)應(yīng)該負一部分責任。現(xiàn)在有很多企業(yè)因為時間的積累或者是多次并購,繼承了很多個不同類型的信息系統(tǒng)。這些系統(tǒng)對于沒有技術(shù)背景的人來說非常難以使用。僅僅這一條就可以讓大多數(shù)的人對于公司的原始數(shù)據(jù)望而卻步。但是更大的障礙其實是人的惰性。就算公司有還不錯的分析數(shù)據(jù)的工具(比如一個關(guān)系型數(shù)據(jù)庫),也只有少數(shù)的人有耐心和好學心去了解。其他大多數(shù)人只是想等待數(shù)據(jù)出現(xiàn)在一個Excel表格里或者一個展示板上供他們使用。這不簡單是需要學習一門新的查詢語言(SQL)的問題。要想要明白公司的數(shù)據(jù)模型是怎樣的,數(shù)據(jù)是怎么樣存儲的這些都需要反復(fù)實驗,這會消耗很多耐心和精力。現(xiàn)實世界中的數(shù)據(jù)和在商學院中用的數(shù)據(jù)是完全不一樣的,手里的數(shù)據(jù)永遠沒有書里的那么整潔可靠。這就是為什么絕大部分人都直接使用他們的IT部門整合好的數(shù)據(jù)。這些數(shù)據(jù)比較靠譜,不需要考慮太多跟數(shù)據(jù)本身無關(guān)的事情。
但是僅僅使用這些別人寫好的數(shù)據(jù)報告和展示板有一個問題,就是你很難在職場中脫穎而出。因為大家的信息都是對稱的,這些數(shù)據(jù)的一絲一毫所有人都看的清清楚楚。雖然數(shù)據(jù)的質(zhì)量很重要,但這會大大限制你創(chuàng)新的能力。當你手中別人給你做好的數(shù)據(jù)并不能幫助你解答你想知道的問題時怎么辦?舉個例子,假設(shè)你想測試一下那些全家自駕游的客人在酒店的消費特征。這時你需要自己篩選分析那些只來過酒店一次,點了兒童菜單的東西到房間里而且還加了一張折疊床的客戶。這種分析可以讓你的老板認真聽取你報告的內(nèi)容。這種問題如果可以自己解決比要要別人幫助好十倍。
解決這些問題并不難,不需要高中畢業(yè)就可以搞定。你只需要合適的數(shù)據(jù)加上一顆好學心。
提出簡單的問題可以事半功倍
有人說聰明的人喜歡問復(fù)雜的問題,但是絕頂聰明的人往往會問簡單的問題。的確,最重要的業(yè)務(wù)問題往往也是最簡單的問題。比如:為什么客戶沒有選擇競爭對手的產(chǎn)品而是選擇了我們的產(chǎn)品?為什么曾經(jīng)選擇了我們產(chǎn)品的人卻最終放棄了這個產(chǎn)品?我們應(yīng)該為了增加銷售量而降價嗎?當你是職場新人的時候你往往在埋頭做一些細節(jié)的工作,沒人會問你這種問題。但隨著你經(jīng)驗增多,真正可以搞定這些問題的時候你可以開始為解決公司最根本最重要的問題做貢獻,升職加薪走向人生***!
回顧我的職業(yè)生涯,我學到最有用的業(yè)務(wù)技能就是SQL,用這個語言我可以直接查詢一個公司的原始運營數(shù)據(jù),直接了解關(guān)于這個公司業(yè)務(wù)的基本特點。我漸漸發(fā)現(xiàn)自己很擅長提出不錯的問題,需要的只是一些能幫我解決這些問題的工具。更重要的是,當一個人用過內(nèi)部的數(shù)據(jù)庫查詢過公司的信息后你就會發(fā)現(xiàn),使用數(shù)據(jù)庫的經(jīng)驗可以教你提出更好的問題。說白了就是,用過數(shù)據(jù)庫之后就知道怎樣可以提出一個在數(shù)據(jù)庫中可以精確回答的問題。這讓人沒有以前那么懶惰,因為計算機和人不一樣,它并不懂得怎樣揣摩你真正的意圖。這樣在不知不覺中就學會了如何更加系統(tǒng)地思考。
原文鏈接:http://www.smartlikehow.com/blog-native/2015/12/1/not-a-data-scientist-no-problem-you-can-still-be-data-savvy-than-most
【本文是51CTO專欄機構(gòu)大數(shù)據(jù)文摘的原創(chuàng)譯文,微信公眾號“大數(shù)據(jù)文摘( id: BigDataDigest)”】