數據科學家:黑客與數據分析師的完美結合
數據科學家大顯神通的時刻到了!但究竟什么是數據科學家?數據科學家需要具備怎樣的技能?他們為何與眾不同?
大數據時代的到來驅動了數據,帶寬和處理能力成指數級的增長。現今數據科學這一新興領域已經引發了眾人極大的興趣。Amazon前首席科學家表示“數據是原油,但石油需要加以提煉后才能使用,從事海量數據處理的公司就是煉油廠”。
如今,所有規模的組織都在嘗試探索如何從大數據中挖掘出有價值信息。數據科學家具備從大數據挖掘“金礦”的能力,并根據挖掘出的信息用來對大量移動設備數據、社交媒體流數據、醫療成像、智能電網等領域中的趨勢進行預測,同時帶來巨大的商業價值。在未來5年數據科學家這一領域人才將出現供不應求的局面。這也帶來了更多的工作機會。
McKinsey報告指出去年大數據強有力的增長。McKinsey同時預測在未來6年,僅在美國本土就可能面臨缺乏14萬至19萬具備深入分析數據能力人才的情況,同時具備通過分析大數據并為企業做出有效決策的數據的管理人員和分析師也有150萬人的缺口。
Ventana研究公司的分析師David Menninger指出在其公司最近所作的一項調查顯示,在169位公司高管中有四分之三的人認為技術人員缺乏是企業無從應對大數據挑戰的重要因素。
在上周加利福尼亞舉行的Stratadata大會上超過2000人共同探討如何應對大數據的問題。Google、Facebook、LinkedIn等企業正是因為很好挖掘到有價值的信息從而創造了巨大的利潤。
Google的Hal Varian表示未來10年數據科學家將變成性感的工作,許多人認為我是在開玩笑,回過頭來看,在20世紀90年代誰會猜到計算機工程師會成為性感的工作。
前LinkedIn數據科學家DJPatil表示數據科學家是具備獨特技能的。Bitly首席科學家Hilary Mason表達同樣的觀點,他認為數據科學家是融合數學、算法,并可從大數據中尋求問題答案的人。而現任LinkedIn首席數據科學家Monica Rogati認為數據科學家是黑客和分析師組成的混合體,他們通過數據發現本質。
紐約時報研發實驗室的成員Jake Porway表示數據科學家絕對是罕見的全才。數據科學家除了具備編程的能力外還需將各種來源的數據管理并利用統計學挖掘出蘊藏在內部的信息。
Kaggle總裁兼首席科學家Jeremy Howard認為一個偉大的數據科學家應具備創新、堅韌、好奇、深厚技術這四項素質。具備數據收集、數據改寫、可視化、機器學習、計算機編程等技術的數據科學家使數據驅動決策并主導產品。他們更喜歡用數據說話。
以上匯集了眾多對數據科學家的定義。但你覺得什么是數據科學家?你會怎么定義他們呢?最后EMC給出了他們制作的數據科學家信息圖