SAS:大數據時代 數據科學家將成稀缺人才
商業分析軟件與服務供應商SAS在其***發布的一份公司刊物中稱,大數據時代對數據科學家的需求將激增,而人才匱乏將成為各企業面臨的新挑戰。
SAS指出,大數據時代的來臨向人們展示了大數據分析對企業業務發展的神奇價值,與此同時,大數據的數據量巨大、非結構性強、數據來源龐雜,使得大數據的處理與分析需要有別于傳統數據分析的新技術(如高性能分析HPA)和新人才。
數據科學家定位
數據科學家集技術專家與數量分析師的角色于一身。他們和傳統數量分析師的區別在于:后者通常利用企業的內部數據進行分析,以支持領導層的決策;而前者更多的是通過關注面向用戶的數據來創造不同特性的產品和流程,為客戶提供有意義的增值服務。面向客戶的性質決定了大部分數據科學家擔任公司產品開發或營銷部門的職位,或是效力于***技術官。
專注高性能分析的數據科學家未必是非結構化數據處理的專家,但他們需要探索不同途徑,利用高性能分析(HPA)節省下來的時間不斷改良分析模型、提高決策速度,以配合數據分析更快的生命周期。
數據科學家必備技能
數據科學家需要具備技術、商業、分析與關系學等各方面的綜合技能。很多數據科學家都擁有高級計算機科學學位,或物理學、生物科學或社會科學等一系列對計算機技能有相當要求的高級學位。數據科學家面對、處理的數據量可高達TB級規模,這就要求了他們必須掌握相當多的專業技能,SAS歸納了以下六點:
•處理分布式文件系統工具的能力,如Hadoop、MapReduce等
•Python、Java、 Pig與Hive等編程語言
•機器學習能力
•非傳統型數據庫工具,如Vertica及MongoDB等
•自然語言的處理
•統計工具的使用
事實上,擁有上述這些高級學位和專業技能還不夠,數據科學家同樣需要具備一個分析師的素質,比如數學和統計技能,對商業的敏銳嗅覺,以及與客戶、產品經理和決策層有效溝通的能力。當然,要一個員工具備上述所有能力并不容易做到,所以不少企業組建了專門的數據科學團隊,希望通過人才的多元組合,全面應對各種需求。
招募與培養數據科學家
獨立調查研究機構Gartner在2012年于佛羅里達奧蘭多市召開的Symposium/ITxpo大會上指出:“大數據將在未來十年內成為新的常規標準,十年后對超大規模的系統及數據進行研究將成為非常普遍的現象。但目前業界非常缺乏對所有數據以及數據的使用方法都很了解的數據科學家人才,我們的公共和私有教育系統尚不能滿足我們在這方面的需求。數據專家將是一種稀有和寶貴的財富。”
目前在高等院校幾乎沒有設置針對數據科學的專業課程,但已經有一些院校開始嘗試與像SAS這樣的企業合作,開辟出一門或幾門有針對性的專業課程并對外開放。一些有志于發展大數據業務或服務的企業則開始有的放矢地開設企業內訓課程,從企業內部培養未來的數據科學家, 如EMC開設了面向內部員工及客戶的“數據科學及數據分析”培訓課程。一些咨詢公司也開始向客戶提供他們所需要的數據科學家人才。
SAS鼓勵企業在大數據時代形勢下盡早開始數據科學家的人才儲備,將有利于提升企業的核心競爭力。
SAS在高級商業分析領域擁有近40年的經驗,自SAS在美國北卡羅來納州創建以來,一直不斷尋找方法來播撒新技術和先進知識的種子。在美國,SAS針對教育者和學生所設計的軟件被6,000所學校的35,000多名教師所使用,高校使用SAS軟件超過36年之久。
在中國,SAS去年舉辦的“構建知識的力量、抓住未來機遇”全國高校巡講非常成功,今年仍會繼續通過技術講座、現場交流等方式,向師生介紹當今大數據趨勢下智能分析解決方案等技術動態,通過分享典型應用,讓更多在校學生掌握商業智能技術,幫助他們提高在未來就業市場上的競爭力。