如何快速培養高素質大數據人才
我們應該停止大肆宣傳大數據技術人才的缺口,是時候開始討論培訓和招聘方案了。
專家是培訓出來的,不是天生的。你需要回答的一個問題是,你是否需要專業技術知識或數據專業知識。專業技術知識能讓SQL數據庫或Hadoop集群投入使用。數據的專業知識可以使我們利用數據挖掘、文本挖掘、預測和機器學習技術。無論哪種方式,我們首先應該假設的是從現有的員工培育人才,是最首要也是最好的選擇。
2012年的大數據和分析人事調查顯示,大多數企業計劃采取一個再培訓、招聘和外包的組合方案,以填補人才缺口。但是,得到薪金上漲的批準、與新招聘的人一起工作、面試候選人,這些都是一個耗時的過程。更重要的是,專業人士大概有良好的能力,來處理你的業務、你的數據源以及你目前所做的分析,最有可能的是,分析得出你所希望從大數據和先進的分析得到的東西。
如果你缺乏的是技術專業知識,那么相信你現有的數據庫管理員、數據庫開發人員和數據倉庫的技術人員,他們可以學習新的技巧。比如,從傳統的數據庫轉移到大規模并行處理(MPP)數據庫平臺,對數據庫管理人員(DBA)來說并不是一個巨大的飛躍,優秀的人才將很快適應這個挑戰。
供應商總是有提供低成本的培訓和資格認證這樣的選擇。例如,惠普剛剛宣布了圍繞它的MPP-based HP Vertica Analytics Platform的課程模塊和認證考試。其入門課程,將在世界各地的HP ExpertOne教室被教授,為期將超過三天。還有一個選擇是虛擬的在線培訓,將在四天內培訓完。惠普公司的市場營銷副總裁Chris Selland說:“它是有關如何設置軟件并最有效地利用它的技術產品培訓,它的受眾很廣,從數據庫管理員(DBA)到數據科學家都可以。”
大數據主要是以其數據的種類多樣以及巨大的容量見長,它主要在如Apache Hadoop和NoSQL數據庫這樣的新平臺運行。Hadoop軟件、支持和培訓服務提供商MapR的首席執行官約翰·施羅德指出,在短短的五個月內,很多公司并沒有把Hadoop集群投入生產的經驗。他說:“現在我們將面臨一個人才爭奪戰,因為手頭的項目比工作人員還多,但同時我們也將看到,與2010年和2011年相比,Hadoop培訓的人數也在大幅增長。”
MAPR和它的競爭對手Cloudera公司和Hortonworks,提供了大量的培訓課程。在MAPR的這里,他們通常提供兩到三日的MAPR學習視頻,其在線和課堂課程主題包括群集管理的基礎、Hive和Pig動手操作、MapReduce培訓以及HBase編程。Cloudera大學在全球范圍內提供在線和課堂課程,而Hortonworks大學在各大中城市提供課堂課程,招募6個或者更多的參與者,地點選在公司的內部。
這些培訓方案的前提假設是,培訓人員屬于能干的系統管理員和開發人員,可以迅速學習新技術,這些新技術與SQL和關系型數據庫完全不同。在更先進的以數據分析為導向的課程中,如“數據科學的入門——構建推薦系統”(由Cloudera大學提供),其目標受眾是“擁有基本的Hadoop的知識和水平的軟件工程師、數據分析師和統計人員。
如果你的數據管理團隊涉及的不是先進的數據挖掘,文本挖掘和預測分析等主題,你可以考慮他們參加這些頂級的分析碩士的學位課程之一。最短的培訓課程可以在10個月內完成,但它是全日制的,對現有的雇員可能不合適,除非他們可以請假。另外還有非全日制和網校的課程,最短大約需要兩年的培訓時間。
開發碩士學位主要是為那些想參加培訓的人提供資源,如果你急于填補人才空缺,你可以把這些課程看做招募的資源。參加碩士課程的優勢是,大部分學生將有三年或三年以上的業務經驗。大部分學校會很高興地歡迎新的雇主來參與他們的招募計劃,尤其是那些對新員工有穩定需求的大公司。
有些學校甚至與贊助公司合作,教授和研究生團隊一起應對現實世界的商業挑戰。北卡羅萊納州立大學的高級分析研究所和麻省理工數字研究中心就是這樣的情形。所以你也可以尋找開設有分析或大數據的學位課程的研究中心或研究所來一起合作。
底線是,我們除了怨天尤人或者聘用高價位的獵頭幫忙以外,還有很多其他選擇。如果你正在尋找的是高端人才,這個任務無疑是很困難的。不過在你發出“我找不到人才”這樣的歇斯底里之前,確定好你的需求和培訓的規模,然后和當地一所大學建立聯系,或許你的問題就解決了。