招聘行業大數據應用場景分析
一、前言
多年前應他人所邀,對其所關注的招聘行業在大數據方面的應用方向進行了簡要分析:主要從技術架構與應用模式兩個層面進行展開。鄙人水平有限,下文的內容純屬一家之言,如有不妥之處,請各位看官諒解。
二、背景分析
互聯網目前對招聘行業的改變,是極其有限的,只是讓服務場景延伸了。和前互聯網時代的“人才市場”模式相比,現在招聘企業,在服務上,并沒有實質性的提升,仍然是提供一個平臺,然后把C端(候選人)賣給B端(用人企業)。但服務場景延伸了。
這體現在,以前只能去人才市場找工作,現在在家里找工作;以前只能在家里找工作,現在可以在公交車上用手機找工作。包括新興的“職場社交”,其實仍然只是服務場景的改變:以前是通過中介、獵頭找工作,現在跟HR、跟CEO社交,通過相處,熟悉后找工作。招聘行業如果只是延伸服務場景,卻不提升服務品質,是遲早會被互聯網市場淘汰的。目前也有一些招聘企業,已經開始升級對C端的服務品質,比如拉勾做的專車送入職者上班,比如強制要求用人企業發布的招聘職位薪資透明,再比如一些公司獵頭給付費用戶提供的一對一服務,幫他們去完善簡歷。
2.1 招聘行業業務痛點分析
互聯網給人類***的財富就是***的前沿實時資訊,所以互聯網對招聘行業服務品質的提升,最終必然也是依靠資訊的處理。
2.2 為什么要引入大數據處理技術
移動互聯網時代,新業務/新商業模式不斷涌現,極大的豐富了人們生活,隨之帶來的是各種形態業務數據的爆發式增長;新形勢下的數據倉庫不再局限于傳統的經營決策統計分析報表,而是要改變運營方式、提供符合新業務/新商業模式的運營支撐能力;傳統數據倉庫技術難以滿足高速增長的海量數據的處理要求,迫切需要引新的技術來提升支撐系統的能力。
觀點1:大數據是一種正在進行的業務轉型
大數據是互聯網經濟的主要支撐模式,強調以數據先行的方式孕育創新,平臺技術以適應變化的方式支持業務發展。數據驅動業務是***目標。大數據概念席卷了各個領域,造成了傳統經濟陣營的一種恐慌。但是,這種恐慌的根源并非來自大數據,而是背后充滿活力、高速發展的互聯網經濟。因此,我們無法僅僅借鑒大數據的細枝蔓藤,應用一兩種新技術、或模仿建設某一種平臺來根本上消除這種差距。從業務角度看,出路在于向數字時代的商業模式轉型。
觀點2:大數據同時是一種技術革新
海量數據處理、實時、智能,既關注群體規模又關注個性化,是商業模式對大數據技術發展的主要訴求。業界軟硬件平臺總的發展方向,可以總結為兩點:更高的處理性能、以及更多的細分領域。
三、需求分析
3.1 求職端需求
針對求職端而言,亦是求職者,他們急需能夠快速的找到合意的工作;求職者也需要了解自身在求職過程中的得失。求職端的信息需求主要表現為對工作機會的精確推薦需求以及有效清晰的掌控求職過程。
3.2 企業端需求
對于企業端而言,大數據驅動的招聘平臺能夠提供它們針對HR工作的全面解決方案。基于該解決方案不僅能夠獲取優秀人才而且能全面掌控人才動態,生化HR工作。
3.3 增值需求
另外結合內外部數據,招聘大數據還可實現變現,數據直接產生價值,亦即是增值服務。
四、應用思路
方向1:對內數據價值提升—構建數據分析與數據可視化平臺
方向2:對外數據直接變現—構建大數據信息服務平臺
對于外部合作廠商而言,基于自有大數據基礎平臺,可推出信用評估數據服務、人才動態監控、社會治理服務。
五、總體架構
5.1 總體原則
a、技術-按需頻度的數據獲取
批量和實時數據采用不同的技術手段和工具,遵循統一的文件接口標準
b、技術-多樣化數據共存
跨同構/異構數據庫(物理系統),基于文本、數據庫的數據抽取和加載
c、數據-數據即服務
業務人員通過邏輯數據對象組件訪問數據,而不用關心數據的物理存儲方式。通過數據組織與前端應用功能,使業務人員可以較容易、較快地定位和了解數據的內容。
d、數據-數據質量控制
通過一系列的技術和業務手段實現數據集成平臺數據質量控制,主要體現在數據正確性(技術)、完整性、一致性(業務)、有效性。
5.2 分層體系
從數據的分層結構來看,整體上可分為:數據洞察層、數據消費層、數據智慧層、數據整合層、數據計算層、數據存儲層、數據收集層以及數據源層。
如上圖所示,按數據價值密度的高低來劃分的話,實質上可以分為數據處理層:從數據收集à數據智慧,數據應用層:數據消費à數據洞察。
5.3 總體架構
從整體上來看,招聘大數據平臺的技術架構由支撐海量數據處理的存儲層、支撐大數據分析的信息供應層(治理層)以及提供應用能力的信息分析層(應用層)構成。
如上圖所示,與目前比較流行數據治理+數據應用的架構相當類似,在當前特別注重大數據治理體系構建的情況,改技術架構也是比較符合現實需求的。
5.4 功能結構
整個大數據應用平臺的功能應該由面向技術的數據分析類功能和面向業務的專業應用組成。
數據分析類功能包括:數據查詢、數據統計、數據挖掘等,專業應用包括:人才畫像、人才雷達、用戶服務等。
幾個重點的應用方向還是人才畫像、人才雷達等。
六、技術實現思路
6.1 基礎平臺建設
核心思路1:底層采用的關鍵技術——分布式、數據倉庫、數據管理
核心思路2:Hadoop技術體系與MPP的集成思路——混合方式
核心思路3:如何做數據采集——分布式爬蟲技術的應用
6.2 數據分層規劃
規劃思路1:數據按熱度與價值分級存儲——冷熱分離/在線離線分離
規劃思路2:數據按粒度或治理程度來分層存儲——數倉思路
規劃思路3:構建全生命周期的數據管控體系
6.3 應用思路
應用思路1:人才畫像
應用思路2:構建基于人才畫像的PYMK體系
應用思路3:人才推薦系統
通過大數據分析、匹配、推薦基于人才畫像,讓HR不再為搜索和篩選簡歷浪費時間,通過機器在億級簡歷庫中匹配合適簡歷,企業只需對合適簡歷批量發起約Ta邀請,按效果付費,有意向面試才產生收費。
應用思路4:人才測評系統
可考慮接入專·業的測評公司,包括(適職能力,銷售素質,領導力,認知力),多維度評估候選人。
應用思路5:征信服務
對于職場人士來言,個人信用得分或將成為未來求職的重要考量指標之一,也是能否在職場贏得尊重、獲得長足發展的重要品質。個人的信用不僅僅體現在金融、消費、生活理財等方面,也要注意,在線社交平臺上的個人信息也可能對自身的信用造成影響。大數據平臺與技術進入人力資源行業做個人職業征信與職業信用體系建設。
作者介紹:
楊剛,現任珠海市新德匯信息技術有限公司副總經理兼大數據研究院院長 15年IT從業經驗,長期從事云和大數據的技術研發和實施工作,有深厚的電信、政務、金融等行業背景。