淺談企業數據能力建設
隨著市場的逐步成熟,要想保持企業的長期競爭力,運營和產品改進工作需要越來越精細化。
比如,在游戲行業,玩家留存率是一個關鍵指標,為提升·留存率,需要精細化地分析玩家是哪一步流失的,根據游戲進程推進過程,按照先后順序設置關鍵節點,分析各個節點流失情況數據,可以形成一個玩家流失漏斗。有了玩家流失漏斗,我們可以選擇流失率高的環節進行進一步精細化分析,找到流失原因,比如機器適配問題,引導缺乏吸引力問題,數值設計問題等,根據這些原因就可以針對性的在產品和運營側做改進了。
又比如保險行業,為了提高銷售效率,可以先通過模型預測用戶的銷售響應率,然后將用戶劃分為幾等,分別交由不同級別的銷售人員跟進。我們現在在談論的用戶畫像,產品畫像,增長黑客,或者個性化推薦等等,其本質上其實都是在實現更精細化的運營或產品改進。
精細化產品改進和運營對企業應用數據的能力提出了很高的要求,因為這些改進決策的制定不能全憑經驗,它們很大程度上還需要建立在堅實的數據分析結果之上。
企業應用數據的能力可以簡稱為企業數據能力。從整體上看,它應該是由企業數據驅動業務的文化、具有特定技能的人及具有特定功能的IT系統共同構成。
既然市場對于企業的數據能力要求越來越高,那么要如何建設數據能力呢?
為了嘗試回答這個問題,我們先看看主要有哪些數據工作內容。
數據工作內容
回顧上面的玩家留存率分析過程,可以發現主要有三部分工作:
- 尋找數據
- 加工數據
- 分析數據并提出產品改進的建議
如何支持這三部分工作呢?也可以從三個方面來看:
- 數據的日常維護和管理。它將包括數據倉庫/數據湖的建設,數據質量、標準、模型、安全等數據治理內容。這將提高尋找數據的效率,保障使用數據的安全。
- 針對特定問題的數據分析。包括基于業務的各種指標計算,建模分析等。
- 數據管理及分析過程中的相關工具及平臺。這將輔助進行數據管理和數據分析。
為什么是這三個方面呢?事實上,這三個方面分別對應了三個不同的專業領域,它們需要的技能很不一樣,企業內部甚至常常需要分成不同的團隊來支持。數據的日常維護和管理需要數據工程能力,數據分析需要的是分析和建模的能力,工具平臺的開發則需要軟件開發能力。
其中,工具平臺研發和前兩者的相關性很高。
數據管理工作除了包含大量的規范文檔定義、流程設計、溝通宣導之外,要在企業內部實現落地則是可以通過工具平臺內建流程來支持。事實上這種方式越來越成為一個企業數據管理的演進趨勢。這樣一來,企業內部往往可以只設置少量數據管理專家,然后通過配合一個數據工具平臺研發團隊來實現數據管理。舉個例子。比如對于數據質量管理,數據管理專家可以針對具體的業務數據定義專用的數據質量規則,如空值規則,值域范圍規則等。通過數據平臺可以將這些規則進行落地(規則腳本化并配置到平臺)。然后數據平臺定期運行相應的質量檢查腳本來生成數據質量報告或發出數據質量告警,從而指導團隊進行數據質量改進。
數據分析工作同樣離不開工具平臺的支持。即便簡單的能通過sql查詢實現的分析工作,也至少需要提供一個查詢界面,隨著分析工作日漸復雜,直接粗放的使用數據庫工具來支持會顯得越來越吃力和低效。事實上,一般我們會將這里的分析進一步細分為即席查詢分析,定期報表,實時報表,建模分析,線上模型推理等內容。想要較完善的支持這些分析工作,沒有一個高效的工具平臺支撐是很難完成的。甚至業界常常采用數據平臺和機器學習平臺雙平臺來進行支持。
這三方面的工作可以圖示如下:
從前面的分析來看,企業除了要從需求端發展數據管理能力和數據分析能力,工具平臺的建設也是必不可少的,工具平臺成熟程度常常與數據管理和數據分析的效率正相關。隨著企業的逐漸發展壯大,工具平臺往往越來越成為其數據能力的核心內容。這集中體現在工具平臺越來越難以滿足數據管理和數據分析的需求,大量的工具平臺定制化需求被提出。
不同的企業具體情況不同,這三個方面的工作量及對應的人員需求量也不同。比如,有的企業中,數據相關工具和平臺完全來自外部采購,功能相對完善,則可能只需要完成工具平臺運維,內部系統集成和管理流程落地,工具平臺研發人員也可以盡量減少。而與之相對應,如果工具和平臺采用基于開源工具自建,有較多的自定義功能,則往往需要擴大工具平臺的研發團隊。而有的企業中,如果數據管理人員和數據分析人員擁有較強的軟件研發能力(比如大量來自開發人員的角色轉型),則工具平臺的研發可能直接會合并到數據管理和分析工作中去。
企業數據能力建設思路
基于數據工作的拆解和分析,我們可以嘗試從以下幾個維度來思考如何進行企業數據能力建設。
第一是數據人才資源建設。
從角色及其能力要求上面劃分,可以大致將數據人才資源分為數據工程師/數據架構師,數據分析師/數據科學家。我在另一篇文章中探討了這些角色的工作范圍和能力要求,可以作為這些角色定義的參考。從這里的角色定義出發,企業就可以根據自身具體情況規劃出符合自身文化的數據人才資源體系結構,從而在招聘和培養人才上面有一個整體的思路和規劃。
第二是人員組織和協作。
有了人,如何才能將大家組織起來,形成合力,做好事情呢?
企業組織結構一般可以分為職能型、項目型和矩陣型。
職能型組織將核心的工作劃分為不同的功能部門,如產品,運營,銷售,財務,審計等,這些部門按照職責范圍大小組成從上到下的層級,最終形成金字塔型的結構。職能型組織結構一個典型的例子就是政府部門和一些傳統的大型國企。其優勢是利于各部門形成自己各自的專業優勢,劣勢是難以組成項目組以面向問題的方式解決企業問題(部門間常常合作困難,相互推諉和爭利)。
項目型組織以面向項目的方式組成項目組來實現人員組織和協作,其典型的例子是以外包業務為主的服務型公司。其優勢是解決問題的效率高,但是不容易積累沉淀組織能力。
矩陣型組織則希望避免職能型組織帶來的部門墻問題,在職能型組織的基礎上引入項目組織形式,在項目需要時從各職能部門抽調人員形成項目組,由項目組來統一管理。矩陣型組織常常使得某一個角色存在多位領導,從而給員工晉升及工作安排帶來問題。實際企業中往往是各種組織形式并存,其中重要的是要注意由于部門劃分帶來的部門墻,它對于工作效率常常帶來巨大的負面影響。
對于剛起步的小型企業,人才資源有限,往往需要一個人當一個團隊用,過于清晰的劃分將顯得過于重量級而無必要。
對于一個中大型企業而言,可以設立數據部,內部進一步細分為數據管理、數據分析、數據工具平臺研發三類角色崗位,形成職能型的垂直組織結構。然后,從各類細分角色抽調一部分人組成項目組以支持業務線數據分析工作。這樣一來,便形成了矩陣型的組織結構。
以上簡要的做了組織結構分析,要想做好數據工作,還涉及很多需要更多智慧的管理工作細節。
第三是工具平臺建設。
為什么要單獨談工具平臺建設呢?因為工具和平臺往往是數據能力的依托和沉淀。數據管理中的標準和流程需要工具平臺的支持否則很容易變成空中樓閣。而數據分析的無數腳本也需要有機沉淀,并需要在組織內交流和分享,否則就只是數據分析師自身的能力而已。
一般而言,工具平臺的建設有三種模式:
- 外部采購。時間成本可以節省不少,但需要注意采購的產品的功能邊界,并注意該產品是否可以和內部系統有效集成,是否可以支持靈活的功能定制。
- 自建。一般考慮根據開源的項目進行改造,這樣的方式的優勢是可定制能力極強,其劣勢就是需要大量的相關人才并需要一定的時間周期。
- 還有一種中間的方式,那就是采購產品的同時采購定制化服務,或者和第三方技術公司合作在開源產品上聯合開發定制所需功能。
對于這些不同的工具平臺建設模式,不同的企業會做出各自的選擇,但是長遠來看,一個技術驅動的企業一定對可定制能力有很高的要求,所以可定制能力將是一個必選項。
另一方面,從功能上來看,采購的產品和服務往往難以完整的實現企業特定的數據管理和分析需要,可能要考慮基于這些產品提供的api來進行定制化開發而舍棄掉它們提供的功能界面。
比如,如果我們用aws的數據服務,數據質量管理如何實施呢?這時可能需要基于aws的api來開發一個質量管理的工具,通過定義質量規則,配合定期的質量檢測任務調度來實現。
所以,開發一個企業自己的數據平臺界面可能是企業數據工具和平臺建設的關鍵一環。這個界面相當于定義了企業自己的數據工作接口,而采購的服務是這一接口的某個具體實現。
接口的定義往往比實現更重要,因為會有太多的企業資產依賴這樣的接口去實現,比如大量的etl腳本。接口就如同電腦主板的插槽,接口定義好了,企業就可以按照自己的方式去設計主板布局及開發上層軟件,主板布局和上層軟件構成了企業的核心資產和競爭力,而某個接口的具體實現,比如攝像頭、內存或硬盤,則應該可以較為輕松的替換而不影響企業主要業務。
總結
總結一下,以上內容從數據工作做什么出發簡要分析了企業如何進行數據能力建設,結合以往經驗從三個方面(人才資源建設、人員組織合作、工具平臺建設)分享了一些自己的認識。