Gartner研究總監孫鑫:借助數據編織完善數據中臺建設,盤活企業數據資產
在數字時代的今天,數據已經成為企業的核心資產,為業務創新與持續發展帶來了核心價值。隨著企業數字化轉型的加速,企業搭建的數字化業務系統越來越多,獲得的數據也越來越豐富,數據量呈現爆炸式增長的態勢。不過,煙筒式的系統建設使得企業的各種數據無法打通,形成了非常嚴重的數據孤島問題,無法真正發揮數據的價值。
為此,Gartner提出了組裝式數據分析架構概念,以數據編織為基礎,讓數據進行更好的關聯、從而能夠服務不同用戶,創造更大的價值。
Gartner研究總監孫鑫
打通數據孤島,盤活數據資產
中國企業的數字化轉型經歷了比較長的進程,期間建設了諸如交易型的數據庫、分析型數倉,數據湖等系統,由于在數字資產上的投資順序不一樣,導致每個系統之間相互孤立,形成了非常嚴重的數據孤島,無法有效發揮數據的價值。
Gartner研究總監孫鑫在近期接受記者采訪時表示,企業在IT建設上雖然投入了很多的財力和人力,但各個系統與應用之間相互割裂,存在著數據鴻溝的問題。這也是很多企業為什么要建設數據中臺的根本原因。他強調,通過數據中臺給予企業更快速的數據交付,將數據進行高效串聯,進而挖掘數據價值、盤活數據資產,找到真正可以復用的數據,實現業務創新升級,已成為企業數字化升級的共識與挑戰。
據介紹,雖然中國已經有非常多的數據中臺生意,但真正只做數據整合(Data Integration)的廠商并不多。通過Gartner多年的研究顯示,目前中國企業對于數據整合的需求非常旺盛,而數據整合也是數據中臺最核心的解決方案。
那么,企業在構建數據中臺前,如何讓業務進行更好的溝通?又該如何去做呢?對此,孫鑫給出了自己的建議。他認為,如果想讓數據中臺真正產生價值,那就需要進行一個情境化設計,為企業的業務問題產生相關業務驅動的數據能力。
孫鑫表示,企業要考慮搭建一個兼具IT中央以及業務側的分散數據分析團隊,以聯邦形式為業務側做出貢獻。業務側的同事應該更多關注如何快速部署、貢獻業務側相關數據、產生業務報表。所以,如果要搭建技術端的數據中臺,在“人”這一側、在組織架構這一側也要做相應努力。
更好地關聯數據,服務不同用戶
在本場數據中臺技術洞察媒體溝通會上,孫鑫還就記者普遍關注的Gartner組裝式數據分析進行了解讀。
孫鑫告訴記者,Gartner組裝式數據分析有一個基礎,即“數據編織”,其能夠幫助企業編織起一張基于知識圖譜的虛擬網,對企業所有的數據資產進行編織。孫鑫表示,Gartner的數據編織并非單純地把數據關聯在一起,而是更具情境化地利用知識圖譜能力對數據進行編織,涵蓋每一個數據消費行為的相關信息,而這些數據消費行為是企業的元數據。因此,此知識圖譜不僅僅建立在企業的數據本身,而是建立在數據消費行為之上。
孫鑫表示,如果企業要打通不同的系統,Gartner就會推薦使用數據編織這一設計理念,不僅能夠把數據全部收集在一起,而是還能夠對數據進行更好的關聯,從而能夠服務不同用戶。因此,數據編織是幫助用戶在合適的時間獲得合適大小的數據,并且根據用戶需求來及時提供,幫助企業、用戶獲得更具情境化的數據。
針對在中國很多企業習慣性的只用收集的方式管理自己的數據,無法把收集好的數據快速產生價值這一問題,孫鑫表示,好的數據管理模式應該是收集、采集以及連接的平衡,數據中臺對于數據管理而言,不一定要用連接或用收集,這就要求企業根據自己的業務特點掌握好平衡。
孫鑫強調,數據中臺可以根據元數據,即數據消費行為及機器生成的性能指標來判斷數據源到底用采集好、還是連接好?并通過元數據找到數據消費行為后,對其進行資產化處理。因此,數據中臺的演進方向是把握好數據采集和連接的平衡。
利用數據編織理論完善中臺建設
既然提出了數據編織理論,那么對于企業而言,如何利用Gartner提出的數據編織理論來完善中臺的建設?
孫鑫從利用知識圖譜找到真正需要復用的數據并指導業務,構建知識圖譜賦能的業務語義層,自助式分析與組裝式分析的平衡,數據中臺應該是個組裝式能力創新平臺,組裝式數據和分析正在塑造分析應用的未來,以及借助DevOps加速數據和分析應用的上線-DataOps這六個方面,進行了詳細的解讀。
談到組裝式數據分析的優勢,孫鑫表示,Gartner提到的組裝式數據分析正在塑造數據分析應用的未來。據介紹,“組裝式數據分析”底層依賴于Gartner提到的數據編織設計模式,上一層基于企業已經購買的類似于“報表平臺、分析工作站、自助式分析平臺”或“數據科學平臺”,因此它給用戶的體驗不再是這些技術平臺,而是一個能力平臺。這些能力平臺,將被“微服務”容器化,以高度的開放性確保用戶“上”到數據中臺后可以得到一個組裝式體驗。對于用戶而言,未來需要什么樣的能力,都能夠在數據中臺上找到,然后通過對能力進行組裝,從而完成各自業務領域想要的數據產品或分析產品。
“隨著快速搭建應用或快速建立數據產品需求的上漲,企業可以把DevOps實踐放到數據相關的應用上,Gartner稱之為DataOps。”孫鑫表示,企業可以把自己過去從應用開發中用到的一些實踐,如版本控制、持續集成、持續開發等能力,放到數據相關的應用開發中,讓用戶能快速地從測試階段走向生產階段。