數據治理≠數據管理≠數據資產管理,落地時才發現全理解錯了……
數據治理、數據管理、數據資產管理,有什么不同?這是一個我被問的最多的問題。
如果要用一張圖來描述它們三者之間的關系,你跟贊成以下兩幅圖的哪個?
如上圖1所示,數據治理包含數據管理,數據治理提出了數據管理的目標、架構和藍圖,數據管理是數據治理的技術實現,而數據資產管理是面向數據應用和數據價值的數據管理,屬于數據管理的一部分。
如上圖2所示,數據資產管理的范疇更大,數據資產管理是數據管理的延伸,而數據治理是確保數據能夠被管好的策略。
你認為這兩幅圖,哪個描述三者關系更準確呢?
如果三個不好比較,那我們把它拆開,兩兩比較,看一看數據治理、數據管理、數據資產管理,到底有何不同?
一、數據治理 VS 數據管理
觀點一:數據管理包含數據治理
業內主流觀點認為數據管理包含數據治理。以DAMA為代表,在DAMA-DMBOK2的數據管理框架(車輪圖)中,數據治理只是數據管理11個知識領域中的其中之一,如下圖:
來源:DAMA-DMBOK2
DAMA關于數據管理和數據治理的定義如下:
數據管理(Data Management)是為了交付、控制、保護并提升數據和信息資產的價值,在其整個生命周期中制訂計劃、制度、規程和實踐活動,并執行和監督的過程。
數據治理(Data Governance, DG)是指對數據資產管理行使權力和控制的活動集合(規劃、監督和執行)。
DAMA認為數據管理是管理從數據的獲取到數據的消除整個生命周期過程,而數據治理是為了確保組織對數據作出合理、一致的決策,也就是說數據治理是為了更好的管理數據,是數據管理的策略、規程或標準。
觀點二:數據治理包含數據管理
另一種不同的觀點則是認為數據治理包含數據管理。數據治理是為了實現數據資產價值最大化所開展的一系列持續工作過程,而數據管理是為了實現這一目標而開展的具體技術和業務活動。
數據治理為數據管理指明方向,指導、評估和監督數據管理的有效性;數據管理則通過計劃、建設、運營、監督來反饋管理的成效和問題。
筆者的觀點
如果我們用簡單的包含和被包含關系來理解數據治理和數據管理,確實會有一些爭議。筆者更喜歡用一個“金字塔”結構來理解它們:
金字塔頂層的應該是數據治理。與“治理”相關,我們還會經常看到、聽到國家治理、公司治理的概念,從某種意義上講,治理是一種自頂向下的策略或活動。如果我們將國家治理說成國家管理,把公司治理說成公司管控是不是有點怪怪的?因此,數據治理應該是頂層設計、戰略規劃方面的內容,是數據管理活動的總綱和指導,指明數據管理過程中哪些決策要被制定,以及由“誰”來負責,更強調數據戰略、組織模式、職責分工和標準規范。
數據管理是實現數據治理提出的決策,并給予反饋,強調管理流程和機制。數據管理涵蓋不同的領域,諸如:元數據管理、主數據管理、數據標準管理、數據質量管理、數據安全管理、數據服務管理等。數據管理是確保數據被管理和監控,從而讓數據得到更好的利用。
因此,數據治理強調頂層的策略,管理是側重于流程和執行,兩種相互作用、相輔相成的。而如今,我們聽到的更多的“數據治理”這個詞,似乎只要涉及與數據管理相關的,都在說自己在搞數據治理。出現這個問題,主要是企業越來越意識到傳統IT驅動或者說技術驅動的專項數據管理項目,在實施過程中很難推進、困難重重,并且很難解決業務和管理上的用數難的問題。而從戰略、組織入手的數據治理頂層設計,更有利于推動數據管理目標的實現。
二、數據、數據資源、數據資產
如果我們想更加深刻的理解數據資產管理與數據治理到底有啥不同,就必須先拎清楚“數據、數據資源、數據資產”的概念。
1、先說說數據
這里的數據是指“原始數據”,即:記錄事實的結果,用來描述事實的未經加工的素材。
數據有兩個特征:一是可以描述事實,二是未經加工。例如:開車時,車速傳感器記錄下來的你的車速;監控攝像頭錄下的一段視頻;氣溫計顯示的溫度;企業ERP系統的銷售訂單記錄等等,都屬于數據。
有人說:“未經加工的原始數據沒有任何意義”。這點我是不認同的,我認為原始數據并不是沒有意義,而是原始數據能發揮出價值是有限的(起碼它能夠描述事實)。但由于原始數據可能存在不能被人所識別,不能被計算機所保存,或者數據本身有質量缺陷等問題,因此,要讓數據產生更大的價值,就需要對其進行加工處理,形成更高價值的“信息”。
就像鐵礦石——它是有價值吧,但如果你不懂冶煉,不對它進行煉化和提純,那么從價值的角度,鐵礦石和普通的石頭也沒有太大差別。
2、數據資源
大數據領域首次提出了“數據資源”的概念,但是“數據資源”這個詞在很多材料中并沒有一個標準的定義。我理解的“數據資源”就是指數據本身,只不過這個數據是按照一定的目標,經過了一定的規劃設計,對數據進行采集、匯聚、存儲或處理后,形成了能夠被再次利用的數據。
例如:企業建設一個信息系統,需要設計系統的數據模型、結構、類型、存儲方式等,然后通過人們對系統的流程表單或頁面的各種操作,數據就被記錄和保存到了信息系統的數據庫中,成為了企業的數據資源。從這個層面講,企業過去的幾十年的所有“信息化”工作,都只是在做一件事情——實現數據“資源化”。
數據資源在一定程度上有“量大”的內涵,例如:我們經常聽新聞說XX地,礦產資源豐富,一定是說這個地方有大量礦產,而不是只有一塊礦石。如果只有一塊鐵礦石,即使你懂冶金,能夠對其進行煉化和提純,那它產生的價值也是有限的。
同樣,一條數據也不能稱為數據資源,數據資源必須有一定的量。例如:如果T寶、拼夕夕等電商平臺只對你的一次購物記錄進行分析的話,其實意義并不大,但如果把你每次的購物數據都被匯聚起來,進行融合性分析,就能輕松知道你的購物偏好,然后給你進行產品推薦,以實現他們所謂的“精準營銷”。
3、數據資產
數據資產的概念我們在之前文章中多次提到過:數據資產的是由企業合法擁有或控制并且能夠給企業帶來經濟效益和社會效益的數據資源。
數據資產管理研究的就是如何將數據資源轉化為數據資產的過程。
那么,數據資產之后呢,數據又將轉化成什么?
數據資產管理促進了數據的交易和流通,當數據交易和流通所需要市場環境、技術環境、法律環境都相應成熟的時候,數據資產就會轉為為企業的資本——數據資本。
三、從數據管理到數據資產管理
下面的這幅圖是我在廈門大學大數據百家講壇數據治理公益分享課中用的一張圖,它其實反應了從數據資源到數據資產轉化的過程。
1、數據資源化
通過數據管理對企業各個數據源進行采集、匯聚和處理,形成企業的統一數據資源庫。企業管理數據資源的目的在于數據應用,但在使用數據資源的時候,經常會發現有的數據業務無法識別,有的數據存在大量的質量問題,導致業務無法有效使用。這個時候就需要對數據進行治理。因此,數據治理是為了解決企業數據的質量問題而生!
2、數據資產化
由于數據從創建到消亡的整個生命周期中,從業務到技術,從管理到使用,每個環節都可能發生數據質量的問題。所以,數據治理就不再是簡單的技術問題了。也因此,數據治理更加注重對數據資源的整體規劃和與之相適應的保障體系的建設,例如數據戰略、數據架構、管理組織、管理流程、管理制度等。通過數據治理,打通數據孤島、提升數據質量,實現了數據為業務賦能,滿足了企業內部使用。這個時候企業的數據資源在一定程度上勉強可以稱為企業的資產了。
3、數據資本化
嚴格來講,數據資產的價值是應該具備可衡量性的,而滿足企業內部使用雖然體現了它的使用價值,但這個價值并不好衡量。因此,數據資產管理在數據治理和數據管理的基礎上進行了擴展,以價值為驅動,通過對數據資產進行有效管理和估值,促進數據資產交易和流通。
四、數據管理、數據治理、數據資產管理,到底有何不同?
業內的相關數據管理體系中,無論是數據管理,還是數據治理,亦或是數據資源管理、數據資產管理,基本都包含了元數據管理、數據標準管理、數據質量管理、數據安全管理等內容。
所以很多人都很疑惑,那這三個數據管理的相關概念到底有什么不同?
其實,在上文中基本也都交代了,如果您還覺得沒說清楚,我們再總結一下,筆者認為:從技術的角度,這幾個概念之間差別不大,主要的區別在于它們管理數據的目的和驅動力上。
- 數據管理是日常的數據管理相關操作和行為,為的就是把數據管起來,讓企業知道有哪些數據并確保數據不丟失,至于對如何使用這些數據,目的和需求似乎不是特別強烈。例如:有些大型企業很早設置的DBA崗位,而DBA的職責更多是管理系統的數據庫,如數據備份、還原等,還有就是數據集成。
- 數據資源管理與數據管理比較相似,但數據資源管理的目的性很強,它是應用驅動的,更加貼近業務。數據資源管理以業務的視角,對不同結構、不同類型、不同來源的數據進行歸納、整合和管理,讓業務人員也能容易識別和找到想要數據。
- 數據治理更多的是問題驅動的,根本目的就是為了提升數據質量和控制數據安全,側重于標準規范和保障體系的建設,促進企業內部的數據利用和交換共享。
- 數據資產管理是價值驅動,在數據管理、數據治理的基礎之上,更多的關注數據的確權問題、估值問題以及交易和流通問題。
以上就是筆者對數據管理、數據治理以及數據資產管理三個概念的一些淺薄理解。有不正確的地方,歡迎各位大佬批評指正。