關于DAMA參考數據和主數據管理的解讀和一些看法
參考數據管理是對定義的數據值域進行控制,包括對標準化術語、代碼值和其他唯一標識符以及每個取值的業務定義的控制,和對數據域值列表內部和跨不同列表之間的業務關系的控制;并且對準確、及時和相關參考數據值的一致,共享使用進行控制,以進行數據分類和目錄整編。
如參考數據-“ 訂單狀態 ”:新建立、處理中、完結、取消等。
主數據管理是對主數據值進行控制,以實現跨系統的一致、共享、上下文相關地使用主數據,以及對核心業務實體的真實情況的最準確、及時和相關的版本進行控制。
主數據一般包括下列實體的數據:
人,包括個人、組織及其角色,比如客戶、公民、病人、廠商、供應商、業務伙伴、競爭對手、員工和學生等。
產品,包括內部和外部的產品。
財務結構,例如總賬、成本中心、利潤中心等。
位置,例如地址信息
首先必須說明,單一的業務系統應該沒有主數據的概念,參考數據為了確保不同的業務采用同樣的控制模式,可以存在。
隨著業務系統的不斷增加,核心業務實體不斷被抽象出來,在不同業務系統之間實現業務實體的共享和流轉,就產生了主數據管理。
按照DAMA-DMBOK,理想的參考數據和主數據架構應該是這樣的。
參考數據和主數據只有一份正本,各業務系統只在這一份正本數據上進行相關業務操作,所有參考數據和主數據都是一致的。
但實際上主數據管理不是一蹴而就的,而且主數據的傳播跟業務也很大的相關性,實時性要求高的采用SOA總線接口方式,稍微差一些的采用消息隊列方式,批量數據的傳播則采用sftp/ftp方式,為了確保數據的一致性和版本管理,中間還構建了主數據管理平臺,逐漸的主數據管理就演變成了以下的架構方式。
這種架構方式看起來也很合理,但筆者在最近做主數據監控和管理過程中,發現了諸多問題,這些問題與主數據有關、與數據質量有關、和業務系統有關 、和業務部門有關、和數據治理組織也有關。
在前文中有一個統計數據,據統計數據質量問題76%來自數據錄入錯誤,53%來自源系統的變化,48%來自數據遷移或項目改建,46%來自用戶不同的期望,26%來自系統錯誤。
在主數據問題分析中,也可以大致分為存量數據問題、業務流程問題、技術問題、網絡問題。
網絡問題是造成主數據流轉出現問題的直接原因,網絡抖動和網絡問題時有發生,但不是主要問題,也可以通過重發機制,將數據彌補過來。
數量最多的是存量數據問題,這類問題大多數歷史遺留原因導致的,系統上線之初,未按照主數據的要求進行數據遷移,A、B、C要確保一致性,只有A表正常遷移了;但需要同步A、B、C表,下游缺乏B、C表內容,所以A表也無法同步下去,據統計存量數據問題約占了80%的數據量。
其次是技術問題,主數據從A系統分發到B系統,但B系統只負責接收,但實際上并未正確入庫,或者未正確返回狀態,這樣也會導致主數據不一致,上游的表結構修改也會導致此類問題發生。
最后是業務流程問題,A系統和B系統按照相關的業務規范實現數據流轉,但隨著業務的變化,A系統進行了相關修訂,但B系統認為此修訂與之無關,既然無關,部分數據可用可不用,所以干脆直接放棄好了。
后面的三類問題通過組織各個干系人,包括技術支撐部門、各業務部門、各業務廠家,終歸可以得到解決方案,但在實際解決過程中,常常面臨著職責不分,溝通協調機制、費用分攤等難題,導致看起來容易解決的問題,實際解決起來遙遙無期。
這就涉及到數據治理組織的問題了。
本文轉載自微信公眾號「追夢IT人」,可以通過以下二維碼關注。轉載本文請聯系追夢IT人公眾號。