2024年需要了解的16個頂級數據治理工具
數據治理是創建內部數據標準的過程,以及控制誰可以訪問數據以及如何在業務運營和分析應用程序中使用數據的策略,它通常包含數據質量改進計劃以及主數據管理(MDM)計劃。一個成功的數據治理計劃可確保數據一致、值得信賴和可用,并確保其使用符合數據隱私法和其他法規。
數據治理工具可以幫助公司自動化管理治理計劃的各個方面,這類軟件提供了幫助創建數據目錄和業務術語表、數據映射和分類、工作流管理、協作、流程文檔和開發數據治理策略的功能。數據治理軟件還可以與數據質量、MDM和元數據管理工具結合使用。
以下是16個重要的數據治理工具,按字母順序列出,并總結了它們的主要特性和功能。
1.Alation數據治理App
Alation成立于2012年,最初提供了一個數據目錄平臺,以幫助公司清點和提供對其數據的訪問。Alation Data Catalog仍然是其旗艦產品,但該公司在2021年9月發布了一個配套的數據治理工具。Alation數據治理應用軟件旨在簡化提供對IT系統中可靠數據的安全訪問的流程,包括混合云和多云計算環境中的數據。
Alation數據治理App的策略中心功能可用于創建治理策略并查看它們如何映射到特定的數據資產,該治理工具還包括一個數據管理工作臺,該工作臺提供自動數據管理功能,并使用人工智能和機器學習來根據數據使用情況識別潛在的數據管理人員。
此外,數據治理工具還包括以下功能:
·支持創建和配置數據治理工作流,無需任何編碼。
·一個數據治理項目的領導者可以用來跟蹤項目進展的儀表盤。
·通過Alation的專業服務部門提供相關的數據治理服務。
2.Ataccama One
顧名思義,Ataccama One的目標是通過在單一平臺中統一數據治理、質量、MDM和其他功能,成為滿足公司所有數據管理和治理需求的一站式商店,這款人工智能驅動的軟件在內部、云和混合環境中運行,專為數據專業人士設計,包括數據治理團隊、數據管家、數據科學家、其他數據分析師和數據工程師。
Ataccama One使公司能夠將其數據質量和MDM工作與數據目錄、數據集成功能、參考數據管理和數據可觀察性功能以及數據故事講述模塊結合在一起,該工具專為在企業范圍內部署和在高度監管的行業中使用而構建,其功能包括完整的審核歷史和基于角色的安全性。
它還包括以下功能:
·支持管理各種大數據平臺和數據湖環境中的數據。
·通過自動化和嵌入式智能實現“自動駕駛數據管理和治理”。
·平臺即服務部署選項,由供應商Ataccama管理基礎設施、管理和安全。
3. Apache Atlas
Apache Atlas是一個開源工具,它為具有數據密集型平臺的公司提供了一套基本的元數據管理和數據治理功能,它主要是為在Hadoop集群中使用而設計的,但它也可以與Hadoop生態系統之外的工具和進程交換元數據,以實現與其他分析應用系統的集成。
Hortonworks是一家大數據平臺供應商,于2019年被競爭對手Cloudera收購,最初在幾個用戶公司的幫助下開發了Atlas,該軟件于2015年移交給Apache軟件基金會進行進一步開發。通過使用Atlas,各公司可以對數據資產進行編目、分類和管理,并提供與數據有關的協作能力,供數據科學家、其他分析師及其數據治理團隊使用。
Atlas還提供以下功能:
·定義和管理用于元數據對象的模型的靈活類型系統。
·自動支持對數據資產和數據沿襲信息進行編目。
·與Apache Ranger數據安全框架集成,實現訪問控制和數據屏蔽。
4.Axon數據治理
Informatica吹捧Axon數據治理是一種工具,可以幫助公司在企業范圍內向最終用戶和數據管理員交付可信數據。Informatica在2017年收購原始開發商Diaku時收購了這項技術,它使用人工智能驅動的自動化來協助管家進行數據發現、數據質量評估和溝通,它還使治理團隊能夠創建經過管理的數據市場,以幫助業務和分析用戶查找、訪問和了解數據。
數據治理團隊還可以使用Axon工具開發通用數據字典、定義數據元素之間的連接、識別數據集中的差距并將治理策略鏈接到它們所影響的數據,此外,還可以創建端到端業務流,以提供數據沿襲的可視化視圖。
Axon數據治理中的其他功能包括:
·能夠根據業務定義生成數據質量指標,然后自動測量和監控質量水平。
·數據隱私保護能力,確保用戶了解潛在的隱私風險,并分析數據變更的合規影響。
·與其他Informatica產品整合,包括其數據目錄、數據質量和數據準備工具。
5.ColLibra數據治理
人們經常說,數據科學家把大部分時間花在尋找、清理和公司數據上。ColLibra旨在改變這一點,并通過ColLibra數據治理幫助公司向他們和其他最終用戶提供受信任的數據,這是其數據智能云平臺的一部分。根據ColLibra的說法,數據治理工具可以用來操作治理工作流程和流程,創建關于數據資產的共享語言,并使查找和理解相關數據變得更容易。
該工具包括用于定義和管理業務術語的業務術語表,以及用于文檔元數據的數據字典,它還提供參考數據管理功能、用于報告和解決數據問題的“數據服務臺”功能,以及用于分析在業務流程中使用個人數據帶來的潛在隱私風險的ColLibra評估模塊。
此外,ColLibra數據治理還提供以下功能:
·數據管家管理職能,包括為數據管家分配角色和職責的能力。
·策略管理器應用程序,支持數據策略和標準的集中管理,以及對采用和合規性的監控。
·與ColLibra的數據目錄、數據沿襲和數據質量工具集成,作為數據智能云平臺的一部分。
6. Data360 Govern
所有成功的關系都建立在信任的基礎上,而這正是軟件供應商Data360 Govern將幫助培育數據資產的承諾。2021年收購Infogix時,精準收購了數據治理工具,以及數據質量和分析產品,這些產品也是Data360投資組合的一部分。Data360 Govern是精準的數據完整性套件的一部分——七項可互操作的服務,以提供準確的數據,包括數據集成、可觀察性、治理、質量、豐富、地理尋址和空間分析,它使公司能夠創建企業數據治理框架,該框架還包括數據目錄和元數據管理功能。
該工具實時跟蹤數據如何支持各種業務流程和結果,以幫助公司實現其業務目標,并提供可定制的儀表板和報告,以呈現個性化的洞察,它還可以自動執行數據管理工作流程、元數據采集以及從配套的Data360 DQ+軟件和來自Precision或競爭對手供應商的其他數據質量工具導入數據質量分數。
Data360治理中內置的其他關鍵功能包括:
·公司中業務術語表的自動管理和數據流的可視化。
·3D數據沿襲功能,還包含流程圖和影響分析功能。
·靈活的元模型,可配置為反映公司的業務模型,以幫助簡化數據治理流程。
7. Erwin Data Intelligence
偉大的文學偵探夏洛克·福爾摩斯的粉絲們都知道,他具有非凡的洞察力和觀察力。Quest Software承諾與其企業數據治理工具Erwin Data Intelligence提供類似的功能,該公司聲稱,該工具“提供數據意識、能力和知識,以推動公司中的數據治理和業務支持”。
Quest的正式名稱為Erwin Data Intelligence,該軟件將獨立的Erwin數據目錄、數據素養和數據質量產品組合在一個集成套件中,它旨在幫助IT和數據治理團隊使可用數據資產對最終用戶更可見,并提供有關其使用的指導,并提供治理控制以確保用戶遵循內部數據策略和最佳實踐。可以創建基于角色的視圖,以便為不同的用戶組添加有關相關數據的上下文。
Erwin Data Intelligence還包括以下功能:
·用于收集和編目元數據、生成數據沿襲細節以及進行數據分析和數據質量評估的自動化功能。
·元數據驅動的數據流映射,以幫助數據集成和數據譜系記錄。
·數據管理功能,以及指派數據所有者和主題專家幫助管理數據資產的能力。
8.IBM Cloud Pak for Data
IBM Cloud Pak for Data是一個云原生平臺,支持數據治理、質量和隱私計劃以及數據集成、客戶數據管理和AI治理,該軟件建立在數據結構技術基礎上,包括人工智能驅動的數據發現、分析和編目功能,它還提供元數據豐富、數據質量管理和數據沿襲功能,以及用于管理數據策略的工具,作為數據保護和法規遵從性工作的一部分。
此外,IBM工具可用于創建自動拒絕數據訪問或向未經授權的用戶屏蔽數據的規則,另一方面,它包括旨在簡化授權用戶對可信數據集的訪問并幫助他們理解和使用數據的功能,例如,可以創建數據可視化來顯示不同數據元素之間的關系。
IBM Cloud Pak為數據提供的其他功能包括:
·自動評估數據隱私風險,并針對已確定的風險提出緩解建議。
·支持云、內部部署和混合云部署。
·計劃與IBM子公司Databand的數據可觀察性工具集成。
9.OneTrust數據治理
OneTrust數據治理將人工智能驅動的數據發現和分類功能與集成的數據目錄和一組數據治理策略管理功能相結合,它是OneTrust提供的廣泛產品組合的一部分,OneTrust還支持公司中的數據隱私、風險管理和相關計劃。與該公司的其他產品一樣,數據治理工具由人工智能、機器學習和機器人流程自動化引擎提供支持。
該引擎可以自動查找應用程序和數據存儲并清點其數據資產,然后應用人工智能和機器學習模型對數據集進行分類、分類、豐富和標記。完成后,可以使用OneTrust數據治理來填充數據目錄和詳細的數據字典,將目錄鏈接到業務術語表,并根據數據的分類方式自動應用治理策略和控制。
OneTrust數據治理還包括以下功能:
·500多個預置連接器,以及使用拖放式工作流構建器創建自定義連接器的能力。
·建立數據所有權和管理責任的協作工作流程。
·用于創建數據譜系圖和生成法規遵從性報告的功能。
10.Oracle Enterprise元數據管理
Oracle企業元數據管理(OEMM)使公司能夠從Oracle和非Oracle系統中的關系數據庫、數據倉庫、Hadoop群集、BI平臺和其他數據源獲取、編目和管控元數據,該工具還包括交互式搜索和瀏覽器功能,可用于探索元數據和訪問模型圖,以及元數據報告功能,此外,它還提供數據沿襲跟蹤和影響分析功能。
OEMM提供了一套協作式數據治理和管理功能,包括注釋元數據和標記元數據、添加有關數據的注釋以及創建內部數據審查委員會的能力,該軟件還可以從Oracle和第三方系統導入現有的元數據標準,并使治理團隊能夠構建支持語義譜系分析的業務術語表。
OEMM提供的其他功能包括:
·可以將來自不同來源的元數據拼接在一起的算法,以顯示數據通過系統的完整路徑。
·對元數據模型進行版本控制,以進行合規和性能優化方面的比較。
·與Oracle Enterprise Data Quality集成,以支持全面的數據治理管理方法。
11. Rocket Data Intelligence
Rocket Software將Rocket Data Intelligence描述為解決“數據不信任”的方法。正如該公司指出的那樣,創建和收集的大量數據往往沒有得到利用,因為業務經理、數據科學家和其他最終用戶要么找不到它,要么不理解和信任它。Rocket DI,簡稱為Rocket DI,旨在通過一系列元數據管理、數據沿襲和數據治理功能來幫助公司解決這些問題。
元數據驅動的軟件在數據通過IT系統時生成端到端的數據視圖,可用于提供有關數據的業務意義的信息,并對其使用進行保護,例如,內置的數據治理工作流和數據管理功能使治理團隊能夠管理與數據相關的問題、批準業務術語表條目以及處理其他任務。Rocket DI還支持基于角色的訪問控制,用于設置用戶對特定數據集的權限。
Rocket在2021年收購ASG Technologies時收購了該工具,該工具提供的其他關鍵功能包括:
·企業元數據存儲庫,以及對從260多個數據源獲取元數據的自動支持。
·自動化數據沿襲文檔,將可視化數據流映射到業務環境。
·跟蹤數據收集、存儲、訪問和使用情況,以遵守數據隱私法。
12.SAP主數據治理
與其名稱一致,SAP主數據治理專為幫助公司治理和管理主數據而設計,作為MDM計劃的一部分,該工具可用于整合來自不同源系統的主數據,并對其進行集中管理,同時還包括內置的數據質量管理功能,它是SAP業務技術平臺的一部分,該平臺涵蓋了廣泛的數據管理、分析、人工智能和相關技術。
SAP提供了兩個版本的治理工具——一個運行在其旗艦產品S/4HANA ERP系統之上,另一個云版本可以使用中心輻射式方法支持主數據治理環境的聯合網絡。在這種設置中,一個中央系統管理核心主數據屬性,而特定于應用程序的屬性由業務單位和部門中的單獨治理系統管理。
SAP主數據治理還包括以下功能:
·預置數據模型、業務規則、治理工作流程和用戶界面,以幫助簡化部署。
·協作工作流路由和通知功能,幫助實施經過驗證的數據值。
·與配套的SAP主數據集成工具集成,將集成和治理功能結合在一起。
13.SAS信息治理
通過其SAS信息治理工具,軟件供應商SAS Institute旨在幫助業務和分析用戶減少查找和評估數據的時間,而將更多時間用于分析工作,同時使數據管理員和數據治理團隊能夠確保數據資產得到保護和正確使用。治理軟件作為單獨的產品出售,也作為標準組件或可選的附加組件捆綁到幾個SAS分析工具中。
該工具包括一個數據目錄,可以自動爬行數據源、對數據進行分類和識別敏感信息。最終用戶可以搜索目錄中的元數據以查找相關數據以及報告和其他分析資產,搜索結果提供有關數據質量、使用指標等的信息,以幫助用戶確定識別的數據是否適合其分析需求。
SAS信息治理還提供以下功能:
·內置數據質量、集成和沿襲工具,以及提供所需數據準備步驟視圖的自助式用戶界面。
·從數據目錄中的數據資產一鍵訪問SAS Viya分析應用程序。
·將SAS Viya連接器連接到Egeria開源元數據管理器,以實現不同工具之間的元數據共享。
14.Semarchy XDM
Semarchy XDM是Semarchy United數據平臺的數據管理和治理組件,它將其與用于數據集成的配套XDi工具結合在一起。XDM軟件通過內置的工作流程和數據豐富功能,在單一環境中支持數據治理、MDM、參考數據管理和數據質量計劃。
該工具使公司能夠為特定領域或業務用例構建具有嵌入式規則、策略和工作流的數據模型它還可以,促進協作治理流程和儀表板的開發,以可視化數據指標,其中包括一個元數據存儲庫,以及用于不同數據模型的各個數據存儲,后者還捕獲有關數據沿襲的信息,并且可以將多個數據存儲附加到單個元數據存儲庫。
Semarchy XDM中提供的其他功能包括:
·支持在本地、云中或作為托管服務進行部署。
·基于角色的用戶權限,以及合規報告功能。
·批量和實時API,實現應用和業務流程的雙向集成。
15. Syniti知識平臺
Syniti Knowledge Platform提供全套數據管理功能,包括以嵌入式數據目錄為基礎的數據治理功能。Syniti軟件可以從數百個源系統獲取數據并自動生成元數據,然后使用由機器學習算法驅動的額外自動化來幫助構建將元數據與公司的業務流程和術語相關聯的語義模型。
該軟件還使公司能夠將版本控制應用于數據質量和治理規則,跟蹤數據沿襲和審計數據集及其使用情況,以實現法規遵從性目的。Syniti于2019年更名為BackOffice Associates,它還提供相關的Data JumpStart服務,包括預構建的報告和儀表板,以加快數據質量、MDM和數據治理計劃,并幫助構建擴展這些計劃的業務案例。
Syniti Knowledge Platform還包括以下治理相關功能:
·協作功能,包括可用于眾包數據洞察和最佳實踐的自動化工作流。
·一套標準的數據智能儀表盤,并支持創建自定義儀表盤。
·自動收集有關數據遷移的詳細信息,以確保它們與公司的數據治理戰略保持一致。
16.Talend數據交換矩陣
Talend Data Fabric將數據集成、數據質量和數據治理技術與應用程序和API集成模塊結合到一個平臺中。正如Talend所說,該平臺的數據完整性和治理工具結合了自動質量檢查和其他數據質量功能,以幫助公司確保數據干凈和值得信賴。然后,他們可以使用該工具來管理治理和數據管理流程。
該軟件包括一個數據目錄,可以自動爬行、公司和豐富元數據。數據庫存功能支持元數據管理并可以識別數據孤島,它還通過Talend Trust Score提供有關數據可信度的信息,Talend Trust Score是一個基礎平臺功能,可計算數據集可靠性的一目了然的分數。數據管理功能包括用于設置優先級和跟蹤項目的基于團隊的工作流,以及管理監控功能。
Talend Data Fabric的治理工具還具有以下功能:
·自助式數據準備和管理,包括能夠與其他用戶共享準備和管理的數據集。
·數據沿襲跟蹤和合規跟蹤,以支持數據隱私和合規工作。
·基于角色的訪問控制和基于工作流的數據管理,幫助保護數據免受未經授權的使用。