成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

數(shù)據(jù)編織技術(shù):數(shù)據(jù)虛擬化在數(shù)據(jù)治理實踐中的應(yīng)用

大數(shù)據(jù)
本文將深入探討 Denodo 在數(shù)據(jù)治理和數(shù)據(jù)虛擬化方面的解決方案,闡釋邏輯數(shù)據(jù)編織的理念、優(yōu)勢以及其在企業(yè)中的實際應(yīng)用。

 在當(dāng)今數(shù)字化轉(zhuǎn)型的浪潮中,企業(yè)在數(shù)據(jù)治理方面面臨諸多挑戰(zhàn),Denodo 作為數(shù)據(jù)虛擬化領(lǐng)域的領(lǐng)導(dǎo)者,致力于通過邏輯數(shù)據(jù)編織技術(shù),幫助企業(yè)更高效地管理和利用數(shù)據(jù)資產(chǎn)。本文將深入探討 Denodo 在數(shù)據(jù)治理和數(shù)據(jù)虛擬化方面的解決方案,闡釋邏輯數(shù)據(jù)編織的理念、優(yōu)勢以及其在企業(yè)中的實際應(yīng)用。

一、當(dāng)前數(shù)據(jù)環(huán)境和數(shù)據(jù)挑戰(zhàn)的理解

1. 當(dāng)前數(shù)據(jù)環(huán)境的多重挑戰(zhàn)

圖片

在當(dāng)前的數(shù)據(jù)環(huán)境中,數(shù)據(jù)治理的關(guān)鍵挑戰(zhàn)在于數(shù)據(jù)的移動、分散和多樣化。隨著技術(shù)、資源和用戶需求的變化,企業(yè)不斷將數(shù)據(jù)從一個地方轉(zhuǎn)移到另一個地方,以實現(xiàn)數(shù)據(jù)的管理、應(yīng)用和共享。然而,數(shù)據(jù)的持續(xù)遷移使數(shù)據(jù)治理變得更加復(fù)雜。

首先,從數(shù)據(jù)環(huán)境的變化來看,數(shù)據(jù)量呈現(xiàn)出爆炸式增長的趨勢。據(jù) IDC 報告顯示,亞太地區(qū) 2022 年的數(shù)據(jù)產(chǎn)量達(dá)到 41.4 ZB,預(yù)計到 2025 年將翻倍至 96.4 ZB。同時,數(shù)據(jù)產(chǎn)生和存儲的形式也日益分散化。預(yù)計到 2025 年,在全球各個邊緣節(jié)點上產(chǎn)生的數(shù)據(jù)量將從 2021 年的 12.4 ZB 增至 40 ZB。這種數(shù)據(jù)分散化的現(xiàn)象不僅源于傳統(tǒng)的人為輸入,還包括大量來自傳感器、社交媒體和線上線下應(yīng)用等多種渠道的數(shù)據(jù)。

此外,云端數(shù)據(jù)的快速增長也進(jìn)一步加劇了數(shù)據(jù)環(huán)境的復(fù)雜性。預(yù)計到 2025 年,云端數(shù)據(jù)將占全球數(shù)據(jù)總量的 55%。然而,這意味著剩余的 45% 數(shù)據(jù)并未存儲在云端,企業(yè)在管理這些數(shù)據(jù)時需要面對云端與非云端數(shù)據(jù)之間的分布式特性。對于企業(yè)來說,如何有效管理和利用這些分散的數(shù)據(jù)資產(chǎn)成為一個亟需解決的問題。

其次,數(shù)據(jù)的多樣化形式對數(shù)據(jù)治理提出了更高要求。過去,結(jié)構(gòu)化數(shù)據(jù)占據(jù)主導(dǎo)地位,而如今,非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù)的比重不斷增加。例如,企業(yè)在云端或不同系統(tǒng)中存儲的數(shù)據(jù),不再局限于傳統(tǒng)的數(shù)據(jù)庫形式,更多的是通過 API 等方式進(jìn)行訪問和集成。這種數(shù)據(jù)訪問方式的變化,使得企業(yè)在數(shù)據(jù)治理中需要考慮如何管理和利用這些多模態(tài)數(shù)據(jù)。

最后,數(shù)據(jù)的實時性成為當(dāng)前數(shù)據(jù)環(huán)境的另一重要特征。2020 年,在移動平臺上產(chǎn)生了 6.7 ZB 的數(shù)據(jù),這直接推動了云端應(yīng)用的發(fā)展。預(yù)計到 2025 年,25% 的原始數(shù)據(jù)將包含實時數(shù)據(jù)。實時數(shù)據(jù)的激增要求企業(yè)在數(shù)據(jù)治理方案中納入對實時數(shù)據(jù)的管理和分析,以提高數(shù)據(jù)的價值。

綜合來看,當(dāng)前數(shù)據(jù)環(huán)境面臨著數(shù)據(jù)量激增、數(shù)據(jù)分散、多樣化和實時化等多重挑戰(zhàn)。在這種背景下,企業(yè)需要制定新的數(shù)據(jù)治理策略,以在確保數(shù)據(jù)安全和合規(guī)的同時,提高數(shù)據(jù)的利用效率,降低數(shù)據(jù)管理的成本。

2. 數(shù)據(jù)治理需求的演變

圖片

在當(dāng)前的數(shù)據(jù)治理中,業(yè)務(wù)部門和 IT 部門對數(shù)據(jù)的需求和挑戰(zhàn)正在發(fā)生變化。業(yè)務(wù)部門要求更高的數(shù)據(jù)敏捷性和質(zhì)量,希望能夠快速獲取準(zhǔn)確的數(shù)據(jù)以支持業(yè)務(wù)決策。此外,數(shù)據(jù)的使用不應(yīng)依賴少數(shù)數(shù)據(jù)科學(xué)家,強調(diào)數(shù)據(jù)民主化,讓更多非 IT 專業(yè)人員也能輕松使用數(shù)據(jù)。這種需求推動數(shù)據(jù)治理走向降低使用門檻,讓更廣泛的用戶能夠更快地消費和利用數(shù)據(jù)。

IT 部門則面臨著數(shù)據(jù)體量增加和數(shù)據(jù)重復(fù)移動、復(fù)制導(dǎo)致的成本問題。傳統(tǒng)的數(shù)據(jù)治理方式往往涉及數(shù)據(jù)復(fù)制,如 ETL、ELT 等過程,但這種方式在面對大規(guī)模數(shù)據(jù)時成本高昂。因此,IT 部門需要思考是否有更包容、更優(yōu)化的治理方法,減少對數(shù)據(jù)的物理復(fù)制,尤其是提前量的對原始數(shù)據(jù)級別的全量復(fù)制行為,以此降低數(shù)據(jù)管理的整體成本。

除了業(yè)務(wù)部門和 IT 部門的需求,數(shù)據(jù)合規(guī)和安全問題也日益突出。首席數(shù)據(jù)官(CDO)和首席風(fēng)險官(CRO)角色的出現(xiàn),反映了企業(yè)對數(shù)據(jù)合規(guī)和安全的重視。隨著企業(yè)在全球范圍內(nèi)的擴(kuò)張,數(shù)據(jù)跨境傳輸帶來了合規(guī)和安全挑戰(zhàn)。不同國家和地區(qū)的數(shù)據(jù)法規(guī)(如中國的 PIPL、歐洲的 GDPR、美國的 CCPA)對數(shù)據(jù)的存儲、傳輸和訪問提出了嚴(yán)格的要求。企業(yè)必須在全球不同地區(qū)的數(shù)據(jù)治理中遵守各自的法規(guī),以確保數(shù)據(jù)的合法合規(guī)。這些法規(guī)對數(shù)據(jù)的存儲和跨境訪問提出了限制,使得數(shù)據(jù)治理策略更加復(fù)雜。綜合這些變化,數(shù)據(jù)治理方法、理念和架構(gòu)需要不斷演進(jìn),以適應(yīng)業(yè)務(wù)敏捷性、數(shù)據(jù)合規(guī)、安全管理等多維度的需求。

3. 分布式數(shù)據(jù)環(huán)境的現(xiàn)代化策略

圖片

Denodo 提出的解決方案數(shù)據(jù)虛擬化技術(shù)為數(shù)據(jù)治理提供更多的選擇。數(shù)據(jù)虛擬化是一種讓數(shù)據(jù)可以在不進(jìn)行物理復(fù)制的情況下被訪問和管理的技術(shù),這種方式為企業(yè)帶來了優(yōu)化數(shù)據(jù)治理的能力。現(xiàn)代數(shù)據(jù)架構(gòu)需要應(yīng)對兩個核心問題:首先,接受分布式數(shù)據(jù)環(huán)境已成為必然。由于技術(shù)、安全合規(guī)、數(shù)據(jù)使用等多重原因,數(shù)據(jù)很難實現(xiàn)物理集中,強行集中不僅成本高昂,還會帶來復(fù)雜的風(fēng)險。企業(yè)必須坦然接受分布式數(shù)據(jù)環(huán)境,承認(rèn)數(shù)據(jù)在物理上是分散的。

其次,雖然數(shù)據(jù)在存儲層面是分布的,但在訪問、管理、治理層面仍需實現(xiàn)統(tǒng)一。若企業(yè)需要訪問多個分布在不同環(huán)境甚至跨境的數(shù)據(jù)源,點對點的連接方式將導(dǎo)致訪問網(wǎng)絡(luò)復(fù)雜且混亂,不利于清晰地掌控數(shù)據(jù)的使用情況。因此,在邏輯層面上集中數(shù)據(jù)的訪問和管理是關(guān)鍵。這就是邏輯數(shù)據(jù)管理的核心思想,它允許在分布式數(shù)據(jù)環(huán)境下實現(xiàn)數(shù)據(jù)的集中化使用,滿足業(yè)務(wù)對數(shù)據(jù)敏捷性和準(zhǔn)確性的需求。

邏輯數(shù)據(jù)管理并非新概念,已經(jīng)被全球頂級數(shù)據(jù)管理咨詢機構(gòu)(如 Gartner、Forrester 等)討論多年,并經(jīng)歷了不同發(fā)展階段,包括邏輯數(shù)據(jù)倉庫、邏輯數(shù)據(jù)編織和數(shù)據(jù)網(wǎng)格等理念。Denodo 將在后續(xù)的討論中詳細(xì)闡述這些概念,幫助企業(yè)更好地理解邏輯數(shù)據(jù)管理在現(xiàn)代數(shù)據(jù)治理中的重要性。

二、邏輯數(shù)據(jù)編織優(yōu)勢

1. 數(shù)據(jù)編織的優(yōu)勢

邏輯數(shù)據(jù)編織在現(xiàn)代數(shù)據(jù)架構(gòu)中具有顯著優(yōu)勢,尤其是在數(shù)據(jù)治理和數(shù)據(jù)管理方面。根據(jù) Gartner 2021 年的報告,邏輯數(shù)據(jù)編織借助邏輯集中化的數(shù)據(jù)訪問,實現(xiàn)了治理、審計、追蹤、安全性和監(jiān)控的統(tǒng)一管理。具體優(yōu)勢如下:

  • 統(tǒng)一的業(yè)務(wù)語義和安全性:邏輯數(shù)據(jù)編織提供了對數(shù)據(jù)治理的單一接入點。盡管數(shù)據(jù)存儲是分布式的,但數(shù)據(jù)的訪問和管理通過邏輯集中化實現(xiàn)統(tǒng)一。這種統(tǒng)一性確保了業(yè)務(wù)語義的一致性,并強化了數(shù)據(jù)的安全性。
  • 敏捷性與縮短交付時間:邏輯數(shù)據(jù)編織大幅提升數(shù)據(jù)交付的敏捷性。它有效縮短了從需求提出到實現(xiàn)交付的周期(TTM,Time to Market),從而使數(shù)據(jù)在更短時間內(nèi)為業(yè)務(wù)提供支持,提高了組織的響應(yīng)速度和競爭力。
  • 易于業(yè)務(wù)人員使用:邏輯數(shù)據(jù)編織為業(yè)務(wù)人員提供了一種更友好的數(shù)據(jù)消費方式。它使用標(biāo)準(zhǔn)化、統(tǒng)一的業(yè)務(wù)語言和訪問請求,使得業(yè)務(wù)人員無需深入掌握技術(shù)細(xì)節(jié),也能有效利用和消費數(shù)據(jù)。
  • 面向未來的架構(gòu)設(shè)計:邏輯數(shù)據(jù)編織是一種面向未來的數(shù)據(jù)管理方法。其架構(gòu)設(shè)計靈活,能夠適應(yīng)技術(shù)發(fā)展和基礎(chǔ)架構(gòu)的變更,為企業(yè)提供了持續(xù)發(fā)展的空間,確保數(shù)據(jù)系統(tǒng)在未來的可擴(kuò)展性和可維護(hù)性。

2. 邏輯數(shù)據(jù)倉庫(LDW)架構(gòu)

圖片

(1)邏輯數(shù)據(jù)倉庫(LDW)架構(gòu)

在數(shù)據(jù)管理的架構(gòu)設(shè)計中,邏輯數(shù)據(jù)倉庫(Logical Data Warehouse, LDW)是一種常見的實現(xiàn)方式,它通過統(tǒng)一的數(shù)據(jù)管理和訪問層整合了多種數(shù)據(jù)源。構(gòu)建邏輯數(shù)據(jù)倉庫并不意味著物理數(shù)據(jù)倉庫的消失,物理數(shù)據(jù)倉庫在 LDW 架構(gòu)中依然存在,甚至可以與數(shù)據(jù)湖等物理存儲環(huán)境共存。通過虛擬化層的整合,這些物理存儲成為一個統(tǒng)一的邏輯數(shù)據(jù)環(huán)境。

在 LDW 架構(gòu)中,左側(cè)為各種數(shù)據(jù)源,包括物理數(shù)據(jù)倉庫和數(shù)據(jù)湖,右側(cè)則是數(shù)據(jù)應(yīng)用。架構(gòu)中的核心是中間的虛擬化層,它提供了一個統(tǒng)一的數(shù)據(jù)訪問界面,無論數(shù)據(jù)位于倉庫、數(shù)據(jù)湖,還是直接來自業(yè)務(wù)系統(tǒng)的數(shù)據(jù)源,用戶都能在這個邏輯環(huán)境中進(jìn)行訪問。

這一架構(gòu)的靈活性體現(xiàn)在數(shù)據(jù)的跨源訪問和異構(gòu)整合上,用戶可以快速有效地組織和查詢來自不同源的數(shù)據(jù)。甚至在某些情況下,數(shù)據(jù)不必首先進(jìn)入數(shù)據(jù)倉庫或數(shù)據(jù)湖,而是可以直接從業(yè)務(wù)系統(tǒng)中進(jìn)行訪問,這使得數(shù)據(jù)的處理和響應(yīng)更加靈活和高效。

LDW 并不是一個全新的概念,早在 2010 年,全球范圍內(nèi)已經(jīng)開始廣泛應(yīng)用這一技術(shù)架構(gòu)。LDW 的興起很大程度上是因為物理數(shù)據(jù)倉庫建設(shè)成本高昂。隨著數(shù)據(jù)量的增長,數(shù)據(jù)倉庫的維護(hù)費用,包括人力、存儲和時間的成本,都會顯著上升。例如,許多企業(yè)存儲了十年以上的歷史數(shù)據(jù),盡管實際使用中可能只需要近三個月或三年的數(shù)據(jù)。對于領(lǐng)導(dǎo)層來說,常常只關(guān)注最新的數(shù)月數(shù)據(jù),而對更久遠(yuǎn)的數(shù)據(jù)需求較少。然而,一些中層管理人員或者具體執(zhí)行層面的人,比如財務(wù)部門,可能需要查看較長時間跨度的數(shù)據(jù)。面對這些不同層級的需求,繼續(xù)將所有數(shù)據(jù)存放在高成本的物理數(shù)據(jù)倉庫中顯然是不合理的。

(2)數(shù)據(jù)分區(qū)與虛擬化層的實現(xiàn)

邏輯數(shù)據(jù)倉庫的一個關(guān)鍵優(yōu)勢在于,它能夠基于數(shù)據(jù)的使用場景和需求,靈活分配數(shù)據(jù)存儲資源。這種分配可以通過不同的分區(qū)策略實現(xiàn),比如水平分區(qū)和垂直分區(qū)。以水平分區(qū)為例,LDW 允許我們在保持?jǐn)?shù)據(jù)結(jié)構(gòu)一致的前提下,將數(shù)據(jù)根據(jù)不同條件分配到不同的存儲環(huán)境中。

舉例來說,企業(yè)可以將最核心的、高訪問頻率的數(shù)據(jù)保存在性能更高的物理數(shù)據(jù)倉庫中,而將歷史性或低頻訪問的數(shù)據(jù)存儲在如 Hadoop 集群這樣的低成本環(huán)境中。對于三年以上的歷史數(shù)據(jù),由于訪問頻率較低,用戶對查詢響應(yīng)時間的容忍度相對較高,因此不需要保存在高性能系統(tǒng)中。然而,領(lǐng)導(dǎo)層可能對實時數(shù)據(jù)的響應(yīng)時間要求非常高,延遲幾秒鐘就可能影響他們的決策,因此這些數(shù)據(jù)必須保存在高效的物理倉庫中。而對于需要查詢多年歷史數(shù)據(jù)的財務(wù)或操作人員,即使系統(tǒng)響應(yīng)稍慢也可以接受,這樣的數(shù)據(jù)就可以被轉(zhuǎn)移到更具性價比的存儲系統(tǒng)中。

在邏輯數(shù)據(jù)倉庫的虛擬化層中,用戶不必關(guān)心數(shù)據(jù)究竟存儲在數(shù)據(jù)倉庫還是數(shù)據(jù)湖中。虛擬化層會根據(jù)用戶的請求自動決定數(shù)據(jù)的訪問路徑。用戶可以同時查詢物理數(shù)據(jù)倉庫和數(shù)據(jù)湖中的數(shù)據(jù),而這一過程對用戶來說是透明的。這樣的設(shè)計確保了數(shù)據(jù)的靈活整合和高效訪問,減少了跨源查詢的復(fù)雜性。

(3)LDW 構(gòu)建的核心要素

在邏輯數(shù)據(jù)倉庫的建設(shè)過程中,虛擬化層的實現(xiàn)涉及三項核心任務(wù):

  • 業(yè)務(wù)邏輯的設(shè)計與統(tǒng)一建模:邏輯數(shù)據(jù)倉庫中的數(shù)據(jù)訪問是通過一種業(yè)務(wù)語言進(jìn)行的。無論數(shù)據(jù)是存儲在物理數(shù)據(jù)倉庫中,還是在數(shù)據(jù)湖中,邏輯數(shù)據(jù)倉庫需要將這些數(shù)據(jù)抽象成統(tǒng)一的業(yè)務(wù)模型。這個模型必須是面向業(yè)務(wù)的,方便業(yè)務(wù)人員理解和操作,保證用戶能夠以一致的方式訪問所有數(shù)據(jù)源。
  • 自動化處理與優(yōu)化:在邏輯數(shù)據(jù)倉庫的環(huán)境中,數(shù)據(jù)訪問的自動化優(yōu)化至關(guān)重要。用戶發(fā)出的查詢請求并不會直接指向某個特定的數(shù)據(jù)源,而是通過虛擬化層的自動化機制決定應(yīng)該從哪里提取數(shù)據(jù)。根據(jù)用戶的查詢條件,系統(tǒng)會自動判斷是否從物理數(shù)據(jù)倉庫或數(shù)據(jù)湖中獲取數(shù)據(jù),從而提高訪問效率。用戶不需要理解這些數(shù)據(jù)是如何分布的,也不需要手動指定數(shù)據(jù)的來源,這一切都是在后臺通過智能優(yōu)化完成的。
  • 數(shù)據(jù)管理與治理:邏輯數(shù)據(jù)倉庫的另一重要功能是數(shù)據(jù)管理和治理,包括數(shù)據(jù)安全、監(jiān)控、審計和數(shù)據(jù)治理。由于邏輯數(shù)據(jù)倉庫可能會涉及多個數(shù)據(jù)源,因此在保證數(shù)據(jù)訪問效率的同時,還需要確保數(shù)據(jù)的安全性和合規(guī)性。虛擬化層會對數(shù)據(jù)訪問進(jìn)行監(jiān)控和審計,保證數(shù)據(jù)治理的完整性和安全性,確保數(shù)據(jù)訪問符合企業(yè)的合規(guī)要求。

通過這三大核心要素的構(gòu)建,邏輯數(shù)據(jù)倉庫能夠有效解決物理數(shù)據(jù)倉庫帶來的存儲和維護(hù)成本問題,提供了一個靈活的、面向業(yè)務(wù)的統(tǒng)一數(shù)據(jù)訪問平臺。它不僅優(yōu)化了跨源數(shù)據(jù)的查詢和管理,還為企業(yè)提供了高效的數(shù)據(jù)整合方案,滿足了不同層級的業(yè)務(wù)需求。

3. 邏輯數(shù)據(jù)編織的概念

圖片

邏輯數(shù)據(jù)編織(Logical Data Fabric)是近年來數(shù)據(jù)管理領(lǐng)域中廣泛討論的一個概念,常常與邏輯數(shù)據(jù)倉庫(Logical Data Warehouse)一同被提及。然而,邏輯數(shù)據(jù)編織與邏輯數(shù)據(jù)倉庫并非完全相同的概念,而是一種更廣泛的數(shù)據(jù)集成和管理方法。盡管目前尚未有一個絕對明確的標(biāo)準(zhǔn)定義來解釋什么是邏輯數(shù)據(jù)編織,但諸如 Gartner、Forrester 等權(quán)威咨詢機構(gòu)在過去五年中提出了關(guān)于它的一些觀點,可以幫助我們對其進(jìn)行理解。

根據(jù) Gartner 的觀點,邏輯數(shù)據(jù)編織首先是一種面向數(shù)據(jù)集成服務(wù)的設(shè)計架構(gòu)。它旨在通過提供數(shù)據(jù)集成服務(wù)來實現(xiàn)數(shù)據(jù)的無縫整合。邏輯數(shù)據(jù)編織的第二個關(guān)鍵特點是它基于元數(shù)據(jù)驅(qū)動。元數(shù)據(jù)在這個架構(gòu)中起到核心作用,驅(qū)動數(shù)據(jù)集成和管理的各個環(huán)節(jié)。基于元數(shù)據(jù)驅(qū)動的架構(gòu)使得邏輯數(shù)據(jù)編織能夠按需完成數(shù)據(jù)集成工作,這意味著在數(shù)據(jù)集成過程中,邏輯數(shù)據(jù)編織可以動態(tài)地適應(yīng)不同的數(shù)據(jù)需求。

邏輯數(shù)據(jù)編織的另一個重要特征是其對人工智能(AI)和機器學(xué)習(xí)(Machine Learning)的運用。Gartner 指出,邏輯數(shù)據(jù)編織應(yīng)當(dāng)在數(shù)據(jù)集成的過程中,最大化或自動化地使用 AI 和機器學(xué)習(xí)技術(shù),以優(yōu)化數(shù)據(jù)集成和管理流程。這不僅提高了數(shù)據(jù)集成的效率,還能使得數(shù)據(jù)分析和數(shù)據(jù)洞察更為智能和精準(zhǔn)。

邏輯數(shù)據(jù)編織通過元數(shù)據(jù)來驅(qū)動整個數(shù)據(jù)集成過程,并能夠基于這些元數(shù)據(jù)進(jìn)行推薦和優(yōu)化。這種元數(shù)據(jù)與推薦的結(jié)合,構(gòu)成了邏輯數(shù)據(jù)編織的核心理念,使其在數(shù)據(jù)集成領(lǐng)域中扮演了重要角色。

4. 數(shù)據(jù)網(wǎng)格

圖片

數(shù)據(jù)網(wǎng)格(Data Mesh)是一種新型的數(shù)據(jù)治理架構(gòu),它的核心思想是通過各個部門基于自身的數(shù)據(jù)產(chǎn)品來實現(xiàn)聯(lián)邦式的數(shù)據(jù)治理。與傳統(tǒng)的集中化數(shù)據(jù)治理方式不同,數(shù)據(jù)網(wǎng)格強調(diào)數(shù)據(jù)產(chǎn)品的分布式管理和自治,這種方式能夠更好地適應(yīng)組織內(nèi)部各個部門的特定需求和數(shù)據(jù)特性。

圖片

  • 尊重差異:數(shù)據(jù)網(wǎng)格強調(diào)各部門數(shù)據(jù)的獨特性,允許不同部門根據(jù)自身需求來管理和使用數(shù)據(jù)。每個部門的數(shù)據(jù)可能在格式、結(jié)構(gòu)和用途上有所不同,數(shù)據(jù)網(wǎng)格鼓勵保持這種多樣性,而不是強制統(tǒng)一標(biāo)準(zhǔn)。這一特點使數(shù)據(jù)治理能夠更靈活地適應(yīng)企業(yè)內(nèi)部的復(fù)雜需求。
  • 數(shù)據(jù)即產(chǎn)品:在數(shù)據(jù)網(wǎng)格中,數(shù)據(jù)被視為產(chǎn)品。各部門的數(shù)據(jù)產(chǎn)品應(yīng)具備易于發(fā)現(xiàn)、理解和使用的特性,方便其他部門在組織內(nèi)部進(jìn)行共享和利用。通過將數(shù)據(jù)作為產(chǎn)品來管理,可以確保數(shù)據(jù)質(zhì)量、提高數(shù)據(jù)可用性,并使數(shù)據(jù)在組織內(nèi)部發(fā)揮更大的價值。
  • 自服務(wù)平臺:數(shù)據(jù)網(wǎng)格提供了一個自服務(wù)的平臺,使各部門可以自主構(gòu)建、部署、發(fā)布和管理其數(shù)據(jù)產(chǎn)品。雖然該平臺由中央團(tuán)隊運營,但中央團(tuán)隊的職責(zé)僅限于維護(hù)平臺,而不負(fù)責(zé)開發(fā)具體的數(shù)據(jù)產(chǎn)品。這樣,各部門可以快速響應(yīng)業(yè)務(wù)需求,構(gòu)建符合自身需要的數(shù)據(jù)產(chǎn)品,提高數(shù)據(jù)治理的效率和靈活性。
  • 聯(lián)邦式計算治理:聯(lián)邦式計算治理確保了數(shù)據(jù)網(wǎng)格的整體互操作性和一致性。通過共享實體的通用語義和慣例,數(shù)據(jù)網(wǎng)格在各部門之間實現(xiàn)了數(shù)據(jù)的無縫協(xié)作。同時,聯(lián)邦式治理還支持全局安全和管理政策的執(zhí)行,確保數(shù)據(jù)在整個組織中的安全和合規(guī)。這種治理方式既保證了各部門的自主性,又維護(hù)了全局的數(shù)據(jù)一致性和安全性。

5. Denodo 的解決方案

圖片

基于數(shù)據(jù)虛擬化和 Denodo 的解決方案,數(shù)據(jù)網(wǎng)格的實現(xiàn)可以分步進(jìn)行,其中的核心概念是數(shù)據(jù)產(chǎn)品。數(shù)據(jù)網(wǎng)格將數(shù)據(jù)交付視為數(shù)據(jù)產(chǎn)品,并將其分類為三種類型:源域的數(shù)據(jù)產(chǎn)品、跨域的數(shù)據(jù)產(chǎn)品以及面向業(yè)務(wù)的數(shù)據(jù)產(chǎn)品。這種分類方式強調(diào)了數(shù)據(jù)在不同場景和需求下的交付形式,使得數(shù)據(jù)產(chǎn)品能夠更好地服務(wù)于組織的多元化需求。

總結(jié)來看,數(shù)據(jù)管理的架構(gòu)經(jīng)歷了三個主要階段。根據(jù) Gartner 的最新研究,可以劃分為三個時期:前數(shù)據(jù)倉庫時代、邏輯數(shù)據(jù)倉庫時代和增強型分析時代。

在 2010 年以前,這被稱為前數(shù)據(jù)倉庫時代或后數(shù)倉時代。在這一時期,企業(yè)主要構(gòu)建的是物理數(shù)據(jù)倉庫、數(shù)據(jù)集市和數(shù)據(jù)沙箱等環(huán)境,重點是將數(shù)據(jù)集中到一個物理平臺中進(jìn)行管理和分析。隨著需求的變化和數(shù)據(jù)規(guī)模的擴(kuò)大,這種物理集中式的方式逐漸暴露出其局限性。

2010 年至 2020 年的十年被稱為邏輯數(shù)據(jù)倉庫時代。這一階段的核心在于構(gòu)建統(tǒng)一的數(shù)據(jù)分析環(huán)境,以滿足日益增長的分析需求。邏輯數(shù)據(jù)倉庫在原有物理數(shù)據(jù)平臺的基礎(chǔ)上,增加了一個統(tǒng)一的業(yè)務(wù)語義層,即邏輯數(shù)據(jù)訪問管理層。這一層的引入使得不同的數(shù)據(jù)平臺可以通過統(tǒng)一的接口進(jìn)行訪問和分析,從而更好地支持業(yè)務(wù)需求。然而,數(shù)據(jù)環(huán)境的整體構(gòu)建思路在這個時期并未發(fā)生根本性的變化,依然依賴于物理數(shù)據(jù)的集中存儲。

2020 年以后,被稱為增強型分析時代或活動元數(shù)據(jù)時代。在這一階段,數(shù)據(jù)管理的核心從物理集中轉(zhuǎn)向了元數(shù)據(jù)驅(qū)動。通過收集和管理元數(shù)據(jù),企業(yè)可以在統(tǒng)一的數(shù)據(jù)交付和管理框架下,更高效地進(jìn)行數(shù)據(jù)治理。元數(shù)據(jù)驅(qū)動不僅使數(shù)據(jù)管理更加靈活,還為數(shù)據(jù)的自動推薦提供了可能性,從而實現(xiàn)了活動元數(shù)據(jù)的管理架構(gòu)。

在實際應(yīng)用中,企業(yè)如何選擇這三種架構(gòu)是一個需要綜合考慮的問題。邏輯數(shù)據(jù)編織的核心在于對元數(shù)據(jù)的收集和管理,因此適用于那些在元數(shù)據(jù)管理成熟度較高的企業(yè)。對于數(shù)據(jù)網(wǎng)格,它強調(diào)分散和自治的核心理念,適用于數(shù)據(jù)治理成熟度更高、能夠自助式管理數(shù)據(jù)的企業(yè)。然而,現(xiàn)實中,全球范圍內(nèi)能夠在這兩個維度上都達(dá)到成熟度要求的企業(yè)不足 15%,剩余的 85% 企業(yè)往往在兩個維度上都無法完全滿足。因此,邏輯數(shù)據(jù)倉庫成為這些企業(yè)較為適合的解決方案。

需要注意的是,數(shù)據(jù)編織和數(shù)據(jù)網(wǎng)格并非互斥的概念。在理想的數(shù)據(jù)治理環(huán)境中,數(shù)據(jù)編織和數(shù)據(jù)網(wǎng)格應(yīng)當(dāng)結(jié)合使用。在數(shù)據(jù)集成的架構(gòu)層面,實現(xiàn)自動化和編織思想,同時在企業(yè)范圍內(nèi),通過網(wǎng)格化的連接,實現(xiàn)各個數(shù)據(jù)單元的編織。這種融合的方式,既能利用元數(shù)據(jù)驅(qū)動的數(shù)據(jù)編織優(yōu)勢,又能發(fā)揮數(shù)據(jù)網(wǎng)格的自治性,為企業(yè)提供全面的數(shù)據(jù)治理能力。

三、企業(yè)角色與使用場景

圖片

在實際應(yīng)用場景中,使用 Denodo 的數(shù)據(jù)虛擬化技術(shù)可以實現(xiàn)多種數(shù)據(jù)架構(gòu),包括邏輯數(shù)據(jù)倉庫、邏輯數(shù)據(jù)編織以及數(shù)據(jù)網(wǎng)格。然而,無論采用何種架構(gòu),都需要根據(jù)具體的業(yè)務(wù)需求找到適合的切入點。以下是六個常見的切入點:

  • 單一視圖場景:構(gòu)建客戶、產(chǎn)品、車輛、檔案等 360 度全景視圖。這種場景適用于業(yè)務(wù)部門需要全面了解某一對象的所有關(guān)聯(lián)信息,以支持業(yè)務(wù)決策和客戶服務(wù)。
  • 數(shù)據(jù)安全與合規(guī)場景:滿足數(shù)據(jù)安全和合規(guī)性要求,包括數(shù)據(jù)訪問控制、審計、數(shù)據(jù)隱私保護(hù)等。金融、醫(yī)療等對數(shù)據(jù)安全要求較高的行業(yè)尤為適合。
  • 數(shù)據(jù)服務(wù)場景:提供 API 管理和數(shù)據(jù)服務(wù)發(fā)布,實現(xiàn)數(shù)據(jù)的標(biāo)準(zhǔn)化和可復(fù)用。通過數(shù)據(jù)服務(wù)化,可以為其他系統(tǒng)提供統(tǒng)一的數(shù)據(jù)訪問接口,支持靈活的數(shù)據(jù)消費。
  • 自助式 BI 場景:滿足業(yè)務(wù)部門的數(shù)據(jù)自助分析需求,實現(xiàn)數(shù)據(jù)民主化和數(shù)據(jù)自制。通過自助式分析工具,業(yè)務(wù)用戶可以直接對數(shù)據(jù)進(jìn)行查詢和分析,提高數(shù)據(jù)利用效率。
  • 大數(shù)據(jù)場景:包括邏輯數(shù)據(jù)倉庫和邏輯數(shù)據(jù)湖的管理。在大數(shù)據(jù)環(huán)境中,邏輯數(shù)據(jù)虛擬化層可以整合各種類型的數(shù)據(jù)源,提供統(tǒng)一的數(shù)據(jù)訪問接口。
  • 云端場景:支持上云、下云和多云策略,實現(xiàn)混合云和多云環(huán)境下的數(shù)據(jù)管理。通過數(shù)據(jù)虛擬化,可以實現(xiàn)云端與本地數(shù)據(jù)的無縫集成。

四、成功案例-冰島銀行

冰島銀行(Landsbank)的實踐案例展現(xiàn)了邏輯數(shù)據(jù)倉庫和數(shù)據(jù)網(wǎng)格的演進(jìn)過程。在采用 Denodo 解決方案之前,冰島銀行面臨著數(shù)據(jù)管理的復(fù)雜性。銀行需要滿足董事會、業(yè)務(wù)部門等不同的需求,例如 KPI 報告、風(fēng)險報告等。冰島銀行原有的架構(gòu)中,各個業(yè)務(wù)部門采用不同的 BI 工具(如 SAP BO、SAS)構(gòu)建模型層和語義層。這種多工具、多系統(tǒng)的架構(gòu)導(dǎo)致了以下問題:

數(shù)據(jù)安全與合規(guī):銀行對數(shù)據(jù)安全管控要求高,在每個數(shù)據(jù)源、數(shù)據(jù)集成層、應(yīng)用層都需要進(jìn)行大量的安全和審計規(guī)則治理,增加了管理的復(fù)雜性。

數(shù)據(jù)重復(fù)建設(shè):不同部門采用不同工具和方法,導(dǎo)致數(shù)據(jù)模型的重復(fù)建設(shè),增加了數(shù)據(jù)管理的成本。

第一年:邏輯數(shù)據(jù)倉庫的實現(xiàn):為解決上述問題,冰島銀行首先構(gòu)建了邏輯數(shù)據(jù)倉庫,將數(shù)據(jù)虛擬化層覆蓋在原有的中間模型層上。通過數(shù)據(jù)虛擬化層,銀行集中管理業(yè)務(wù)規(guī)則、安全審計規(guī)則,從而大幅降低了數(shù)據(jù)治理和管控的成本。

第二、三年:擴(kuò)展邏輯數(shù)據(jù)倉庫:看到邏輯數(shù)據(jù)倉庫的成功后,冰島銀行將這一架構(gòu)推廣至更多業(yè)務(wù)部門,包括對私和對公業(yè)務(wù)等。邏輯數(shù)據(jù)倉庫范圍的擴(kuò)大,實現(xiàn)了對更多業(yè)務(wù)數(shù)據(jù)的集中管理和虛擬化。

第四年:數(shù)據(jù)網(wǎng)格的初步構(gòu)建:隨著業(yè)務(wù)的擴(kuò)展,冰島銀行發(fā)現(xiàn)僅靠物理集中存儲無法滿足所有業(yè)務(wù)需求,尤其是對原系統(tǒng)中數(shù)據(jù)的理解和管理成為瓶頸。因此,銀行開始聯(lián)合業(yè)務(wù)專家,對原域數(shù)據(jù)產(chǎn)品進(jìn)行深入治理,提升數(shù)據(jù)質(zhì)量。通過邏輯數(shù)據(jù)管理的方法,銀行完成了從數(shù)據(jù)集中化到自治化的轉(zhuǎn)變,為構(gòu)建數(shù)據(jù)網(wǎng)格奠定了基礎(chǔ)。

未來:數(shù)據(jù)網(wǎng)格的全面落地:經(jīng)過多年的努力,冰島銀行最終實現(xiàn)了全行范圍的數(shù)據(jù)網(wǎng)格化。數(shù)據(jù)網(wǎng)格使銀行各個業(yè)務(wù)部門能夠靈活地訪問和共享數(shù)據(jù),從而支持業(yè)務(wù)創(chuàng)新。例如,對公部門可以訪問同業(yè)數(shù)據(jù),對私部門可以訪問信用卡數(shù)據(jù)。數(shù)據(jù)網(wǎng)格的實現(xiàn)使銀行的業(yè)務(wù)更具靈活性和可擴(kuò)展性。

冰島銀行的案例展示了數(shù)據(jù)虛擬化在數(shù)據(jù)管理架構(gòu)中的重要性。無論是邏輯數(shù)據(jù)倉庫、邏輯數(shù)據(jù)編織,還是數(shù)據(jù)網(wǎng)格,數(shù)據(jù)虛擬化都可以提供靈活的數(shù)據(jù)集成和治理能力,滿足不同業(yè)務(wù)場景的需求。選擇何種架構(gòu)取決于企業(yè)的業(yè)務(wù)需求、數(shù)據(jù)治理成熟度以及數(shù)據(jù)安全與合規(guī)要求。在理想情況下,數(shù)據(jù)編織和數(shù)據(jù)網(wǎng)格的結(jié)合可以實現(xiàn)企業(yè)數(shù)據(jù)的最佳治理。

責(zé)任編輯:姜華 來源: DataFunTalk
相關(guān)推薦

2023-02-03 17:55:20

數(shù)據(jù)治理數(shù)據(jù)湖

2023-01-31 15:27:13

數(shù)據(jù)治理數(shù)據(jù)管理

2023-03-03 08:00:00

重采樣數(shù)據(jù)集

2023-09-28 08:19:57

語言模型數(shù)倉數(shù)據(jù)

2009-01-05 18:14:29

虛擬化vmware思科

2009-01-12 17:23:14

服務(wù)器虛擬化思科

2017-05-03 10:35:31

容器虛擬化傳統(tǒng)虛擬化數(shù)據(jù)中心

2021-12-28 17:47:04

數(shù)據(jù)治理

2021-12-28 15:53:07

數(shù)據(jù)虛擬化數(shù)據(jù)治理數(shù)字化轉(zhuǎn)型

2024-02-22 08:51:46

大數(shù)據(jù)白盒化治理數(shù)據(jù)治理

2016-12-30 16:18:36

SDN數(shù)據(jù)中心網(wǎng)絡(luò)

2023-08-24 09:44:16

數(shù)據(jù)庫性能

2020-09-28 10:05:57

數(shù)據(jù)工具技術(shù)

2016-11-09 15:49:28

大數(shù)據(jù)金融WOT2016

2024-10-09 08:33:41

2023-04-06 00:29:01

2021-06-10 19:10:32

大數(shù)據(jù)大數(shù)據(jù)應(yīng)用大數(shù)據(jù)技術(shù)

2022-09-06 17:43:02

??AISummit數(shù)據(jù)運營

2013-06-26 10:17:21

虛擬化數(shù)據(jù)中心

2022-05-13 11:24:09

數(shù)據(jù)美團(tuán)
點贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 男人天堂999 | 毛片一区二区三区 | 亚洲视频一区 | 国产成人精品一区二区三区在线观看 | 最新日韩精品 | 国产真实精品久久二三区 | 91免费在线看 | 国产精品国产成人国产三级 | 激情五月婷婷综合 | 欧美日韩理论 | 又爽又黄axxx片免费观看 | 在线观看精品视频网站 | 日韩av在线一区二区 | 久久久久国产一区二区三区 | 久久久国产一区二区三区四区小说 | 欧美中文在线 | 美女一区 | 日韩在线观看 | 成人av网站在线观看 | 九九热这里只有精品在线观看 | 精品国产乱码久久久久久老虎 | 日本在线视频一区二区 | 狠狠狠色丁香婷婷综合久久五月 | 91久久国产综合久久91精品网站 | 中文字幕日本一区二区 | 国产精品综合一区二区 | 久久成人午夜 | 午夜精品一区二区三区在线 | 免费在线看a| 神马久久av | 一区中文| 人妖一区 | 国产日韩欧美精品 | 免费看av大片 | 亚洲一区二区三区免费在线 | 久久久久午夜 | 天天天操| 伊人免费在线观看高清 | 2021天天干夜夜爽 | 欧美成人精品一区二区三区 | www.日本三级 |