辨析BI、數(shù)據(jù)倉(cāng)庫(kù)、數(shù)據(jù)湖和數(shù)據(jù)中臺(tái)內(nèi)涵及差異點(diǎn)
前言
隨著大數(shù)據(jù)技術(shù)的不斷更新和迭代,數(shù)據(jù)管理工具得到了飛速的發(fā)展,相關(guān)概念如雨后春筍一般應(yīng)運(yùn)而生,如從最初決策支持系統(tǒng)(DSS)到商業(yè)智能(BI)、數(shù)據(jù)倉(cāng)庫(kù)、數(shù)據(jù)湖、數(shù)據(jù)中臺(tái)等,這些概念特別容易混淆,本文對(duì)這些名詞術(shù)語(yǔ)及內(nèi)涵進(jìn)行系統(tǒng)的解析,便于讀者對(duì)數(shù)據(jù)平臺(tái)相關(guān)的概念有全面的認(rèn)識(shí)。
一、數(shù)據(jù)倉(cāng)庫(kù)
數(shù)據(jù)倉(cāng)庫(kù)平臺(tái)逐步從 BI 報(bào)表為主到分析為主、到預(yù)測(cè)為主、再到操作智能為目標(biāo)。
數(shù)據(jù)倉(cāng)庫(kù)發(fā)展階段劃分
商務(wù)智能(BI,Business Intelligence)是一種以提供決策分析性的運(yùn)營(yíng)數(shù)據(jù)為目的而建立的信息系統(tǒng)。是屬于在線分析處理:On Line Analytical Processing (OLAP),將預(yù)先計(jì)算完成的匯總數(shù)據(jù),儲(chǔ)存于魔方數(shù)據(jù)庫(kù)(Cube) 之中,針對(duì)復(fù)雜的分析查詢,提供快速的響應(yīng)。在前 10 年,BI 報(bào)表項(xiàng)目比較多,是數(shù)據(jù)倉(cāng)庫(kù)項(xiàng)目的前期預(yù)熱項(xiàng)目(主要分析為主的階段,是數(shù)據(jù)倉(cāng)庫(kù)的初級(jí)階段),制作一些可視化報(bào)表展現(xiàn)給管理者。
- 它利用信息科技,將分散于企業(yè)內(nèi)、外部各種數(shù)據(jù)加以整合并轉(zhuǎn)換成知識(shí),并依據(jù)某些特定的主題需求,進(jìn)行決策分析和運(yùn)算;
- 用戶則通過(guò)報(bào)表、圖表、多維度分析的方式,尋找解決業(yè)務(wù)問(wèn)題所需要的方案;
- 這些結(jié)果將呈報(bào)給決策者,以支持策略性的決策和定義組織績(jī)效,或者融入智能知識(shí)庫(kù)自動(dòng)向客戶推送。
1. 1 數(shù)據(jù)倉(cāng)庫(kù)基本定義
數(shù)據(jù)倉(cāng)庫(kù)(Data Warehouse)是一個(gè)面向主題的(Subject Oriented)、集成的(Integrated)、相對(duì)穩(wěn)定的(Non-Volatile)、反映歷史變化的(Time Variant)數(shù)據(jù)集合,用于支持管理決策和信息的全局共享。其主要功能是將組織透過(guò)資訊系統(tǒng)之聯(lián)機(jī)事務(wù)處理(OLTP)經(jīng)年累月所累積的大量資料,透過(guò)數(shù)據(jù)倉(cāng)庫(kù)理論所特有的資料儲(chǔ)存架構(gòu),作一有系統(tǒng)的分析整理,以利各種分析方法如聯(lián)機(jī)分析處理(OLAP)、數(shù)據(jù)挖掘(Data Mining)之進(jìn)行,并進(jìn)而支持如決策支持系統(tǒng)(DSS)、主管資訊系統(tǒng)(EIS)之創(chuàng)建,幫助決策者能快速有效的自大量資料中,分析出有價(jià)值的資訊,以利決策擬定及快速回應(yīng)外在環(huán)境變動(dòng),幫助建構(gòu)商業(yè)智能(BI)。
- 所謂主題:是指用戶使用數(shù)據(jù)倉(cāng)庫(kù)進(jìn)行決策時(shí)所關(guān)心的重點(diǎn)方面,如:收入、客戶、銷售渠道等;所謂面向主題,是指數(shù)據(jù)倉(cāng)庫(kù)內(nèi)的信息是按主題進(jìn)行組織的,而不是像業(yè)務(wù)支撐系統(tǒng)那樣是按照業(yè)務(wù)功能進(jìn)行組織的。
- 所謂集成:是指數(shù)據(jù)倉(cāng)庫(kù)中的信息不是從各個(gè)業(yè)務(wù)系統(tǒng)中簡(jiǎn)單抽取出來(lái)的,而是經(jīng)過(guò)一系列加工、整理和匯總的過(guò)程,因此數(shù)據(jù)倉(cāng)庫(kù)中的信息是關(guān)于整個(gè)企業(yè)的一致的全局信息。
- 所謂隨時(shí)間變化:是指數(shù)據(jù)倉(cāng)庫(kù)內(nèi)的信息并不只是反映企業(yè)當(dāng)前的狀態(tài),而是記錄了從過(guò)去某一時(shí)點(diǎn)到當(dāng)前各個(gè)階段的信息。通過(guò)這些信息,可以對(duì)企業(yè)的發(fā)展歷程和未來(lái)趨勢(shì)做出定量分析和預(yù)測(cè)。
數(shù)據(jù)倉(cāng)庫(kù)邏輯架構(gòu)
1. 2 數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)作用和定位
數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)的作用能實(shí)現(xiàn)跨業(yè)務(wù)條線、跨系統(tǒng)的數(shù)據(jù)整合,為管理分析和業(yè)務(wù)決策提供統(tǒng)一的數(shù)據(jù)支持。數(shù)據(jù)倉(cāng)庫(kù)能夠從根本上幫助你把公司的運(yùn)營(yíng)數(shù)據(jù)轉(zhuǎn)化成為高價(jià)值的可以獲取的信息(或知識(shí)),并且在恰當(dāng)?shù)臅r(shí)候通過(guò)恰當(dāng)?shù)姆绞桨亚‘?dāng)?shù)男畔鬟f給恰當(dāng)?shù)娜恕?/p>
- 是面向企業(yè)中、高級(jí)管理進(jìn)行業(yè)務(wù)分析和績(jī)效考核的數(shù)據(jù)整合、分析和展現(xiàn)的工具;
- 是主要用于歷史性、綜合性和深層次數(shù)據(jù)分析;
- 數(shù)據(jù)來(lái)源是 ERP(例:SAP)系統(tǒng)或其他業(yè)務(wù)系統(tǒng);
- 能夠提供靈活、直觀、簡(jiǎn)潔和易于操作的多維查詢分析;
- 不是日常交易操作系統(tǒng),不能直接產(chǎn)生交易數(shù)據(jù);
數(shù)據(jù)倉(cāng)庫(kù)針對(duì)實(shí)時(shí)數(shù)據(jù)處理,非結(jié)構(gòu)化數(shù)據(jù)處理能力較弱,以及在業(yè)務(wù)在預(yù)警預(yù)測(cè)方面應(yīng)用相對(duì)有限。
1. 3 數(shù)據(jù)倉(cāng)庫(kù)能提供什么
數(shù)據(jù)倉(cāng)庫(kù)提供價(jià)值
1. 4 數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)構(gòu)成
數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)除了包含分析產(chǎn)品本身之外,還包含數(shù)據(jù)集成、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)計(jì)算、門戶展現(xiàn)、平臺(tái)管理等其它一系列的產(chǎn)品。
數(shù)據(jù)倉(cāng)庫(kù)產(chǎn)品構(gòu)成
數(shù)據(jù)倉(cāng)庫(kù)產(chǎn)品構(gòu)成
二、數(shù)據(jù)湖
數(shù)據(jù)湖(Data Lake)是 Pentaho 的 CTO James Dixon 提出來(lái)的(Pentaho 作為一家 BI 公司在理念上是挺先進(jìn)的),是一種數(shù)據(jù)存儲(chǔ)理念——即在系統(tǒng)或存儲(chǔ)庫(kù)中以自然格式存儲(chǔ)數(shù)據(jù)的方法。
2. 1 維基百科對(duì)數(shù)據(jù)湖的定義
數(shù)據(jù)湖(Data Lake)是一個(gè)存儲(chǔ)企業(yè)的各種各樣原始數(shù)據(jù)的大型倉(cāng)庫(kù),其中的數(shù)據(jù)可供存取、處理、分析及傳輸。數(shù)據(jù)湖是以其自然格式存儲(chǔ)的數(shù)據(jù)的系統(tǒng)或存儲(chǔ)庫(kù),通常是對(duì)象 blob 或文件。數(shù)據(jù)湖通常是企業(yè)所有數(shù)據(jù)的單一存儲(chǔ),包括源系統(tǒng)數(shù)據(jù)的原始副本,以及用于報(bào)告、可視化、分析和機(jī)器學(xué)習(xí)等任務(wù)的轉(zhuǎn)換數(shù)據(jù)。數(shù)據(jù)湖可以包括來(lái)自關(guān)系數(shù)據(jù)庫(kù)(行和列)的結(jié)構(gòu)化數(shù)據(jù),半結(jié)構(gòu)化數(shù)據(jù)(CSV,日志,XML,JSON),非結(jié)構(gòu)化數(shù)據(jù)(電子郵件,文檔,PDF)和二進(jìn)制數(shù)據(jù)(圖像,音頻,視頻)。來(lái)源:維基百科。
目前,Hadoop 是最常用的部署數(shù)據(jù)湖的技術(shù),所以很多人會(huì)覺(jué)得數(shù)據(jù)湖就是 Hadoop 集群。數(shù)據(jù)湖是一個(gè)概念,而 Hadoop 是用于實(shí)現(xiàn)這個(gè)概念的技術(shù)。
2. 2 數(shù)據(jù)湖能給企業(yè)帶來(lái)多種能力
數(shù)據(jù)湖能給企業(yè)帶來(lái)多種能力,例如,能實(shí)現(xiàn)數(shù)據(jù)的集中式管理,在此之上,企業(yè)能挖掘出很多之前所不具備的能力。另外,數(shù)據(jù)湖結(jié)合先進(jìn)的數(shù)據(jù)科學(xué)與機(jī)器學(xué)習(xí)技術(shù),能幫助企業(yè)構(gòu)建更多優(yōu)化后的運(yùn)營(yíng)模型,也能為企業(yè)提供其他能力,如預(yù)測(cè)分析、推薦模型等,這些模型能刺激企業(yè)能力的后續(xù)增長(zhǎng)。數(shù)據(jù)湖能從以下方面幫助到企業(yè):
- 實(shí)現(xiàn)數(shù)據(jù)治理(data governance)。
- 通過(guò)應(yīng)用機(jī)器學(xué)習(xí)與人工智能技術(shù)實(shí)現(xiàn)商業(yè)智能。
- 預(yù)測(cè)分析,如領(lǐng)域特定的推薦引擎。
- 信息追蹤與一致性保障。
- 根據(jù)對(duì)歷史的分析生成新的數(shù)據(jù)維度。
- 有一個(gè)集中式的能存儲(chǔ)所有企業(yè)數(shù)據(jù)的數(shù)據(jù)中心,有利于實(shí)現(xiàn)一個(gè)針對(duì)數(shù)據(jù)傳輸優(yōu)化的數(shù)據(jù)服務(wù)。
- 幫助組織或企業(yè)做出更多靈活的關(guān)于企業(yè)增長(zhǎng)的決策。
2. 3 數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)湖差異
- 在儲(chǔ)存方面上,數(shù)據(jù)湖中數(shù)據(jù)為非結(jié)構(gòu)化的,所有數(shù)據(jù)都保持原始形式。存儲(chǔ)所有數(shù)據(jù),并且僅在分析時(shí)再進(jìn)行轉(zhuǎn)換。數(shù)據(jù)倉(cāng)庫(kù)就是數(shù)據(jù)通常從事務(wù)系統(tǒng)中提取。
- 在將數(shù)據(jù)加載到數(shù)據(jù)倉(cāng)庫(kù)之前,會(huì)對(duì)數(shù)據(jù)進(jìn)行清理與轉(zhuǎn)換。在數(shù)據(jù)抓取中數(shù)據(jù)湖就是捕獲半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)。而數(shù)據(jù)倉(cāng)庫(kù)則是捕獲結(jié)構(gòu)化數(shù)據(jù)并將其按模式組織。
- 數(shù)據(jù)湖的目的就是數(shù)據(jù)湖非常適合深入分析的非結(jié)構(gòu)化數(shù)據(jù)。數(shù)據(jù)科學(xué)家可能會(huì)用具有預(yù)測(cè)建模和統(tǒng)計(jì)分析等功能的高級(jí)分析工具。而數(shù)據(jù)倉(cāng)庫(kù)就是數(shù)據(jù)倉(cāng)庫(kù)非常適用于月度報(bào)告等操作用途,因?yàn)樗哂懈叨冉Y(jié)構(gòu)化。
- 在架構(gòu)中數(shù)據(jù)湖通常,在存儲(chǔ)數(shù)據(jù)之后定義架構(gòu)。使用較少的初始工作并提供更大的靈活性。在數(shù)據(jù)倉(cāng)庫(kù)中存儲(chǔ)數(shù)據(jù)之前定義架構(gòu)。
表 1. 數(shù)據(jù)倉(cāng)庫(kù)、數(shù)據(jù)湖和數(shù)據(jù)湖的區(qū)別如下:
三、數(shù)據(jù)中臺(tái)
3. 1 產(chǎn)生的背景
企業(yè)在過(guò)去信息化的歷程中形成了大量生產(chǎn)經(jīng)營(yíng)及專業(yè)業(yè)務(wù)應(yīng)用成果,同時(shí)也累積了大量的企業(yè)數(shù)據(jù)資產(chǎn)。限于傳統(tǒng)的數(shù)據(jù)倉(cāng)庫(kù)技術(shù)手段,數(shù)據(jù)管理和分析能力成為信息化工作中的短板。企業(yè)信息系統(tǒng)眾多,系統(tǒng)管理獨(dú)立,數(shù)據(jù)存儲(chǔ)分散,橫向的數(shù)據(jù)共享和分析應(yīng)用僅由具體業(yè)務(wù)驅(qū)動(dòng),難以對(duì)全局?jǐn)?shù)據(jù)開(kāi)展價(jià)值挖掘,從規(guī)模上和效果上都無(wú)法真正體現(xiàn)集團(tuán)龐大數(shù)據(jù)資產(chǎn)的價(jià)值。市場(chǎng)競(jìng)爭(zhēng)和產(chǎn)業(yè)鏈日益全球化,企業(yè)不只滿足于內(nèi)部數(shù)據(jù)的分析,更要通過(guò)互聯(lián)網(wǎng)、微信、APP 等新技術(shù)手段結(jié)合外部市場(chǎng)數(shù)據(jù)進(jìn)行整體分析。
(1)傳統(tǒng)的數(shù)據(jù)倉(cāng)庫(kù)不能滿足數(shù)據(jù)分析需求。
企業(yè)在數(shù)據(jù)分析應(yīng)用方面呈現(xiàn)“五大轉(zhuǎn)變”(從統(tǒng)計(jì)分析向預(yù)測(cè)分析轉(zhuǎn)變、從單領(lǐng)域分析向跨領(lǐng)域轉(zhuǎn)變、從被動(dòng)分析向主動(dòng)分析轉(zhuǎn)變、從非實(shí)時(shí)向?qū)崟r(shí)分析轉(zhuǎn)變、從結(jié)構(gòu)化數(shù)據(jù)向多元化轉(zhuǎn)變),并且對(duì)統(tǒng)一的數(shù)據(jù)中臺(tái)平臺(tái)訴求強(qiáng)烈,對(duì)數(shù)據(jù)中臺(tái)的運(yùn)算能力、核心算法、及數(shù)據(jù)全面性提出了更高的要求。
(2)數(shù)據(jù)中臺(tái)的處理架構(gòu)發(fā)生了變化。
一是以 Hadoop、Spark 等分布式技術(shù)和組件為核心的“計(jì)算&存儲(chǔ)混搭”的數(shù)據(jù)處理架構(gòu),能夠支持批量和實(shí)時(shí)的數(shù)據(jù)加載以及靈活的業(yè)務(wù)需求。二是數(shù)據(jù)的預(yù)處理流程正在從傳統(tǒng)的 ETL 結(jié)構(gòu)向 ELT 轉(zhuǎn)變。傳統(tǒng)的數(shù)據(jù)倉(cāng)庫(kù)集成處理架構(gòu)是 ETL 結(jié)構(gòu),這是構(gòu)建數(shù)據(jù)倉(cāng)庫(kù)的重要一環(huán),即用戶從數(shù)據(jù)源抽取出所需的數(shù)據(jù),經(jīng)過(guò)數(shù)據(jù)清洗,將數(shù)據(jù)加載到數(shù)據(jù)倉(cāng)庫(kù)中去。而大數(shù)據(jù)背景下的架構(gòu)體系是 ELT 結(jié)構(gòu),其根據(jù)上層的應(yīng)用需求,隨時(shí)從數(shù)據(jù)中臺(tái)中抽取想要的原始數(shù)據(jù)進(jìn)行建模分析。
3. 2 數(shù)據(jù)中臺(tái)建設(shè)是數(shù)字化轉(zhuǎn)型的關(guān)鍵支撐
數(shù)據(jù)中臺(tái)成為熱點(diǎn),“中臺(tái)”這個(gè)概念,是相對(duì)于前臺(tái)和后臺(tái)而生,是前臺(tái)和后臺(tái)的鏈接點(diǎn),將業(yè)務(wù)共同的工具和技術(shù)予以沉淀。數(shù)據(jù)中臺(tái)是指數(shù)據(jù)采集交換、共享融合、組織處理、建模分析、管理治理和服務(wù)應(yīng)用于一體的綜合性數(shù)據(jù)能力平臺(tái),在大數(shù)據(jù)生態(tài)中處于承上啟下的功能,提供面向數(shù)據(jù)應(yīng)用支撐的底座能力。
廣義上來(lái)給數(shù)據(jù)中臺(tái)一個(gè)企業(yè)級(jí)的定義:“聚合和治理跨域數(shù)據(jù),將數(shù)據(jù)抽象封裝成服務(wù),提供給前臺(tái)以業(yè)務(wù)價(jià)值的邏輯概念”。
數(shù)據(jù)中臺(tái)建設(shè)是數(shù)字化轉(zhuǎn)型的關(guān)鍵支撐
中臺(tái)戰(zhàn)略核心是數(shù)據(jù)服務(wù)的共享。中臺(tái)戰(zhàn)略并不是搭建一個(gè)數(shù)據(jù)平臺(tái),但是中臺(tái)的大部分服務(wù)都是圍繞數(shù)據(jù)而生,數(shù)據(jù)中臺(tái)是圍繞向上層應(yīng)用提供數(shù)據(jù)服務(wù)構(gòu)建的,中臺(tái)戰(zhàn)略讓數(shù)據(jù)在數(shù)據(jù)平臺(tái)和業(yè)務(wù)系統(tǒng)之間形成了一個(gè)良性的閉環(huán),也就是實(shí)現(xiàn)應(yīng)用與數(shù)據(jù)之間解藕,并實(shí)現(xiàn)緊密交互。
- 敏捷前臺(tái):一線作戰(zhàn)單元,強(qiáng)調(diào)敏捷交互及穩(wěn)定交付的組織能力建設(shè)。
- 業(yè)務(wù)中臺(tái):能力固化與賦能,固化通用能力,賦能前線部隊(duì),提升配置效率,加快前線響應(yīng),產(chǎn)品化業(yè)務(wù)化,開(kāi)辟全新生態(tài)。
- 數(shù)據(jù)中臺(tái):資產(chǎn)整合與共享,整合多維數(shù)據(jù),統(tǒng)一資產(chǎn)管理,連通數(shù)據(jù)孤島,共享數(shù)據(jù)資源,深入挖掘數(shù)據(jù),盤活資產(chǎn)價(jià)值。
- 穩(wěn)定后臺(tái):以共享中心建設(shè)為核心,為前中臺(tái)提供專業(yè)的內(nèi)部服務(wù)支撐。
3. 3 數(shù)據(jù)中臺(tái)定義及處理架構(gòu)
數(shù)據(jù)中臺(tái)是指通過(guò)企業(yè)內(nèi)外部多源異構(gòu)的數(shù)據(jù)采集、治理、建模、分析,應(yīng)用,使數(shù)據(jù)對(duì)內(nèi)優(yōu)化管理提高業(yè)務(wù),對(duì)外可以數(shù)據(jù)合作價(jià)值釋放,成為企業(yè)數(shù)據(jù)資產(chǎn)管理中樞。數(shù)據(jù)中臺(tái)建立后,會(huì)形成數(shù)據(jù) API,為企業(yè)和客戶提供高效各種數(shù)據(jù)服務(wù)。
數(shù)據(jù)中臺(tái)整體技術(shù)架構(gòu)上采用云計(jì)算架構(gòu)模式,將數(shù)據(jù)資源、計(jì)算資源、存儲(chǔ)資源充分云化,并通過(guò)多租戶技術(shù)進(jìn)行資源打包整合,并進(jìn)行開(kāi)放,為用戶提供“一站式”數(shù)據(jù)服務(wù)。
利用大數(shù)據(jù)技術(shù),對(duì)海量數(shù)據(jù)進(jìn)行統(tǒng)一采集、計(jì)算、存儲(chǔ),并使用統(tǒng)一的數(shù)據(jù)規(guī)范進(jìn)行管理,將企業(yè)內(nèi)部所有數(shù)據(jù)統(tǒng)一處理形成標(biāo)準(zhǔn)化數(shù)據(jù),挖掘出對(duì)企業(yè)最有價(jià)值的數(shù)據(jù),構(gòu)建企業(yè)數(shù)據(jù)資產(chǎn)庫(kù),提供一致的、高可用大 數(shù)據(jù)服務(wù)。
數(shù)據(jù)中臺(tái)不是一套軟件,也不是一個(gè)信息系統(tǒng),而是一系列數(shù)據(jù)組件的集合,企業(yè)基于自身的信息化建設(shè)基礎(chǔ)、數(shù)據(jù)基礎(chǔ)以及業(yè)務(wù)特點(diǎn)對(duì)數(shù)據(jù)中臺(tái)的能力進(jìn)行定義,基于能力定義利用數(shù)據(jù)組件搭建自己的數(shù)據(jù)中臺(tái)。
3. 4 數(shù)據(jù)中臺(tái)帶來(lái)價(jià)值
數(shù)據(jù)中臺(tái)對(duì)一個(gè)企業(yè)的數(shù)字化轉(zhuǎn)型和可持續(xù)發(fā)展起著至關(guān)重要的作用。數(shù)據(jù)中臺(tái)為解耦而生,企業(yè)建設(shè)數(shù)據(jù)中臺(tái)的最大意義就是應(yīng)用與數(shù)據(jù)解藕。這樣企業(yè)就可以不受限制地按需構(gòu)建滿足業(yè)務(wù)需求的數(shù)據(jù)應(yīng)用。
- 構(gòu)建了開(kāi)放、靈活、可擴(kuò)展的企業(yè)級(jí)統(tǒng)一數(shù)據(jù)管理和分析平臺(tái), 將企業(yè)內(nèi)、外部數(shù)據(jù)隨需關(guān)聯(lián),打破了數(shù)據(jù)的系統(tǒng)界限。
- 利用大數(shù)據(jù)智能分析、數(shù)據(jù)可視化等技術(shù),實(shí)現(xiàn)了數(shù)據(jù)共享、日常報(bào)表自動(dòng)生成、快速和智能分析,滿足集團(tuán)總部和各分子公司各級(jí)數(shù)據(jù)分析應(yīng)用需求。
- 深度挖掘數(shù)據(jù)價(jià)值,助力企業(yè)數(shù)字化轉(zhuǎn)型落地。實(shí)現(xiàn)了數(shù)據(jù)的目錄、模型、標(biāo)準(zhǔn)、認(rèn)責(zé)、安全、可視化、共享等管理,實(shí)現(xiàn)數(shù)據(jù)集中存儲(chǔ)、處理、分類與管理,建立大數(shù)據(jù)分析工具庫(kù)、算法服務(wù)庫(kù),實(shí)現(xiàn)報(bào)表生成自動(dòng)化、數(shù)據(jù)分析敏捷化、數(shù)據(jù)挖掘可視化,實(shí)現(xiàn)數(shù)據(jù)質(zhì)量評(píng)估、落地管理流程。
四、傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)中臺(tái)的差異點(diǎn)
數(shù)據(jù)中臺(tái)與傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)比較
作為工業(yè)企業(yè),一般采用混搭架構(gòu):
結(jié)論
本文對(duì)數(shù)據(jù)倉(cāng)庫(kù)、數(shù)據(jù)湖、數(shù)據(jù)中臺(tái)等內(nèi)涵作了詳細(xì)說(shuō)明,便于讀者更好的理解和掌握數(shù)據(jù)領(lǐng)域相關(guān)概念。
最后總結(jié)一點(diǎn):數(shù)據(jù)中臺(tái)更好的支撐數(shù)據(jù)預(yù)測(cè)分析、跨領(lǐng)域分析、主動(dòng)分析、實(shí)時(shí)分析、多元化結(jié)構(gòu)化數(shù)據(jù)分析,數(shù)據(jù)中臺(tái)建設(shè)是我們企業(yè)數(shù)據(jù)服務(wù)和共享奠定重要的基礎(chǔ),可以加速?gòu)臄?shù)據(jù)到價(jià)值的過(guò)程,打造相應(yīng)業(yè)務(wù)能力。(鳴謝:蔡春久先生給予專業(yè)指導(dǎo))