談談中臺、數倉和報表平臺的區別,你看的都不對
我對一些當下較為熱門的概念做了一些梳理,其實想要了解區別,我覺得得先知道它們各自的定義。
1、先說數據中臺
它的起源我就不說了,相信大家或多或少都看過這個有趣的故事:15年馬云攜高管訪問supercell這個游戲公司,這個游戲公司為什么牛逼?就是因為它的員工不多,但是卻造出了很多知名的游戲,原因就在于它的中臺戰略深入人心,如何像他們一樣提高人效?這才是高管們關心的。
回到國內,中臺的概念就被造出來了,從起名可以看出來,是處于中間位置,連接前后的作用,最終的目的是提高員工和企業的效率。
阿里事業部不下十幾個,淘寶、天貓、 1688、聚劃算、菜鳥物流,每個事業部都有獨立的架構體系,對應各個的開發和運維,這會出現功能重復建設,數據格式不統一,口徑不一致。
中臺的出現就是為了解決這些重復造輪子的情況,打通各個業務系統的數據,有些費時費力的代碼,寫過一遍了,為什么還要再寫呢?此處@各研發。
再拿某公司來說,很多人都覺得它是app工廠,造出了很多知名的產品如X音、X條等,但是他們的研發背后,肯定有一套,和阿里一樣的,合理的數據中臺體系。

我想提一下數據中臺的價值之一:數據服務化
數據中臺要能打通煙囪式的數據體系,避免重復開發,做到全域數據打通,構建公司級統一的數據倉庫。同時,也提供更方便的數據訪問方式:比如數據API、可視化訪問、自助提取等。
說到可視化,就不得不提一下企業的數據架構了:

可視化一般是處于展示層或者應用層,你可以沒有中臺,但是你不能沒有可視化,因為中臺是為了研發方便,但是可視化就是為了老板和管理層的決策了,誰重要?
市面上有相當多的可視化工具,成熟的也好,開源的也罷,很多很多,但這些大多是門檻挺高的工具,比如Echarts、Highchart等,或許它們在技術層面上很厲害,也很成熟,但是缺點也很明顯:人群太少,只有懂技術的能用。
我做可視化也有點經驗,這么幾個是比較實用的:
(1)FineReport
國內的一款報表工具,如果要論穩定性、適用性、決策性,它可謂是當仁不讓,雖然定位是解決IT重復開發、企業數據孤島的報表工具,但是還能做可視化大屏,你能想象嗎?
(2)FineBI
國內BI的前者,并且已經在這個位置上很多年了。
簡潔明了的數據分析工具,也是我個人最喜歡的可視化工具,零代碼零代碼!!!
可視化的場景都在這里了。
(3)Tableau

國外的工具,BI領域的第一,但是論價錢的話....很多企業都會放棄的,而且就我認識的人來看,有很多用了Tableau然后放棄的,最終回到了國產BI,只能說各有選擇吧。
2、再來說說數據倉庫
在我看來,數據倉庫就是用來進行數據分析的,因為企業數據量大到一定程度之后,說明該企業的規模也是非常大的,數據庫在進行大量數據查詢的時候效率較低。
如果每次分析都從數據庫里取數,那么會非常麻煩,所以就有了數據倉庫,每隔一段時間把數據庫里面的所有數據放到數據倉庫里分析。
數據倉庫整合多個數據源,進行多維的分析,其架構一共有4層:

3、兩者的區別
先對兩者的概念進行一個簡單的總結:
- 數據倉庫是利用數據平臺提供的計算和存儲能力,在一套方法論指導下建設的一整套的數據表
- 數據中臺包含了數據平臺和數據倉庫的所有內容,將其打包,并且以更優雅以及更產品化的方式對外提供服務和價值
然后你就會發現:數據中臺其實包含數據倉庫,數據中臺可以將企業數據倉庫建設的投入價值進行最大化。再來擴大一點,說說和BI的關系吧,數據倉庫是BI的基石,數據倉庫為BI系統提供良好的數據基礎。
數據倉庫的主要場景是支持管理決策和業務分析,而數據中臺則是將數據服務化之后提供給業務系統,目標是將數據能力滲透到各個業務環節,不限于決策分析類場景。

數據中臺也可以將已建好的數據倉庫當成數據源,對接已有數據建設成果,避免重復建設。當然也可以基于數據中臺提供的能力,通過匯聚、加工、治理各類數據源,構建全新的離線或實時數據倉庫。
不過數據中臺更加偏重于數據使用,較之于傳統數據倉庫的數據組織形式,數據中臺的數據覆蓋范圍更廣、數據關系和處理模式更復雜、數據使用方式更靈活,因而給企業內部數據使用人員的能力帶來較大挑戰。