成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

「數倉面試」如何確定主題域?

大數據
簡單說,一個主題對應一個分析對象。分析對象就是在決策、分析時重點關注的東西,這個東西其實是非常主觀的,在不同的企業,或者企業的不同發展時期,所關注的點會不一樣,從而影響有些主題可能存在或者不存在。

大家好,我是一哥,前幾天跟一個朋友聊了一些數據中臺建設的內容,針對數據倉庫中主題域如何劃分這個話題聊了很多。其實數據倉庫建設的理論大家已經都知道了不少,也看過不少書,那么在實際建設數據倉庫中,我們還是會遇到各種問題。

前段時間招人,面試了幾個簡歷上都寫了有3年以上數倉開發的,當我問他“如何確定主題域?”,他卻說“我來公司的時候已經都搞好了……”,再問他“如果進入一個新領域,從0到1搭建數倉,怎么確定主題域呢?” 他就蒙了……

今天一哥帶你一起聊聊主題域如何劃分?

01什么是主題

主題是在較高層次上將企業信息系統中的數據進行綜合、歸類和分析利用的一個抽象概念,每一個主題基本對應一個宏觀的分析領域。在邏輯意義上,它是對應企業中某一宏觀分析領域所涉及的分析對象。

簡單說,一個主題對應一個分析對象。分析對象就是在決策、分析時重點關注的東西,這個東西其實是非常主觀的,在不同的企業,或者企業的不同發展時期,所關注的點會不一樣,從而影響有些主題可能存在或者不存在。

數據倉庫是面向主題的應用,主要功能是將數據綜合、歸類并進行分析利用。數據倉庫模型設計除橫向的分層外,通常還需要根據業務情況縱向劃分主題域。主題域是業務對象高度概括的概念層次歸類,目的是便于數據的管理和應用。

02如何劃分主題

劃分主題域方法

在業務調研之后,可以進行主題域的劃分。劃分主題域,需要分析各個業務模塊中有哪些業務活動。通常我們按照以下方法劃分主題域,可以按照用戶企業的部門劃分,也可以按照業務過程或者業務板塊中的功能模塊劃分。

按照系統劃分:業務系統有幾種,就劃分為幾類

按業務過程劃分:比如業務系統中有商品、交易、物流等

按部門規劃:比如公司內的生產、供應鏈、研發、銷售等

目前有些成熟的行業,比如電信、銀行,他們也是最早用數據倉庫的行業,已經形成了一些規范,可以直接按照規范來就行了。其中IBM金融數據模型數據存儲模型FSDM,是金融行業應用極為廣泛的數據模型,可以作為我們構建企業級數據倉庫主題域模型劃分的重要依據。

=

對于新興的一些行業,或者業內沒有形成標準的話,那么就可以參照上面的幾類方法,進行分類,先從邊界清晰的系統入手進行建設,形成經驗后逐步推到各個系統中。

個人比較推薦通過業務系統來進行一級主題域劃分,這樣邊界就會很明顯,數據倉庫開發過程中不會因為模型主題的歸屬“扯皮”,然后根據各個系統中的業務過程劃分二級主題域目前我參與過的兩個數據倉庫建設項目也都是這樣搞的。

主題域的核心

為保障整個體系的生命力,主題域需要抽象提煉,并長期維護更新,但不輕易變動。劃分數據域時,需滿足以下兩點:

  • 能涵蓋當前所有的業務需求。
  • 能在新業務進入時,無影響地被包含進已有的主題域中和擴展新的主題域。

一次能劃分好主題域嗎

首先,主題域是無法一次劃分完整的,一般是一次先建立幾個明確的主題,在大多數數據倉庫的設計過程中都有一個主題域的選擇過程。業務是一直發展的,因此設計之初不要想著一次把所有主題全部劃分完整。我們可以遵循上面說的劃分主題域的兩個要點,后續采用迭代的方式補充。

03總結

數據倉庫建設是一套方法論,但并不是一個“定理”,可能不會有完全符合你實際公司業務的“公式”,我們需要學習這些方法論,然后結合自己公司實際的業務場景來實現,只要能有序的把數據管控起來,同時又能高效的幫助數據分析,實現業務價值就好了,不必一味的追求“行業標準”。

本文轉載自微信公眾號「數據社」,可以通過以下二維碼關注。轉載本文請聯系數據社公眾號。

 

責任編輯:武曉燕 來源: 數據社
相關推薦

2021-08-30 07:49:34

數據庫數倉Doris

2023-03-08 07:50:57

企業數據治理

2022-12-08 10:16:58

數據模型

2021-01-31 23:54:23

數倉模型

2021-09-01 07:21:41

數倉RFM模型

2022-08-22 17:46:56

虛擬數倉Impala

2021-09-28 07:12:08

數倉開發工具

2023-02-16 07:30:38

引用計數算法

2021-01-04 05:42:48

數倉模型設計

2022-07-26 15:38:58

數據倉數據治理數據團隊

2023-01-03 17:43:39

網易郵箱數倉

2021-06-11 07:26:16

數據倉庫機器學習

2022-03-01 17:16:16

數倉建模ID Mapping

2025-06-11 02:45:00

2021-12-02 08:41:30

數倉建模設計

2023-11-23 16:53:56

數據倉庫大數據

2022-02-18 09:02:04

數據倉庫治理

2022-04-01 12:38:32

cookie代碼面試

2024-03-06 14:48:54

云原生

2025-06-11 08:35:00

數據倉庫數倉分層架構
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 亚洲91精品 | 在线亚洲欧美 | 欧美午夜精品 | 午夜爽爽男女免费观看hd | www.伊人.com | 欧美区在线 | 国产一区二区三区在线 | 99精品99| 中文字幕 国产精品 | 欧美精品一区二区三区在线 | 99小视频 | 亚洲综合在线视频 | 亚洲精品福利视频 | www.jizzjizz| 国产精品一区二区欧美黑人喷潮水 | 日韩中文不卡 | 国产毛片久久久久久久久春天 | 在线看91| 韩国理论电影在线 | 99亚洲 | 久久一区二区三区四区五区 | www.99re| 精品久久久久久亚洲精品 | 欧美精品一区二区三区在线播放 | 国产精品久久av | 午夜看片网站 | 欧美日韩在线精品 | 羞羞的视频免费在线观看 | 欧美v免费 | 日韩精品一区二区三区久久 | 国产精品亚洲欧美日韩一区在线 | 国产高清美女一级a毛片久久w | 日韩无| 亚洲成人一区 | 亚洲最色网站 | 狠狠躁夜夜躁人人爽天天高潮 | 欧美日韩国产一区二区 | 久久91av| 99精品在线观看 | 免费精品在线视频 | 青青草这里只有精品 |