成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

用通用語義層解決數據不一致問題

譯文 精選
大數據 數據倉庫
不同的BI、分析和數據科學工具導致用戶組之間在數據解釋、業務邏輯和定義方面存在差異,通用語義層可以解決這些差異。

譯者 | 晶顏

審校 | 重樓

據Gartner數據顯示,不良數據每年給企業造成1290萬美元的損失。因此,數據領導者幾十年來一直在為他們的商業智能(BI)和分析尋找單一的事實來源,以確保每個人都基于相同的數據和定義做出業務決策。

為了使數據保持一致性,BI提供商引入了語義層的概念,即在用行、列和字段名描述的原始數據之間的抽象層,只有數據專家才能理解,并為業務用戶提供見解。語義層隱藏了數據的復雜性,并將其映射到業務定義、邏輯和關系。它允許業務用戶使用收入和利潤等標準術語進行自助分析。

語義層激增

如今,BI工具及其相關的語義層激增,證實了語義層是一個備受歡迎的發展趨勢。上世紀90年代,BusinessObjects在SAP BusinessObjects中構建了第一個輕量級語義層。問題在于,早期的BI套件(如businessojects)是單一的,且用戶界面不是特別友好。失望的用戶轉而采用了Tableau、Power BI和Looker,因為它們的易用性得到了提高。今天的問題是,這些工具已經在組織中不斷發展和演變,粉碎了所有關于單一真相來源的希望。

現在,組織的不同部分使用不同的BI、分析和數據科學工具,創建獨特的數據定義、維度、度量、邏輯和上下文。獨立的團隊也分別管理他們自己的語義層。這將導致用戶組之間在數據解釋、業務邏輯和定義方面的差異,從而對來自數據的報告和情報產生不信任情緒

此外,這種不一致也經常導致團隊之間的混亂。例如,活躍客戶是否為您的服務購買了持續付費訂閱?或者是最近七天內登錄過的人?或者有人已經注冊了七天免費試用?不一致的定義會影響財務團隊的計費目的,影響續訂團隊的客戶識別,影響處理和準確報告銷售產品的操作。

數據倉庫中語義層的興起

或許是覺得數據環境還不夠復雜,數據架構師開始在數據倉庫中實現語義層。架構師可能會認為他們管理的數據資產是所有用例的唯一真實來源。然而,通常情況并非如此,因為數以百萬計的非規范化表結構通常不是業務就緒”(business-ready的。當語義層嵌入到各種倉庫中時,數據工程師必須通過設計和維護數據管道來將分析用例與數據連接起來,通過轉換生成“分析就緒”(analytics-ready)的數據。

如果沒有一致的語義層,數據工程師就會在他們專門構建的管道中硬編碼語義,以支持他們的數據消費者。語義含義(定義)很快變得靜態和不靈活,使得集中式架構團隊難以跟上不同工作組特定領域的需求。隨著規模的擴大,代碼變得難以管理和不一致。這種方法會導致延遲和依賴,從而阻礙基于數據的決策。

本地化的語義層進一步擴展

更大的挑戰是,隨著數據倉庫遷移云端,用戶查詢可能變得非常緩慢。緩慢的性能迫使業務用戶提取數據并將其加載到他們首選的分析平臺中,以便實現輕松地操作和更快地查詢,從而在本地化的語義層中進一步擴展語義。

在今天的大多數情況下,在數據堆棧周圍都有一些語義層——云數據倉庫中有一,轉換管道中有一,每個BI工具中都有一。由于數據工程師每次設計新的數據管道時都要重新創建常見的業務概念(例如,逐年預測或貨幣轉換),這種語義蔓延造成了極大的效率低下。每當需要回答涉及不同數據定義或業務邏輯的新業務問題時,數據團隊都需要不斷地重新創建散布在各種語義層中的公共業務概念重復性的工作不僅浪費時間和資源,還會導致數據團隊產生倦怠情緒

創建通用語義層

我們需要的是一個通用的語義層,為所有可能的數據體驗定義所有指標和元數據:可視化工具、面向客戶的分析、嵌入式分析和人工智能代理。使用通用語義層,業務中的每個人都同意客戶潛在客戶等術語的標準定義集,以及數據之間的標準關系(標準業務邏輯和定義),因此數據團隊可以構建一個一致的語義數據模型。

通用語義層位于數據倉庫之上,為各種數據應用程序提供數據語義(上下文)。它可以與轉換工具無縫協作,允許企業定義指標、準備數據模型,并將其公開給不同的BI和分析工具。

為了構建通用語義層,數據團隊必須首先建立業務邏輯、運算和上下文,這些都將進入語義數據模型。他們首先了解業務需要解決的實際問題,收集必要的數據,然后對數據之間的關系進行編碼,并定義治理和安全策略,以啟用可信訪問。之后,他們使用元數據在數據上構建抽象,以便向下游數據消費者一致地公開維度、層次結構和運算

一旦建立了底層數據和語義,通用語義層必須與數據消費者集成,例如生成式AI、BI、電子表格和嵌入式分析。Cube Cloud是一個通用的語義層平臺,提供了大量預構建的集成和強大的API套件,因此企業可以一次建模數據并將其交付到任何地方。它還提供了大量開發人員工具,使協作和構建數據模型、設置緩存和預聚合以及維護數據訪問控制變得更加容易。

通用語義層的好處

有了通用語義層,數據團隊就有了更多的治理和控制,如果實施得當,終端用戶可以從數據中獲得更多價值,減少團隊之間的誤解。這提高了效率,并確保所有數據消費場所都使用相同的、準確的數據。因此,無論數據是由查看儀表板的人使用,還是由向某人提供問題答案的大型語言模型使用,數據都是一致的。

所有這些都使得數據團隊可以更輕松地將數據快速交付給他們在內部和外部工作的各種消費者。數據團隊可以輕松地更新或定義新的度量標準,設計特定于領域的數據視圖,并合并新的原始數據源。他們還可以執行治理策略,包括訪問控制、定義和性能。

另一個好處是:隨著數據量的激增,云計算的成本也在飆升。通用語義層通過預處理或預聚合數據、存儲常用的業務指標并將其用作分析的基礎來解決這個問題,從而降低了云數據費用。通用語義層還在企業范圍的數據上提供了異常高的性能和低延遲,加快了用戶查詢的速度。

結語

我們需要一個通用的語義層來支持下一代數據驅動的應用程序,并接受這樣一個現實:將有許多不同的工具來可視化和使用這些數據,以及存儲這些數據的許多不同數據源。最后,通用語義層可以為企業指標創建一個單一的事實來源為決策者提供他們需要的數據,以獲得一致、快速和準確的答案。

原文標題:Overcoming data inconsistency with a universal semantic layer,作者:Artyom Keydunov


責任編輯:華軒 來源: 51CTO
相關推薦

2024-05-11 07:37:43

數據Redis策略

2021-04-18 15:01:56

緩存系統數據

2013-03-29 11:16:17

2017-06-20 09:42:52

網絡安全法數據隱私法網絡安全

2017-08-25 17:59:41

浮點運算C語言

2018-07-15 08:18:44

緩存數據庫數據

2024-04-07 09:00:00

MySQL

2025-04-03 09:51:37

2021-05-27 18:06:30

MySQL編碼數據

2013-12-13 14:46:55

OSPFMTU鄰接關系

2022-03-18 10:53:49

數據系統架構

2020-07-20 14:06:38

數據庫主從同步服務

2018-07-08 07:38:28

數據庫緩存數據

2022-03-16 15:54:52

MySQL數據format

2021-01-19 10:39:03

Redis緩存數據

2021-09-02 07:56:46

HDFSHIVE元數據

2010-06-02 10:53:28

MySQL版本

2011-02-22 14:02:48

vsftpd

2021-12-26 14:32:11

緩存數據庫數據

2021-12-30 09:32:04

緩存數據庫數據
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 91一区 | 91精品欧美久久久久久久 | 涩涩片影院 | 日韩色在线 | 婷婷综合| 九九亚洲| 国产精品久久在线观看 | 亚洲自拍偷拍免费视频 | 91精品国产麻豆 | 日韩成人免费av | 成人黄色电影在线观看 | 欧美色综合一区二区三区 | 免费观看色 | 成人国产一区二区三区精品麻豆 | 国色天香综合网 | 久久综合影院 | 人人做人人澡人人爽欧美 | 色综合久久88色综合天天 | 欧美久久一区二区三区 | 国产日韩一区 | 久久久久国产精品一区二区 | 国产精品日本一区二区在线播放 | 亚洲一区二区三区在线视频 | 中文字幕亚洲一区二区三区 | xx性欧美肥妇精品久久久久久 | 精品国产91| 国产视频线观看永久免费 | 欧美精品一区二区三区四区 在线 | 亚洲精品福利视频 | 日韩视频在线免费观看 | 一区二区三区在线播放视频 | 成人免费在线播放 | 国产在线看片 | 羞羞视频在线免费 | a网站在线观看 | 免费观看一级黄色录像 | 欧美1—12sexvideos | 国产精品极品美女在线观看免费 | 毛片入口 | 在线视频 亚洲 | 美女视频一区二区三区 |