成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

業務數據治理體系化思考與實踐

原創 精選
開發 大數據 新聞
美團住宿數據治理團隊通過多年數倉建設及數據治理的經驗沉淀,并結合業務發展階段對于數據治理的訴求。

作者 |王磊、有為、尉斌等

美團住宿數據治理團隊從事數據治理工作多年,從最初的被動、單點治理,發展到后來的主動、專項治理,再發展到現在的體系化、自動化治理。一路走來,他們不斷進行積累和沉淀,也在持續思考與實踐。目前該團隊取得了一些階段性的成果,并得到美團多個業務線的認可和肯定。過程的經驗與教訓,希望能和大家分享,也希望能給從事數據治理工作的同學帶來一些新思路。

一、序言

美團住宿數據治理團隊通過多年數倉建設及數據治理的經驗沉淀,并結合業務發展階段對于數據治理的訴求,將治理的思路逐步從專項、表象、問題驅動的治理,轉變為自動化、體系化的治理,并從標準化、數字化、系統化三個方向進行了落地與實踐。

二、背景介紹

美團住宿業務從2014年上線之后發展多年,歷經探索期、進攻期,發展期,并逐步由發展期向變革期過渡。業務從之前的快速擴張階段進入相對穩定的發展階段,運營手段轉變為精細化運營,同時對數據的成本、效率、安全、價值等方向的要求也越來越高,這些都對數據治理提出了新的要求。

圖1 住宿業務發展階段

另一方面,住宿數據組所屬的數據中心內部有住宿、門票度假等多條業務線,各業務線業務模式不同,所處業務生命周期階段不同,在數據治理上的認知及經驗積累也不同。如何能將數據治理經驗及能力高效復用,使數據中心各業務線在數據治理的效率和效果上都能穩步提升,避免踩坑,這就需要數據治理更加標準化、體系化、自動化。

此前,我們在數據治理上已經有了一些積累和沉淀,前一階段主要從單點、被動的治理轉變為主動、專項的治理,治理動作有意識、有規劃,也有一定的針對性,且取得了一定的成果(前一階段的治理經驗可參考《美團酒旅數據治理實踐》一文),但總的來說仍以問題驅動治理、憑經驗治理為主。面對新的數據治理責任及要求,過往的方式存在著一些問題,主要包括以下幾個方面。

治理認知差異大

  • 認知不一致,思路不統一:治理缺乏通用的體系指引,不同的治理人對于數據治理的認知深度、問題拆解的方式、治理的思路步驟、采取的方法及其效果追蹤等方面,都存在較大的差異。
  • 重復治理、信息不通:治理不徹底、治理經驗缺乏沉淀,同樣的治理,不同的人反復實行。
  • 范圍交叉、邊界不清、效果難評估:不同的人針對不同的問題成立不同的專項進行治理,問題的底層邏輯有交叉。有的治理沒做什么動作,反而收到了較好的結果,有的治理對于結果說不清。

治理方法不標準

  • 流程規范缺失:對于每個方向、每類問題的治理缺少理論指導,治理的方法、動作、流程、步驟依賴治理人的經驗和判斷。
  • 問題難度量追蹤:治理的問題缺少衡量標準,更多靠人為來進行判斷,治理效果缺少評估體系。
  • 解決方案難落地:解決方案存在于文檔中,需要治理人查找理解,缺少工具支撐,成本較高。

治理效率低、效果差

  • 治理線上化程度低:治理依賴的資產信息、治理動作都分散于多個系統中,信息碎片化,執行效率低。
  • 過程無法標準化,結果無保障:治理過程需要治理人來“人為保障”,存在理解偏差和執行偏差。

數據管治缺乏體系化

  • 缺乏整體頂層治理方案設計:業務及數據中心對于數據治理的要求,需要治理更全面、更精細、更有效,需要治理的體系化,需要從宏觀角度進行思考,層層拆解,需要從整體、從頂層來做方案設計。
  • 問題越來越復雜,單點難解決:過往更多的是從表象去解決問題,從表面來看衡量指標有改善,實際是“頭痛醫頭、腳痛醫腳”,并沒有從根本上解決問題。或者多個問題具有共性,根本問題是一致的。比如查詢資源緊張的根本,可能是分析主題模型建設不足或運營不夠。
  • 不同問題的優先級無法確定:不同問題的優先級缺乏衡量標準和方法,主要靠人為判斷。
  • 治理不符合MECE原則:每個治理方向由哪些問題組成,哪些最重要,哪些的ROI最高,哪些問題和治理動作可以合并,同一問題在數倉不同主題、不同分層的衡量標準和治理方法應該有哪些差異,都需要在體系化治理中進行考慮。

三、治理體系化思考

從上述背景中不難看出,我們面臨著不同業務生命周期階段對數據建設和治理不同的要求及挑戰,同時過往更多的以被動治理、問題驅動的專項治理方式方法也比較落后,這直接導致技術團隊很難滿足業務方對于財務、業務支持等方面的要求。通過不斷的汲取教訓和總結經驗,我們開始意識到數據管治是一個非常復雜的綜合性問題,只有構建出一套標準的業務數據管治體系,才能確保數據治理在現狀評估、目標制定、流程規范建設、治理監控管理、能力建設、執行效率、效果評價等各環節有效落地。下面介紹一下我們在治理體系化層面的理解和思考。

3.1 什么是數據治理體系化?

針對數據管理和治理,我們期望搭建一套集管理體系、方法體系、評價體系、標準體系、工具體系等核心能力的組合,持續服務于數據管治實施。可以類比一般的電商公司,如果需要運轉并服務好顧客,它首先必須搭建起來一套銷售體系、產品體系、供給體系、物流體系、人力體系等等,只有這樣才可以相互配合,實現服務好用戶這一大目標。

圖2 數據治理體系思考

3.2 數據治理體系化如何解決目前治理存在的問題?

  • 方式方法上:先做頂層治理框架設計,從團隊整體視角定義和規劃好治理的范圍、人員、職責、目標、方法、工具等必須部分,再進行落地。更關注整體策略的普適性及有效性,而非深陷某個具體問題解決方案開始治理。
  • 技術手段上:以完善的技術研發規范為基礎,以元數據及指標體系為核心,對業務數倉和數據應用進行全面評價和監控,同時配套治理系統工具,幫助治理同學落地治理策略和解決數據開發同學治理效率低問題。
  • 運營策略上:通過對待治理問題進行影響范圍、收益情況進行評估,確定待治理問題的重要度,從管理者視角以及問題責任人視角2個途徑推動不同重要程度的治理問題解決。

3.3 業務數據管治體系框架如何建設?

我們的建設思路是:以團隊數據治理目標為核心導向,設計實現目標需要的相關能力組合,并根據組織要求,實施過程的問題反饋,持續不斷地迭代完善,最終實現數據治理的愿景。體系框架主要包含以下內容:

  • 管理層:立法,制定相關的組織保障流程規范、職責設計、獎懲措施,指導和保障數據治理順利進行,這是數據治理能夠成功啟動運轉的關鍵因素。
  • 標準層:設標準,制定各類研發標準規范、解決方案標準SOP等數據治理過程中需要的各類技術規范和解決方案,這是所有技術問題正確與否的重要依據,也是治理中事前解決方案必不可少的一部分。完善的標準規范和良好的落地效果,可很好地降低數據故障問題的發生量。
  • 能力層:完善能力,主要是基于元數據的問題度量的數字化能力,以及問題工具化檢測和解決的系統化能力。數字化和系統化能力是數據治理實施的科學性、實施的質量及效率的重要保障。
  • 執行層:設定動作,結合要達成的具體目標,對各治理域問題,按照事前約束、事中監控、事后治理的思路進行解決。目標的達成,需要拆分到7大治理域相關的具體問題中去落地。因此,一個治理目標的達成,很依賴治理域對問題描述的全面性及深度。
  • 評價層:給出評價,基于指標的問題監控,健康度評價體系,專項評估報告,評價治理收益及效果,這是實施治理推進過程監控,結果檢驗的重要抓手。
  • 愿景:長期治理目標,指導數據管治有方向地不斷朝著最終目標前進。

圖3 數據治理體系概覽

體系框架建設成果:業務數據治理體系框架是針對數據治理工作整體做的頂層方案設計,框架定義好了業務線數據治理是什么、怎么做、做什么、用什么工具以及達成什么目標。拉齊各方對業務數據治理的認知,標準化治理路徑方法和組成部分,指導數據治理有序、有效地進行。

圖4 數據治理體系框架

3.4 體系框架如何落地實施?

參照業務線數據標準化管治體系框架各組成部分特點,我們具體通過標準化、數據化、系統化3大部分能力建設及運營,來實現數據管治體系框架的落地,并應用在數據治理問題的解決中,最終拿到可量化的結果。

圖5 數據治理體系化落地思路

四、治理體系化實踐

4.1 標準化

數據治理標準化是企業進行數據資產管理的關鍵突破口和重要手段,一系列政策、法規、規劃需要轉化為標準和制度才能有效落地。數據治理標準化既有利于建立健全各種數據管理工作機制、完善業務流程,又有利于提升數據質量,保障數據安全合規使用,釋放數據價值。但在數據治理標準化建設過程中,我們經常會面臨以下三個問題:

  • 流程規范缺失:各個環節缺少標準和約束來指導規范化操作,無法有效杜絕問題的發生、解決。
  • 落地條件差:規范標準、SOP等不具備落地條件,靠主觀意愿,無法有效落地,效果差。
  • 建設方法不合理:規范建設Case by Case,缺少體系化建設思路導致“一直建、一直缺”。

針對上述三個問題,我們從解決問題的視角出發,劃分數據開發流程,通過事前約束、事中監控、事后分析評估的思路,整理補齊缺失的流程規范,從而實現標準流程規范在數據管治各環節全覆蓋,并建設系統化工具來保障標準規范的落地實施。下文將分別從規范建設及工具保障兩方面來介紹我們在數據治理標準化過程中是如何解決上述問題的。

圖6 數據治理標準化思路

4.1.1 規范建設

規范是數據治理建章立制的基礎,針對標準規范建設不合理及流程規范缺失的問題,我們用體系化的建設思路從整體架構上對數據開發流程及數據治理流程進行劃分,并針對全流程數據管治各個環節建設相應規范:

  • 數據治理管理規范:明確數據治理組織職責以及人員構成,確定數據治理實施流程及治理問題運維流程,以保障數據治理過程順利進行。
  • 數據研發規范:明確數據開發各個環節需要遵守的規范要求,從問題產生的源頭,通過建設完善的研發規范,指導研發工作按標準進行,一定程度上可減少問題發生。
  • 數據標準化治理SOP:明確各個治理問題治理動作,確保治理動作是標準且可實施。
  • 數據健康度評估規范:明確治理效果的評價標準,對數據體系做到長期,穩定及指標化的衡量。

圖7 數據治理規范化建設成果

4.1.2 工具保障

標準規范可視化-知識中心

在標準規范的共享方面,以往技術團隊在實際規范落地過程中可能存在以下問題:

  • 規范找不著:重要規范文檔散落在各個Wiki空間,導致使用時無法快速查找,效率低下。
  • 規范質量差:文檔沒有統一進行維護,無法持續進行迭代和完善,不能隨著業務及技術的發展更新。
  • 規范沒權限:文檔散落在各個成員的私人空間內部,未對所有人開通權限,優質內容無法及時共享。

針對上述問題,我們重新收集整理已有規范文檔并進行分類,補充缺失文檔,優化文檔內容,并新增知識中心模塊,將知識體系框架產品化,在產品層面維護統一的入口及權限管理,同時嚴格控制發布流程,解決了標準規范在實際落地時“找不著”、“質量差”、“沒權限”等問題。

圖8 知識中心及文檔發布流程

測試規范工具化-八卦爐

在數據測試規范落地方面,以往數據測試規范都是通過Wiki維護,無法約束大家實際執行過程,導致數據質量較差,容易出現數據故障。為減少數據開發過程中由于測試不規范而導致數據故障的情況,提升數據質量及業務滿意度,我們利用數據中心與數據平臺工具組合作共建的ETL測試工具(美團內部工具-八卦爐)來保障測試規范SOP落地執行,要求大家在不影響測試驗數效率情況下充分測試,實現數據治理問題在事前約束,減少事后問題量,保障數據質量,工具建設如下圖所示:

圖9 測試規范工具化-美團八卦爐架構圖

治理提效保質工具-SOP自動化工具

在日常數據開發工作中,數據工程師會承擔一部分數據治理工作,以往都是通過執行數據治理SOP中每個步驟對問題進行治理,但經常會面臨以下幾個問題:

  • 治理效率低:需要根據SOP中治理經驗,去各個平臺分別執行相應治理動作,對于一些步驟較為復雜的SOP,需要跳轉多個平臺操作,治理效率較低。
  • 治理過程無法約束:治理經驗浮于文字,無法約束數據工程師的執行動作,導致部分問題治理不徹底。

基于上述問題,我們開發了治理提效工具-SOP自動化工具,匯總多個平臺治理工具,將數據治理標準化SOP的各個執行步驟通過工具落地,實現在一個工具內一站式治理能力,約束工程師的治理動作,確保整個治理過程是標準的,效果是可監控的,從而提升了治理效率及治理質量。比如無效任務的治理,首先需要調研問題治理經驗并沉淀至SOP文檔,然后將SOP文檔中各個執行步驟依次通過自動化的工具進行配置。數據工程師在治理時只需要在一個界面內即可實現全部的治理動作,下圖是無效任務治理SOP及美團的自動化工具:

圖10 無效任務治理SOP及美團的自動化工具

4.1.3 標準化收益及建設經驗

通過數據治理標準化建設,我們解決了團隊在數據治理規范方面若干問題,取得了明顯效果:

  • 實現了數據開發、數據治理的標準化,解決了團隊內各小組之間在開發、管理、運維方面流程方法標準不一致的問題。
  • 通過測試工具對標準化測試規范進行落地,在事前阻塞問題發生,提升數據質量,減少故障發生。
  • 通過SOP自動化工具,有效保障治理過程的標準化,解決了治理效果差的問題。

同時,我們在實際建設的過程中,也總結了一些標準化的建設經驗:

  • 標準規范如何落地,需成為標準流程規范建設的一部分,最好有交付物。
  • 標準規范的制定,除常規內容外,需要綜合考慮組織目標、組織特點、已有工具、歷史情況、用戶反饋等因素,否則會給人“不接地氣”的感覺。
  • 標準規范的制定要優先考慮利用和適配已有工具能力,借助工具落地,而非讓工具適配流程規范。

4.2 數字化

以往大家在開展數據治理工作時主要依賴經驗判斷,缺乏科學可量化的抓手,對治理問題的嚴重程度無法準確感知,同時對治理收益的回收也不能準確評估。因此我們開展了數字化的工作,將大家數據開發工作用數據描述,構建整個數據開發工作的準確視圖。

4.2.1 數字化架構設計方案

建設思路:通過對數據生命周期各環節進行類比業務數倉建設中抽象和描述業務對象方式,進行元數據對象的抽象和描述,并建設成元數據數倉和治理指標體系,應用在數據管治場景。

框架主要包含元數據倉庫、指標體系、數據資產等級以及基于元數倉基礎上建立的各個數據應用,利用元數據驅動數據治理及日常團隊管理,避免過多依賴經驗解決問題,更好地服務業務。下邊幾個章節將分別介紹數字化框架最核心的數據內容:元數據倉庫、指標體系、數據資產等級。

圖11 數字化框架

4.2.2 元數據倉庫建設

元數據是描述數據的數據,包含數據資產種類、數據存儲大小、數據流血緣關系、數據生產過程等信息,存在信息種類多,分布零散,信息不完整的特點。豐富的元數據有助于我們快速了解團隊數據資產,讓數據資產更加精準,透明。為數據使用和價值釋放提供支撐。

我們的建設思路,采取數據業務化、業務數字化、數字應用化的思路來搭建元數據倉庫。

  • 數據業務化:即將數據工程師日常數據開發工作業務化描述,抽象多個業務過程,如需求提出、任務開發、數據表產出、數據應用、需求交付。
  • 業務數字化:用建設業務數倉的思路和方法,對數據業務化之后的各個業務過程及主題,搭建元數據數倉及指標衡量體系,并通過元數據場景化應用提升易用性及豐富度。
  • 數字應用化:在元數據倉庫基礎上開發數據產品,驅動數據管治實施。

圖12 數據業務化思路

通過數據業務化思路,我們抽象業務域、管理域、技術域等3大主題域來描述元數倉對象,并對每個主題域進行細分,劃分多個主題:

  • 業務元數據:基于具體業務邏輯元數據,常見業務元數據包括業務定義、業務術語、業務規則、業務指標等。
  • 技術元數據:描述了與數據倉庫開發、管理和維護相關數據,包括數據源信息、數據倉庫模型、數據清洗與更新規則、數據映射和訪問權限等,主要為開發和管理數據倉庫的工程師使用。
  • 管理元數據:描述管理領域相關概念、關系和規則的數據,主要包括管理流程、人員組織、角色職責等信息。

圖13 元數據倉庫主題信息

建設在元數倉分層上,我們采用最常見的四層架構分層方式,分別是貼源層、明細層、匯總層、應用層和維度信息。區別于業務數倉分層設計方式,從明細層就按維度建模思路組織數據,避免過度設計,只需要做好主題劃分和解耦。在匯總層從分析習慣出發耦合數據,提升易用性。應用層按需創建所需接口支撐應用。

圖14 元數據倉庫分層

目前,我們已完成元數據倉庫技術域、管理域、業務域部分內容的建設,并已支撐指標體系及上層多個數據應用,未來仍將根據大家在實際工作中核心關注的內容對元數倉進一步補充和完善。

圖15 元數據倉庫建設成果

4.2.2 指標體系建設

一個問題的衡量需要從多方面進行考慮,只用一個指標無法充分說明問題,這就需要一組有邏輯且相互關聯的數據指標來描述問題。在數據開發過程中,需要制定多個指標來監控衡量數據開發團隊在質量、安全、效率、成本等方面存在的問題。

此前,住宿數據團隊沒有一套成熟穩定的指標體系,無法長期準確衡量團隊的業務支持能力、技術能力。

2020年,我們在元數據倉庫基礎上搭建了數據治理指標體系,全面衡量了業務數倉建設過程中各類問題,通過指標體系監測工作中的優點與不足,提升了團隊的工作能力,進而提高了對業務的支持能力。

建設方案

指標體系的建設目標是監控團隊工作狀態和變化趨勢,需要能夠覆蓋到工作中的各個方面。因此,在指標體系的建設上,我們通過不同視角對指標體系進行分類,做到不重不漏全覆蓋,讓指標適用于不同使用場景:

  • 生命周期視角:從數據本身出發,衡量數據從生產到銷毀的各個過程,包括定義、接入、處理、存儲、使用、銷毀等等。
  • 團隊管理目標視角:根據團隊管理核心要達成的目標分類,包括質量、效率、成本、安全、易用性、價值等等。
  • 問題對象視角:根據治理問題核心關注的對象分類,包括安全、資源、服務、架構、效率、價值、質量等等。

圖16 指標體系多視角建設思路

建設成果

目前我們已建設技術、需求及故障三大類指標共計112個,全面覆蓋數據開發中的各個環節:

  • 技術類指標:覆蓋成本、質量、安全、價值及易用性5個方面共57個指標。
  • 需求類指標:覆蓋新增、響應、開發、上線及驗收等7個方面共36個指標。
  • 故障類指標:覆蓋故障發現、原因定位及處理環節共19個指標。

圖17 指標體系建設成果

元數據及指標體系應用:

  • 團隊管理:幫助團隊管理者快速了解團隊情況,提升管理效率。
  • 數據治理:利用元數據及指標體系驅動數據治理,為數據治理提供可量化的抓手。
  • 項目評估:幫助項目成員準確評估項目的問題、進展及收益。

建設思考

在指標建設過程中,我們沉淀了以下幾點經驗:

  • 指標體系既要解決管理者對日常工作無抓手的問題,也要成為具體問題處理人員的治理抓手,兼顧管理者和開發者。
  • 指標體系是展示偏整體層面的內容,還需通過指標解決實際問題,形成指標體系和數據治理工具閉環,實現發現問題、治理問題、衡量結果持續循環。
  • 優先確定團隊總體發展目標,從目標拆分設定指標,指標盡量覆蓋不同業務線不同發展階段。
  • 業務需要明確自己所處階段,針對不同階段,制定考核目標,衡量閥值,既統一了衡量標準,又中和了大家考核標準。
  • 指標需注意分層建設,避免“胡子眉毛一把抓”,便于適配目前的組織結構,也便于劃分責任與定位。
  • 基礎指標體系建設完成后,可作為平時管理和工作的抓手,作為項目發起的依據,作為項目結果評估的手段。

4.2.3 資產等級建設

隨著業務快速發展,團隊負責的數據資產規模也日益擴大。截止當前,團隊共負責離線Hive表3000+,ETL生產任務2000+,人均負責ETL生產任務100+。在面對規模日益擴大的數據資產,團隊管理者及數據工程師通常會遇到以下問題:

  • 只能評經驗判斷哪些是核心資產,遇到問題無法評估解決的優先級。
  • 核心鏈路的保障,比如SLA及DQC的配置范圍缺少科學的評估手段。
  • 管理者對團隊核心資產缺乏準確的判斷,無法準確有效的做出管理動作。

為豐富元數據之間的關系和內容,挖掘識別更有價值的數據信息,以元數據能力驅動數據研發及運維日常工作,在元數據倉庫的基礎上我們做了衍生能力即資產等級的建設。資產等級可以對數據的重要性進行科學有效地評估,也可幫助完善數據質量分級監控方案,從而實現對重點任務的重點保障。

下圖是數據資產等級通用計算流程,我們首先根據資產類型確認各個影響因子及影響權重值,劃分影響因子重要性等級,其次根據各個影響因子數值范圍劃分得分區間,最后匯總計算得到最終資產等級得分及資產等級結果,并抽樣驗證結果的準確性。

圖18 資產等級計算流程

資產等級建設(數據表)

下圖是針對數據表資產等級建設的方法和流程圖:

圖19 數據表資產等級劃分

1)確定影響因子及權重評估

影響因子的確定是資產等級計算中最為關鍵一環,合理評估影響因子對最終資產等級結果的準確性至關重要。根據實際數據開發中經驗可知,影響數據表重要程度主要有以下幾個關鍵因素:

  • 下游類型:決定下游資產重要程度,下游資產類型一般有ETL任務和數據產品兩類,ETL任務及數據產品又根據重要度分為普通型及VIP型。
  • 下游數量:決定是否是關鍵節點,對下游生產的影響范圍,下游數量越多表明影響范圍越大。
  • 使用熱度:決定是否有用,影響查詢用戶的范圍,熱度越高表明影響的用戶范圍越廣。
  • 鏈路深度及分層:決定問題的修復時間,鏈路越深,問題修復的時間可能就越長。

確定好影響因子之后,我們需要判斷每個影響因子所占的權重值。我們采用層次分析法來計算權重值(層次分析法主要應用在不確定情況下及具有多數個評估準則的決策問題上,具體計算步驟,大家可查閱相關的資料),其優點是把研究對象作為一個系統,按照分解、比較判斷、綜合的思維方式進行決策,而且計算過程簡潔實用。

2)計算資產等級得分

根據實際情況對每個影響因子劃分得分區間,并結合每個影響因子權重值,可以計算得到資產等級最終得分。總得分為各影響因子得分與對應權重乘積加和。

3)資產等級映射

我們將資產等級最終得分劃分區間至L1 ~ L5,L5為最高資產等級,L1為最低資產等級。

圖20 資產等級劃分

資產等級應用場景(數據表)

目前,資產等級已運用到日常管治實施,為數據分級管治提供了有力的抓手:

圖21 資產等級應用場景

4.3 系統化

4.3.1 數據百品-管治中心

除了標準化和數字化之外,我們數據治理體系落地仍面臨諸多問題:

  • 數據資產無法統計和描述,管理者及數據工程師不知道有什么,缺乏資產的可視化。
  • 管理者缺少抓手發現團隊的問題,且問題難以追蹤。
  • 治理線上化程度低,需要跳轉多個工具,治理效率低,治理過程無法標準化,導致結果無法保障。

針對上述問題,我們搭建了數據百品-管治中心治理平臺(美團內部產品),實現了集資產管理、問題分析監控、自動化治理、過程追蹤、結果評價的一站式、全覆蓋數據治理平臺,能有效提升治理質量和效率,為數據質量提升做好強有力的支撐。通過“管+治”相結合的理念,分別從管理者及研發人員的視角對數據、人效等問題實現全面監控,并實現了資產全景、管理中心、治理中心三大模塊:

圖22 管治中心建設思路

資產全景

資產全景從管理者+數據RD視角出發,介紹了當前數據現狀即有什么的問題,幫助業務線管理者及數據RD實現數據資產可視化,為管理者提供技術管理的抓手,為數據RD提升數據探查和數據使用效率。包含資產大盤、資產目錄、個人資產三個子模塊:

  • 資產大盤:從業務線管理者視角出發,展示了業務線內各類資產概覽,幫助管理者一站式快速了解組內數據資產,無需跳轉多個平臺。
  • 資產目錄:展示團隊數據各資產類型及明細,為數據RD數據使用提供信息支撐,提升RD數據探查效率。
  • 個人資產:從歸屬人視角,展示數據RD個人及小組名下數據資產數量和資產類型及數據明細,詳細描述個人資產信息。

圖23 資產全景建設思路

管理中心

數據團隊管理者在日常團隊管理中時經常會面臨兩個問題:

  • 管理手段多依賴經驗判斷,當團隊需求承接增加、團隊人數增加時會帶來管理難度的提升,管理者缺少抓手快速看到團隊的整體情況。
  • 管理動作天級別。管理者發現團隊某核心指標異常(例如:故障數),需要找對應的責任人詢問,無法從系統上快速進行異常追蹤,原因獲取。

管理中心主要從管理者視角出發,解決了怎么管的問題,通過管理者關注的核心指標,為管理者提供監測團隊狀態、判斷團隊問題、輔助管理決策的能力,讓管理者從“依賴經驗管理”轉變為“數據驅動管理”。包含管理者大盤、運維管理、需求管理、團隊管理四大模塊:

  • 管理者大盤:向管理者提供團隊核心指標總覽、問題趨勢分析、異常明細追蹤、異常原因標記等功能,方便管理者快速了解團隊情況,及時做出管理動作。
  • 需求管理:提供詳細的人效分析大盤以及需求管理功能,服務于人效管理及提效。
  • 故障管理:提供詳細的故障分析大盤以及故障復盤管理能力,提升故障管理效率。
  • 團隊運營:團隊周月報,值班,滿意度問卷等團隊運營需要的能力,提升運營效率。

圖24 管理中心建設思路

治理中心

日常數據治理過程中,問題責任人解決問題主要有以下痛點:

  • 不了解分配給自己的待治理問題背景、目標和重要程度。治理工作成為盲目去完成分配的任務,即使完成了治理動作,可能依然無法保證是否真正達到治理目標,尤其是面對同時需要處理多類治理問題時,效果差。
  • 數據治理解決問題時通常要使用各類工具互相輔助才能解決,問題多了之后,治理問題變成了重復使用不同的工具,嚴重影響治理效率和效果。

治理中心從問題責任人視角出發,解決了怎么治的問題,為一線治理工程師提供從問題評估分析,到治理,到進度監控的一站式治理能力。將治理工作精細化、常態化運營,提升了數倉治理質量和效率。包含治理概覽、分析評估、問題治理、進度監控四大模塊。

  • 治理概覽:治理中心首頁,介紹了團隊數據治理體系框架及標準化治理成果,讓使用者在認知上與治理中心的治理理念一致,并提供數據治理優秀解決方案。
  • 分析評估:對七大類治理問題進行量化評估,提供治理優先級及問題排名,讓用戶了解應該先做什么。
  • 問題治理:提供豐富治理指標,全面衡量治理問題,問題分配及時通知,并利用SOP自動化工具,實現對解決問題過程的標準化,保障治理效果,提高治理效率。
  • 進度監控:提供問題治理進度看板及問題分配進度監控,便于管理者宏觀把控問題治理進度,合理規劃分配節奏。

圖25 治理中心建設思路

4.3.2 SOP自動化工具

在日常數據治理過程中,每個團隊都會沉淀若干SOP規范文檔來指導大家進行問題治理,減少問題發生。但是在SOP的落地上,依然存在很多問題:

  • SOP一般以Wiki形式存在,實際執行過程無法跟蹤約束。
  • SOP動作的執行需要跳轉多個平臺系統,執行效率低下。
建設方案

基于上述問題,我們開發了SOP自動化配置工具。SOP自動化工具是一款SOP配置工具,適用于問題治理類SOP,將治理動作通過工具進行配置以提高治理效率,進而保證過程質量和結果質量。目標是解決SOP規范文檔在落地過程中遇到的執行效率低、過程無法跟蹤監控的問題,實現一站式解決問題的能力。SOP自動化工具主要包含基礎組建層、配置層及應用層,以下是產品架構圖及產品界面:

  • 基礎組建層:SOP最小粒度模塊,包括展示類組件(富文本、表格、IFrame),邏輯控制類組件(單選、多選),用戶可根據SOP內容選擇多個基礎組件組合。
  • 配置層:配置SOP中使用參數信息及執行步驟。
  • 應用層:SOP最終效果展示,通過URL接口對外提供服務,比如治理中心可調用SOP工具接口實現一站式治理能力。

圖26 SOP自動化工具架構

圖27 SOP自動化工具產品

SOP實際操作步驟如下:

用戶在創建SOP后可選擇性配置需要展示的數據信息,然后按照SOP執行步驟依次拖動各個基礎組件,并填寫執行操作完成SOP的配置工作,在效果預覽完成后即可發布上線并生成外嵌URL。自動化工具主要通過外嵌的形式對外提供服務。

圖28 SOP工具化操作步驟

應用場景

通過SOP自動化工具,數據治理已實現了問題解決過程線上化、步驟標準化,很好地保障了治理效果,提升了治理效率。下圖是無效存儲指標在使用SOP自動化工具前后的流程對比,通過對比,我們可以看到之前工程師需要人工確認若干信息,并跳轉多個平臺操作,現在只需要在一個界面完成所有動作,極大地減輕了研發人員的工作量。

圖29 無效存儲流程優化對比

目前,我們團隊已完成7大治理域內30多個指標的治理SOP建設,并均已通過自動化工具落地。后續,我們仍將探索其他專項治理內容,并利用SOP自動化工具輔助開展數據治理的工作。

4.3.3 經驗總結

通過數據治理系統化的建設,我們總結了以下幾點:

  • 系統化是將解決問題的方法從線下到線上,從散點動作到連貫動作的一種有效解決方案。
  • 沒有完美的系統,也不必追求完美,考慮投入產出比,快速解決主要矛盾,應用到具體問題解決中。
  • 產品定位設計,產品長遠規劃的能力設計尤為重要,否則容易出現“做著做著不知道做什么,不知道往什么方向發展”的情況。

五、業務數據治理實施流程

數據治理實施流程,是我們依據業務數據治理標準化框架在實施解決具體數據問題時,總結抽象出來的一套適用于大多數治理場景解決問題的通用標準流程。標準流程的好處在于更加規范化數據治理工程師的操作流程,來保證實施的質量。流程一共包含5個步驟:

  • STEP 1:發現問題和制定目標,發現問題要從業務數據開發團隊的視角出發,圍繞服務好業務、遵守數據研發規范、收集好用戶反饋,盡可能全地發現和收集相關需要解決的問題。同時,制定的目標要具備可實現性。
  • STEP 2:針對問題進行拆解,設計可衡量的指標,并通過元數據的采集建設進行實現,用做對目標的進一步量化,并作為實施過程監控及治理抓手。
  • STEP 3:對衡量出來的具體問題,制定相關的解決SOP,并且檢查相應的研發標準規范是否完善,通過問題發生的事前、事中、事后幾個階段,建設或完善相應的工具化解決問題的能力。
  • STEP 4:推廣運營,以拿結果為核心目標,針對不同角色運用不同策略,重點關注問題解決過程是否會與用戶利益發生沖突,控制好節奏,根據問題的重要程度有規劃地進行解決。
  • STEP 5:總結沉淀方法論,迭代認知,持續探索問題的最優解,優化治理方案和能力。

圖30 業務數據治理實施流程

六、總結與展望

經過在數據治理體系化建設上的持續思考與實踐,我們的體系化框架基本建立,在數據治理的標準化、數字化和系統化三個方向上取得了較大的進展,并且在業務應用上取得了一定的成績。更重要的是,我們在數據成本、安全、效率等多個領域都幫助業務解決了實際的問題,尤其是在成本方面,預計每年可以幫助業務可節省數百萬的成本,獲得了業務方的肯定。

但對比“理想終態”,我們的工作仍任重道遠。數據治理體系化框架這個龐大“身軀”中的各個血脈、骨骼、臟腑還需要持續充盈,在流程規范、元數據數倉、指標體系、資產分級等的建設過程中,還有很多需要靠專家經驗、人為判斷、人工操作串聯的場景存在。下一步,我們將在智能化(如智能化元數據服務、智能化數據標準建設等)、自動化(基于治理框架的治理應用場景的線上化建設等)等方面發力。

七、作者簡介

王磊、有為、尉斌等,均來自美團數據科學與平臺部。?

責任編輯:張燕妮 來源: 美團技術團隊
相關推薦

2022-03-15 10:00:00

美團數據治理

2022-12-30 15:27:13

2023-04-10 07:34:30

2022-06-24 10:55:19

數據治理

2022-03-10 10:06:57

數據治理美團體系化建模

2024-07-05 09:24:11

2020-08-18 08:11:08

安全體系化建設漏洞網絡安全

2023-03-15 18:34:26

資源治理數據治理業務線

2022-08-16 11:56:47

數據泄露勒索攻擊

2023-12-20 07:35:03

大模型數據治理機器學習

2023-06-05 07:24:46

SQL治理防御體系

2014-07-15 14:17:30

成本業務去IOE

2020-04-08 10:41:25

Flutter阿里混合棧

2021-05-21 16:26:46

數據安全治理

2024-04-02 07:56:41

2024-02-22 08:51:46

大數據白盒化治理數據治理

2022-11-10 20:43:57

數據治理數據湖

2023-11-24 07:10:44

數據治理PCG

2022-12-26 16:34:51

開源云原生

2024-10-15 08:14:51

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 亚洲精品久久久久久一区二区 | 一色一黄视频 | 欧美国产视频 | av免费入口 | 99精品视频一区二区三区 | 午夜免费观看体验区 | 国产成人精品一区二区三区网站观看 | 亚洲一区二区在线视频 | 亚洲精品91 | 国产精品99久久久久久动医院 | 欧美精品一区二区三区四区 在线 | 亚洲国产一区二区三区在线观看 | 在线播放日韩 | 国产精品美女久久久久久免费 | 成人精品国产一区二区4080 | h视频在线免费观看 | 免费在线观看成年人视频 | 中文成人无字幕乱码精品 | 中文字幕免费中文 | 精品1区2区3区4区 | 激情久久网| 国产成人综合久久 | 精品国产一区二区三区在线观看 | 黄色一级片在线播放 | 黄篇网址 | 国产1区2区3区 | 99re在线| 女同久久另类99精品国产 | 蜜桃在线一区二区三区 | 人人澡人人爱 | 91色在线| 黄色一级大片在线免费看产 | 99久久精品免费看国产小宝寻花 | 日韩成年人视频在线 | 夜夜草视频 | 欧美一区在线视频 | 国产精品无码久久久久 | 成人黄视频在线观看 | 国产情侣在线看 | 久久久69 | 国产成人精品一区二区三区网站观看 |