網易云音樂用戶畫像資產治理及業務賦能
?在如今降本提效的大背景下,用戶畫像資產在人維度數據上占據大頭資源,歷史遺留問題也不少,數據治理迫在眉睫。本文將從項目背景、項目挑戰、項目方案、項目成果四個方面進行分享闡述,希望分享能幫助到大家。
1.項目背景
著重說明下業務和技術背景。首先是業務背景,云音樂現階段用戶增長瓶頸總量幾十億用戶,日活幾千萬左右,月活幾億,想要再增長用戶成本極高,精細化運營已經是破圈的必須手段。面對現在不同的用戶人群,具備不同的商業化潛質,需要對不同人進行商業化分層,才能更好的幫助用戶精細化運行。除了主站業務的拓展,子業務擴展也是迫在眉睫,用戶畫像可以幫助子業務從主站業務挖掘和擴展需要的用戶群體,幫助做業務擴展,擴單云音樂整體營收能力。
再說技術背景,主要也分3塊內容,歷史用戶畫像建設標簽重復建設,多達32張相關畫像表存在,部分依賴層級多,且標簽重復建設。圈選產品不統一,存在多套產品,比如muse、諾倫、sniper等,產品側需要做一定的重組。圈選產品的響應速度,也是整個產品獲得用戶依賴的核心指標,通過一定的技術改造實現從sql圈選到ms級圈選能力是很有必要的。
綜上,可以概括為云音樂用戶畫像資產,存在鏈路強耦合,計存高成本,口徑不統一,產品性能又不足的現狀問題。
2.項目挑戰
數據側難點:數量大,鏈路長,時效低,口徑多。數量大體現在用戶畫像涉及上千指標,需要對這些指標做統一的管理,確保指標及其對應表的高內聚底耦合,任務鏈路存在很多7-8層的任務層級,層級越多,任務的穩定性越差,需要對任務鏈路進行壓縮;實效性方面,現階段任務的時效性不高,每天產出的時間是10點左右,遠沒有達到用戶需要的6點時效性要求,需要進行產出時間的壓縮;關于任務的一致性,需要進行,則是如此之多的畫像指標,如何做到指標的一致性是具有很大挑戰的。
3.項目方案
3.1 方案框架
針對以上內容,這些臟亂差數據應該如何治理是值得我們花時間去做的事情。本項目結合實際可實現的內容,整理并完善整個項目方案,以治理降本和產品提效為兩大主線為解決方案,如下圖:
從圖中可以看出,整個項目分為五層。底層為畫像底表層,包括流量數據、用戶中臺數據、內容數據、會員數據、社區數據等數倉公共層數據;上層為畫像邏輯層,通過對底層數據進行實體關系建模,抽象成用戶基礎畫像、用戶行為畫像、用戶統計挖掘幾大塊內容。
用戶畫像的邏輯層建模就是為了實現整個畫像層,可以實現數據的一致性標準,確保數是高內聚低耦合的,同時也確保了整體的可擴展性,比如新增游戲業務的話,那就在行為畫像中添加游戲實體,可以實現整個邏輯層的可擴展而不需要重構整個內容。
畫像的應用層,測試整個畫像的輸出部分,包括畫像核心全量表,以及各類畫像的切片畫像,如會員畫像、日活畫像、月活畫像等等。
畫像產品層是基于畫像數據進行的畫像產品,包括魔鏡圈選產品,實現標簽管理的標簽工廠,實現標簽服務化的標簽服務能力等等。
在畫像邏輯層和畫像應用層涉及整個畫像的治理工作,包括畫像的產出保障以及任務下線。
再向上則是最終服務業務的業務產品,魔鏡通過打通和業務產品的能力,比如打通靈渠,可以實現從用戶人群圈選到用戶push的打通構建。還有天秤、音樂人運營等產品。
3.2 標簽建設
用戶畫像標簽建設以需求觸發為出發點,需求調研case如下左表。需求來源包括各線分析師、魔鏡、標簽工廠產品、運營同學等。通過結合數倉分層和ER實體關系建模的方法、依托業務訴求,設計畫像邏輯層。實現數據的高內聚低耦合,從而確保了良好的可擴展性。
比如歌單、歌曲、直播、mv都是實體對象,通過與用戶的二元叉乘得到相關數據指標,后續業務擴展游戲等,也可直接實現用戶叉乘游戲,實現橫向實體擴展。確保實體內數據高內聚,實體間數據低耦合。
3.3 保障體系
保障體系重點在于數據質量的監控保障,以數據穩定性、一致性、及時性、唯一性、完整性、準確性為核心保障內容,詳細工具和方式見下圖所示:
3.4 任務下線
任務下線機制則主要以定策略,用工具為主要手段,逐步推動下線。
3.5 魔鏡產品
用戶畫像下游接入魔鏡產品,實現用戶畫像表服務各類業務的圈選功能,下游鏈接各類產品投放產品,實現畫像數據的業務賦能。
4.項目成果
項目成果從產品價值、治理價值、業務價值三大塊說明。
4.1 產品價值
統一數據服務基于畫像數據及標簽元數據提供高效的標簽服務、圈選服務,基本覆蓋了云音樂全部業務圈選服務,應用于用戶運營、線上活動、AB實驗、廣告投放等多個產品及場景。統一數據開放接口的提供為用戶運營、線上活動、AB實驗、廣告投放全業務線提供服務,做到一次開發多產品使用,減少人力開發成本。
產品總計實現1900多次人群包圈選,百億次圈選,500萬次多的push服務,覆蓋音樂幾十億用戶和上百+標簽。
4.2 治理價值
總體預計下線32張表,上千多標簽治理,預計節約存儲成本近150萬,年節省計算成本近200萬,預計年度總節省300多萬元。
4.3 業務價值
除了產品鏈路打通后大大節省了push時效外,還有子業務的畫像服務場景,也大大體現了業務價值。比如某子業務使用主站用戶標簽數據,每日實現拉新幾千用戶,年可節省千萬左右成本。?