成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

聊聊我們在業務鏈路升級中做的數據洞察

開發 開發工具
關于數據相關的詞條很多,雖然有不同的定義,但是本質上是相輔相成,通常結合使用才能拿到結果。

一 概述

關于數據相關的詞條很多,雖然有不同的定義,但是本質上是相輔相成,通常結合使用才能拿到結果。

類比詞條諸如 數據分析,數據挖掘, 數據洞察。

以下為wiki上的定義

  • 數據分析:是一種統計學常用方法,其主要特點是多維性和描述性。有些幾何方法有助于揭示不同的數據之間存在的關系,并繪制出統計信息圖,以更簡潔的解釋這些數據中包含的主要信息;
  • 數據挖掘:是一個跨學科的計算機科學分支。它是用人工智能、機器學習、統計學和數據庫的交叉方法在相對較大型的數據集中發現模式的計算過程;
  • 數據洞察:這一項目前沒有wiki詞條,基于普遍認知,是基于數據分析和數據挖掘,結合業務場景后,圍繞業務鏈路定義統一口徑,進而更好的分析問題,并且能夠進一步做策略改進。

三者分析手段本質上都是對數據進行加工獲取信息,但是目標不盡相同,以下是我個人的理解。

  • 數據分析更側重,基于人的理解動線,結合人對業務和數據的理解,產出分析結果。這里更加強調人的分析;
  • 數據挖掘同理數據分析,只不過角色從人變為了機器;
  • 數據洞察是在數據分析和挖掘的基礎上,引入了業務場景的概念,梳理出圍繞業務場景結果的影響因素和鏈路,目標是對抽象問題進行歸因、拆分以及更好更快的形成改進方向。這個也是我們業務開發同學最有優勢的地方。

二 核心要素

我們發現,數據洞察的理解,實際上是可以分為幾個核心要素。

這里我們逐一來簡要說明。

1 數據

干凈有效的數據才是我們要的數據,否則會誤導后續的結論。e.g. 登錄鏈路因為是業務安全水位保證的第一環節,經常有來刷的流量,如何避免因為灰黑產的流量,影響后續的判斷,這個也是重中之重;

2 業務場景

業務場景是區分數據洞察和其他數據分析方式的核心區別,也可能是業務同學區分bi分析的最大的價值點。任何分析策略都脫離不開對業務場景的理解,而不是單純的理解數據。

定義“一次完整業務鏈路行為”是核心,圍繞著一次行為鏈路,才能就鏈路分析有用的策略。

3 口徑

口徑是什么?我理解口徑是在合理的數據維度和好的目標的基礎上對業務場景的理解,口徑上也會結合對業務場景的理解和對業務目標的理解。數據維度可能是多種多種的。

還是以登錄舉例,正常的理解,一個用戶在一個設備上登錄是正常情況,但是手淘會出現多賬號登錄同設備,這個也是常態數據特征,那究竟在定義登錄成功率的時候,是使用設備維度(認為同一個設備只要有一個用戶登錄成功即算設備成功)還是使用用戶維度(只看用戶維度數據,不結合設備定義指標),也是需要考量的。

三 數據建設

1 數據的清洗是保證數據有效的手段

我們獲得的各種打點框架和不同的數據源,可能維度和信息量都是不統一的,比如有的數據源有設備信息但是沒有用戶信息,有的數據源有用戶信息,但是設備信息不完整;甚至同一個時間字段,格式也是不統一的。

這個時候就需要先對數據進行加工了,剔除臟數據,補充遺漏點位,加工出干凈的單維度信息,并且保證各數據源數據加工出的數據維度和格式統一,比如標準的設備id或者用戶id及時間等。

2 數據建設是補充也是演進

數據質量問題,不止要從數據的清晰看,也數據產生的點來看。如果數據有缺失或者不統一,數據清洗又搞不定,就需要進行開發了,比如數據庫增加字段,打點框架增加打點邏輯。

數據建設是一個長期的過程,不止是為了補充現在要分析的內容,也是要形成一套標準的交付產物。更進一步,日常做需求和項目的時候,打點數據質量也是要考慮的,畢竟做需求上線不是結果,拿到業務目標才是結果。

四 業務場景

1 業務場景的定義

業務場景是在整個業務洞察中最特殊的一個環節。這個環節定義的好壞,直接影響了問題拆分結果的有效性。

不同的業務場景具備各自的特殊性,需要結合業務特性來分析。

按照目前我的經驗來看,業務場景的定義也是有一些核心方法的。

  • 業務場景中,最終產物是誰?

還是以登錄舉例,登錄的最終目標肯定是為了下發登錄態,否則也沒有人回來“玩一玩”登錄,那圍繞下發登錄態的鏈路,就是我們想要的業務鏈路;

其他的業務也同理,比如訂單的話,是圍繞庫存來跑;

  • 業務場景中,你需要分析的維度是多深;

這個也比較好理解,以上述例子繼續說,要看登錄的業務鏈路的話,需要拆分多種登錄方式不同的鏈路來看?還是說看一個總的登錄鏈路就夠了。

這個維度就只能看分析問題的層次了,一般在洞察初期,當然是維度越細越好,但是越分析往后,維度會逐漸上升,因為隨著對業務的洞察,會發現有些維度雖然深了更完整,但是是分析不出問題的,也就是“過度分析”了。

  • 業務場景中,你要定義“一次完整業務行為”。

數據洞察區分于其他分析方式,最大的優勢是在于結合了業務來分析業務本身,那直擊業務結果的,一定是完整的業務鏈路。

這個點不舉例不太好說明,舉個例子,登錄過程。

大家有想過打點會是什么樣么,和一次完整業務行為會有啥差異么。

正常打點是下面這種樣子的。

rpcId
loginType
result
time
deviceId
traceid1
password
NEED_IV_CHECK
2021-12-1 11:20:54
123
traceid2
mloginToken
SUCCESS
2021-12-1 11:21:20
123

表1

這兩條離散的打點就是一次完整登錄行為,但是是基于rpc請求維度的表達。

2 結合業務場景定義的數據結構演進

打點數據描述了一個階段性的結果。上面例子描述的,就是用戶在2021-12-1 11:20:54發起了一次賬密登錄請求,但是因為環境不安全,安全挑戰要求核實身份(比如發短信核實),用戶操作了核身操作,在2021-12-1 11:21:20發起了免登,下發了登錄態。

這個就是一次登錄行為。業務洞察的核心也是圍繞這個點進行。

假如我們的分析維度,是總的登錄維度或者分登錄方式的登錄維度分析,這個兩條數據的打點其實就不適合我們,我們僅需要登錄方式,最終結果,時間以及設備id就夠了。

rpcId
loginType
final_result
time
deviceId
traceid1
password
SUCCESS
2021-12-1 11:21:20
123

表2

或核身沒有通過

rpcId
loginType
final_result
time
deviceId
traceid1
password
NEED_IV_CHECK
2021-12-1 11:21:20
123

表3

但是我們也會發現,這個數據描述的行為并不完整,比如表2并不能描述登錄過程經過了核身這個特性。

這個時候,我們就需要數據結構進行下一個階段的演進。

我們引入了statustag來描述路徑。

statustag格式:0^0^12|0^1^abcde.

前后經過|分割為兩種格式,第一個格式為bitmap,表示0版本;第二個格式為字符串,表示1版本格式,字符串為經過的未加到bitmap的節點(埋點畢竟不是強要求,總有需求上線后,沒有加bitmap)。

這個tag描述經過的路徑為,經過bx1100結果,經過了一版本的4和8的節點,和二版本的abcde節點。

有了這個tag,就可以描述更多的信息。

3 業務場景數據的可視化表達

單純的數據并不容易洞察,也不是長期運營治理的合理方式。這個時候我們就需要可視化來搞事情。

可視化的內容包含我們想要表達的內容,比如漏斗,比如曲線。

目前可視化表達常見的是漏斗和報表。

  • 漏斗舉例

圖1

做漏斗很麻煩,需要一個點一個點手動定義。但是漏斗對初期理解鏈路,分析問題益處非常大。

這個時候我們需要的,是可以通過結構化的數據源,來快速生成可視化漏斗。

我們可以通過生成數據的時候就指定約定來快速生成結構化數據。

  • 基于狀態機+約定打點

1. 引入狀態機變化記錄打點日志;

2. 結合結構化的畫圖能力,定向輸出約定日志,動態畫圖

  • 狀態機的核心要素

1.statusTag記錄路徑信息;

2.status和old_status記錄節點上下游信息;

3.depth記錄節點深度;

最終產出的一次登錄行為登錄數據

五 口徑

口徑是基于數據和業務場景的產出結果。口徑也是最重要的點,口徑代表了我們基于數據和業務場景對業務結果的理解,比如登錄的口徑,在財年初定義,登錄成功率從9x%提升到9y%,這個提升空間,也是根據數據來計算的。

1 口徑不要經常變動

口徑一旦定義下來,就不要經常變動。因為一般定義口徑是最難也是最耗時的,定義口徑的時候,一般我們已經完成了對目標的拆解,機會的洞察和最終的測算。

2 口徑并不一定是單一口徑

除了上述特性外,口徑也會有單口徑和多口徑,一般都會同時存在,比如登錄過程,在一個總的口徑基礎上,哪怕是一次登錄行為,我們也會拆分多個業務階段。

還是以登錄舉例,我們把用戶從進入頁面開始,到發起登錄行為,定義為意愿口徑,從登錄行為開始到登錄結果,定義為成功率口徑。這兩塊要解決的問題是不同的,揉到一起,會導致問題變得復雜,不利于分析。

多口徑也有一個好處,我們可以做階段性的工作,在不同的階段,處理多口徑中其中一部分的鏈路升級。

3 口徑維度定義

口徑維度定義需要結合場和業務的特性,哪怕是同一個業務鏈路,可能在不同場中,不同人群定義,也是不同的。

這塊不好說明,舉個例子。

我們C端口徑定義上,是設備維度,因為C端用戶,天然存在薅羊毛行為,我們會認為一個設備的登錄成功,對于C端就是有益處的。

但是同樣是登錄鏈路,B端定義上,就是用戶維度的,因為B端商家的個體價值都很大,而且不太存在類似C端薅羊毛的行為,用戶維度能讓我們更好的看到用戶行為,以便做體驗上的優化。

六 小結

在數據洞察方面,我們也還在學習和實踐的路上,并在這條路上已經取到了一定的結果,但是未來空間還是很大。這條路對于業務開發是一個有優勢的路,而且業務平臺作為業務場景的豐富度上,也是獨具優勢,我們可以在數據洞察做的事情上,更加自由。歡迎大家來一起討論,也歡迎大家來一起探索。

數據洞察是業務中臺賦能業務的有力工具,對業務產出數據洞察能力,也是我們一個非常大的命題。

商業跑得快,業務中臺可信賴。

彈性計算基礎知識

 

彈性計算是把計算力變成普惠的公共資源,讓不同體量的用戶任何時候都能用親民的價格享受到高可用、高性能、高效率的基礎IT計算服務,所以可以說彈性是云計算的核心能力。本課程對彈性的重要性、彈性的定義、阿里云如何做彈性等。點擊閱讀原文查看詳情。

 

責任編輯:武曉燕 來源: 51CTO專欄
相關推薦

2023-12-15 09:57:13

微服務鏈路服務

2022-12-26 11:57:41

數據庫治理

2021-07-28 08:31:25

設計系統應用

2020-08-06 11:13:17

數據分析數據大數據

2009-07-15 13:52:10

光傳輸網絡鏈路保護

2022-08-16 13:48:55

暗數據IT領導者

2024-02-21 12:18:15

2011-04-01 11:32:09

OSPF

2022-09-15 10:23:17

業務開發自我成長

2021-04-23 23:27:00

數據資產IT運營

2025-03-20 08:08:37

2023-12-29 08:29:15

QPS系統應用

2022-12-06 08:12:11

Java關鍵字

2020-06-02 10:36:42

云計算軟件即服務IT

2014-07-10 09:15:38

負載均衡安全網關

2021-08-05 05:02:04

DPU數據中心Pensando

2024-03-13 13:07:36

移動端樣式適配

2023-10-26 08:38:43

SQL排名平分分區

2023-05-30 07:50:56

項目管理權限
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 精品乱码一区二区三四区 | 中文字幕视频在线观看 | 麻豆91av| 激情a | 亚av在线 | 日韩视频在线免费观看 | 亚洲一区视频在线 | av免费网站在线 | 精品在线一区 | 91午夜在线 | 国产成人99久久亚洲综合精品 | 午夜视频在线免费观看 | 国产亚洲日本精品 | 亚洲国产精品激情在线观看 | 免费麻豆视频 | 久久国产精品久久国产精品 | 国产乱肥老妇国产一区二 | 精品国产乱码久久久久久丨区2区 | 五月激情婷婷在线 | 操操日| 韩日在线 | 成人一区在线观看 | 一区二区精品视频 | 精品一区av | 久久中文字幕一区 | 逼逼视频| 九一国产精品 | 欧美成人免费在线视频 | 中文字幕一区二区在线观看 | 久久久久久久久一区 | 亚洲电影一区二区三区 | 国产精品一区二区久久久久 | 亚洲欧美激情网 | 成人国产精品色哟哟 | 日韩亚洲一区二区 | 91麻豆精品国产91久久久久久久久 | 91在线电影 | 久久视频免费看 | 亚洲色图综合 | 狠狠撸在线视频 | 91精品中文字幕一区二区三区 |