4種數據分析基礎方法,終于有人講明白了
01 全鏈路分析
全鏈路分析是指對全鏈路的每個節點進行分析和研究,它是一種非常重要的分析思路,也是對產品經理而言最重要的思路。大家所熟知的漏斗分析、AARRR模型都是典型的全鏈路分析(見圖2-1)。

▲圖 2-1 常用全鏈路分析模型舉例
還有很多常用的業務模型都屬于全鏈路分析中的整體節點監控,比如生命周期(用戶生命周期、商品生命周期、產品生命周期等)的思路。
全鏈路分析的步驟如下:
- 梳理鏈路關鍵節點,確定每個節點指標;
- 進行節點洞察,分析每個節點的數據,查看問題點和增長點。
我們用一個背景是廣告平臺的案例來講解全鏈路分析的步驟。廣告平臺的作用就是統一對接各個媒體,讓廣告主在廣告平臺上可以買到各個媒體的流量。
第一步:梳理關鍵節點,確定每個節點指標
最開始,梳理的廣告行業的全鏈路流程是這樣的:
- 媒體發送廣告請求;
- 廣告平臺對其中的部分請求返回廣告;
- 媒體展現廣告;
- 用戶點擊廣告;
- 廣告平臺扣廣告費(這是廣告平臺的收入)。
梳理出來的關鍵節點和指標如圖2-2所示,圖中,每個比率指標是下一個節點數據與上一個節點數據的比值。注意,節點指標除了指這個節點的指標值,也可以指比率指標。

▲圖 2-2 廣告行業全鏈路分析
全鏈路公式是CPC,即收入=PV×PV展示廣告的比例×廣告位數量×點擊率×平均點擊價格。
到了這一步,指標體系就建好了,可以用來做關鍵節點監控。要把中間的每個節點都梳理出來,如果中間有漏掉的節點,那么就說明思路有遺漏,容易出現問題。特別是當數據量大、數據流轉系統多的時候,節點就要更細。
經過一段時間的使用后,筆者發現漏掉了很多節點,即廣告平臺把數據返回媒體后,還要經過競價、排名才會被媒體展現給用戶,完善后監控的節點變成圖2-3中的第二種方式。

▲圖 2-3 廣告平臺全鏈路分析
此時全鏈路公式變成
收入=實際請求數×出價率×參與競價率×競價成功率×(1-響應超時率)×點擊率×平均點擊價格
這個公式和上一個公式基本一樣,只是為了讓監控更完善,加了幾個節點。
第二步:對每個節點進行深入洞察
如果只是完成第一步,全鏈路分析只能用于監測,要想得到具體的問題及解決方案,還要對每個節點進行深入洞察,梳理每個節點的影響因素,如圖2-4所示。

▲圖 2-4 全鏈路分析的節點排查
在每個節點,都有非常多的原因導致這個節點的流量轉化效率低。經過這樣的梳理,才能找出根本原因,進而有針對性地給出解決方案。
當產品經理負責一個項目時,就是這樣一個節點一個節點地優化,才能做好整體數據。由此可知,全鏈路分析是產品經理必備的思路和技能。
02 組成因子分解
把整體指標數據按照某種分類標準分成不同的因子的過程,稱為組成因子分解。整體目標等于所有的組成因子之和。以廣告平臺總收入為例,其組成因子分解如圖2-5所示。

▲圖 2-5 廣告平臺總收入的組成因子分解
整體指標數據只能讓人看到目標達成的結果,但是不能知道是如何達成目標的,也不知道執行中的細節,更不知道如何改進。組成因子分解首先可以明確思路,把組成結果的因素清晰地列出來,并且可以針對不同的因子,制定對應的策略。
案例:筆者曾經有一次在做渠道分析時,用了這樣的組成因子分解:總費用=A類渠道費用+B類渠道費用。但之后發現,A類渠道的花費是B類渠道的1.6倍,而有效用戶卻是B類的2.4倍(見表2-1)。在這之前,B類渠道在其他項目的經驗中效果是非常好的,所以市場人員都在B類渠道花精力,看到這個數據后,立刻決定去接觸市面上所有的A類渠道,以便擴充優質流量。

表2-1 多個組成因子對比的案例
如果只看整體費用,就得不到這樣的結論,也就不能提出有用的建議。
任意一個指標可拆解的方式都是非常多的,比如,針對總流量的組成因子分解,就有以下幾種方式。
- 按時間拆分。不同時間段數據是否有變化。
- 按渠道拆分。不同渠道的流量也會不同。
- 按用戶拆分。新用戶和老用戶的流量會有明顯的區別。筆者待過的一家公司,老用戶的流量就遠遠大于新用戶,這種情況,就需要想辦法促進新用戶的流量。
要嘗試多種方式,試驗出最好的因子分解方式。
需要注意的是,如何進行組成因子分解,代表著思考問題的第一維度,直接影響能否得到有用的結論。后面的所有策略和解讀都是根據第一步因子分解而來的。
- 優先考慮業務團隊習慣的拆解思路,比如廣告類公司會把客戶分為大客戶、中小客戶。
- 要勇敢嘗試,不要固化思路。
案例:以前做過一個項目,我們按“收入=移動端收入+PC端收入”來分解組成因子,發現移動端收入快速上漲。但是當時高層的思路還是“銷售額=流量×轉化率×客單價”,他們盤算的是“客單價提升x元,就會提升x元的銷售額”。按照這樣的思路,資源就投給了客單價提升,沒有在移動端投入。等到發現移動時代來臨,再開始建團隊和買流量,成本已經變得非常高。
從這個案例中可以看出,如何進行因子分解,決定了如何思考目標的組成因素,即如何思考解決方案、資源調配等更深層的問題。所以要經常嘗試是否有其他的因子分解方式,如果囿于經驗、思路固化,可能就會錯失機會。
03 影響因子拆解
很多時候,因子對結果的影響是定性的,并不能完全把結果拆成多個因子的相加,這時候就可以采用影響因子拆解的方式,列出對結果有影響的所有因子,逐個分析。比如對于銷售額,影響因子就是商品、會員、客服、流量、活動等,但是不能說銷售額=商品+會員+客服+流量+活動。
圖2-6所示為B2C訂單轉化率的常用影響因子拆解。

▲圖2-6 B2C訂單轉化率影響因子拆解
影響因子對結果的影響是定性的,并不能直接推出來,如果想通過影響因子分解這種方式做增長,測試是一個好辦法。
案例:有一個SaaS軟件團隊,客戶是小型創業公司。經過分析后,這個團隊認為影響購買轉化率的因素之一是客戶團隊人數,如果團隊人少,就不會購買這種提高效率的軟件。所以他們在客戶團隊人數這個指標上做了一個測試:3個人、10個人、5個人,不斷嘗試,看哪個數值使轉化率最高。
影響因子還可以用于制作PPT的框架。在做數據分析之前,如果我們已經知道了分析的目的,需要考慮從哪些角度去達成分析目的,一般用這種思路。
案例:某客戶的需求是查看一場活動效果。對于品牌類的客戶,我們認為活動效果包括品牌分析和人群分析。在這樣的拆分下,PPT的框架就出來了,如圖2-7所示。

▲圖 2-7 影響因子用于制作PPT框架
04 枚舉法
枚舉法是把所有的數據一一列舉出來,然后進行后續的分析。枚舉法是策略產品經理日常分析數據用得最多的方法,當然對于其他類型的數據產品經理而言,也非常好用。
枚舉法的通用分析步驟如圖2-8所示。

▲圖2-8 枚舉法分析過程
再舉一個搜索優化的例子。算法類的產品,如搜索、推薦、廣告等,在使用枚舉法時都可以用這種思路。
案例:搜索點擊率的分析如下。
1)數據列舉:取出搜索query列表和分析用到的數據指標(見表2-2)。

表2-2 搜索query列表示例
2)逐個解讀:逐個解讀其數據和特征,一步步地努力通過這些數據還原出用戶的真實使用場景和想法,從而得到用戶不點擊的原因(見表2-3)。

表2-3 搜索詞解讀示例
通過上面的解讀,我們得出以下問題或增長點。
- 專有名詞搜索不識別。有一些行業專有名詞,搜索引擎不識別,就不能找出對應的結果,只能找出文本識別的結果,比如搜索“老酒”,就會展示“瀘州老窖酒”等商品,所以點擊率低。
- 品牌詞。對于品牌詞,一般搜索結果沒有太大問題。但是,用戶搜索品牌詞時,如果給用戶更權威、更專業的內容,比如品牌的官網、旗艦店等,用戶體驗豈不是更好?比如用戶搜索“瀘州老窖”這樣的品牌詞,直接給用戶瀘州老窖的官網,讓用戶看到權威、專業、全面的信息。圖2-9為QQ瀏覽器的搜索sug頁的處理方式。
- 對于搜索客服電話的詞,可以直接把客服電話顯示在頁面內,用戶不用跳轉到搜索結果頁內的鏈接就能看到,從而減少用戶操作,體驗也會更好。圖2-10所示為百度的處理方式。
- 匯總問題,給出解決建議和優先級。問題匯總一般類似于表2-4這樣。

▲圖2-9 品牌詞在QQ瀏覽器的搜索sug頁結果

▲圖2-10 電話類的詞在百度的搜索結果頁

表 2-4 問題匯總表
就這樣,通過枚舉法,產品經理就可以很清楚地了解產品現有問題,并給出解決方案和優先級。
在枚舉的時候,一條一條地看固然是產品經理的基本功,但是當面臨大量的數據時,這種辦法效率太低了。要想快速抓住重點,還需要借助兩種思維:排序思維和抽樣思維。
1. 排序思維
排序指把某個指標降序排列和升序排列,然后按上述的枚舉方式進行分析。排序的目的是確認關注范圍。產品經理面對大量數據時,需要先確定關注哪一部分數據能帶來最大收益。例如,可以按照以下方式進行排序和分析。
- 將PV降序排,看占PV總量90%的搜索詞有多少個,重點關注這幾個詞,調用所有資源優化它們。
- 或者按點擊量降序排,看90%的點擊量發生在哪幾個搜索詞上,調用所有資源優化它們。
- 會員和商品的數據也可以用這種方法來看。筆者之前做過很多類目的淘寶店代運營,雖然那些店鋪一年能有上億元的銷售額,但實際上有銷售量(日訂單量大于100)的商品很可能就兩三個。
案例(來自客戶陳述):我們雖然買了很多關鍵詞,但是只有兩個關鍵詞能帶來流量。所以只要把這兩個主要的關鍵詞優化好,就能夠把花在數據上的錢掙回來。我們把這幾個詞就當寶貝一樣,對其進行各種測試、各種優化。
在實際使用中,只排序一次得到的結論都不全面,為了得到更全面的信息,產品經理一般會使用多次排序,并且對多個指標進行排序。
對一次完整的搜索進行每周的點擊率分析,如下。
1)按PV降序排,篩選出高頻詞,即PV大的搜索詞。高頻詞能貢獻絕大部分最優結果和最高點擊率。
按PV上升量降序排。篩選出飆升詞,飆升詞是高頻詞里需要特別注意的,因為往往代表的是新的用戶需求或者新的市場變化。
按點擊率升序排。這樣可以看到高頻詞中點擊率較低的詞,優化它們能帶來較快的提升。
2)按PV升序排,篩選出低頻詞。2%的搜索詞占了98%的PV,剩下98%的詞可以歸為低頻詞。低頻詞是最能衡量搜索引擎好壞的,因為量大代表用戶多。低頻詞包括大部分長尾詞、同義詞、問答詞、未召回詞、無結果詞、沒有點擊的詞和沒有成交的詞,badcase基本上都是從這里產生的。
低頻詞的召回是件十分令人頭疼的事情,算法很難取舍,因為這些都是長尾需求,并沒有足夠多的用戶行為可以學習,如何給予相應的匹配,需要非常深入的學習和分析。
2. 隨機抽樣
枚舉的方式可以快速看到問題,但是不能保證問題的典型性;加入排序思維后,可以劃定范圍,但是可能會造成偏差,因為不代表全部用戶行為。那么,怎樣既能看到全部的用戶行為又能保證問題的典型性呢?答案就是隨機抽樣。
可以對所有的數據進行隨機抽樣,也可以分層抽樣,即先對整體數據分層,然后針對每層抽樣。
隨機抽樣比較簡單,常用的場景有以下幾種。
- 產品經理日常工作。
- 每周至少要看一次隨機抽樣的數據,以對產品用戶行為有所了解。
- 日常上線前后都會看,以了解新策略對用戶的影響。
- 項目可行性判斷。要想知道一個項目是否可行,可以先抽樣看一下。筆者有段時間頻繁接觸各個媒體的數據,評估媒體質量,主要就是用的抽樣的辦法。媒體會給我們一部分真實數據,我們抽樣出來后,就開始做評估,包括是否有商業價值、需要的技術難度等。舉這個例子主要是想告訴大家,抽樣這個簡單的辦法有時候是直接影響戰略決策的。
- 需要了解全貌的任何需求。比如在項目功能上線后,需要整體了解用戶,以便制定推廣方案等,這個時候就可以抽樣。
本節講了枚舉法及枚舉法需要使用的思維,用的是搜索的案例,那么是不是只有策略產品經理才需要這種思維呢?當然不是。枚舉法是所有產品經理的基本功。
舉例來說,如果你每天抽出100個用戶來看他們的行為,堅持一段時間,你就會對用戶有非常深入的了解。你會看到用戶經常在哪些頁面徘徊,你也能夠推測出這些用戶的年齡和職業。
枚舉法會潛移默化地提升產品經理對用戶的了解。我們每多看一次枚舉的數據,就會多一些對用戶行為的理解。
產品經理經常面對突發情況,或者是領導的詢問,或者是大小事情的決策。比如項目存在一個小問題,是上線還是回退;忽然發現原方案會導致性能問題,要臨時換一種解決方案;開發和測試人員都建議采用其他方案;領導忽然問你要不要跟進競品的新變動。
在這些情況下,產品經理幾乎都是要立刻給出結論的,沒有時間做細致全面的分析,既來不及做分析報告,也來不及找出詳細數據來查看,那么產品經理可以依靠什么呢?依靠的正是你對用戶的了解。
因此我們每天都要從各種角度看數據,這樣才能有深入的洞察,知道每一種問題的影響范圍,才能處理各種情況。
以上四種就是我們常用的數據分析思路,是不是很簡單?實際業務情況一般都很復雜,沒有一種數據分析思路是通用的,需要結合使用多種思路。