太贊了,大神總結(jié)的常見數(shù)據(jù)分析規(guī)范!
在數(shù)據(jù)分析中,無論數(shù)據(jù)收集過程有多么科學(xué)、數(shù)據(jù)處理多么先進(jìn)、分析方法多么高深,如果不能將它們有效地組織和展示出來,并與決策者進(jìn)行溝通與交流,就無法體現(xiàn)數(shù)據(jù)和分析的價(jià)值。因此,分析報(bào)告實(shí)質(zhì)上是一種溝通與交流的形式,主要作用在于展示分析結(jié)果、驗(yàn)證分析質(zhì)量,為決策者提供參考依據(jù),并可以有針對性、操作性、戰(zhàn)略性的決策。今天,我們來一探究竟常見數(shù)據(jù)分析及報(bào)告規(guī)范。
Part1結(jié)構(gòu)規(guī)范及寫作
報(bào)告常用結(jié)構(gòu):
1.1 架構(gòu)清晰、主次分明
數(shù)據(jù)分析報(bào)告要有一個清晰的架構(gòu),層次分明能降低閱讀成本,有助于信息的傳達(dá)。雖然不同類型的分析報(bào)告有其適用的呈現(xiàn)方式,但總的來說作為議論文的一種,大部分的分析報(bào)告還是適用總-分-(總) 的結(jié)構(gòu)。
推薦學(xué)習(xí)金字塔原理,中心思想明確,結(jié)論先行,以上統(tǒng)下,歸類分組,邏輯遞進(jìn)。行文結(jié)構(gòu)先重要后次要,先全局后細(xì)節(jié),先結(jié)論后原因,先結(jié)果后過程。對于不太重要的內(nèi)容點(diǎn)到即止,舍棄細(xì)枝末節(jié)與主題不相關(guān)的東西。
1.2 核心結(jié)論先行、有邏輯有依據(jù)
結(jié)論求精不求多。大部分情況下,數(shù)據(jù)分析是為了發(fā)現(xiàn)問題,一份分析報(bào)告如果能有一個最重要的結(jié)論就已經(jīng)達(dá)到目的。精簡的結(jié)論能降低閱讀者的閱讀門檻,相反太繁瑣、有問題的結(jié)論100個=0。報(bào)告要圍繞分析的背景和目的以及要解決的問題,給出明確的答案和清晰的結(jié)論;相反,結(jié)論或主題太多會讓人不知所云,不知道要表達(dá)什么。分析結(jié)論一定要基于緊密嚴(yán)謹(jǐn)?shù)臄?shù)據(jù)分析推導(dǎo)過程,盡量不要有猜測性的結(jié)論,太主觀的結(jié)論就會失去說服力,一個連自己都沒有把握的結(jié)論千萬不要在報(bào)告里誤導(dǎo)別人。但實(shí)際中,部分合理的猜測找不到直觀可行的驗(yàn)證,在給出猜測性結(jié)論的時候,一定是基于合理的、有部分驗(yàn)證依據(jù)前提下,謹(jǐn)慎地給出結(jié)論,并且說明是猜測。如果在條件允許的前提下可以通過調(diào)研/回訪的方式進(jìn)行論證。不回避 “不良結(jié)論” 。在數(shù)據(jù)準(zhǔn)確、推導(dǎo)合理的基礎(chǔ)上,發(fā)現(xiàn)產(chǎn)品或業(yè)務(wù)問題并直擊痛點(diǎn),這其實(shí)是數(shù)據(jù)分析的一大價(jià)值所在。
1.3 結(jié)合實(shí)際業(yè)務(wù)、建議合理
基于分析結(jié)論,要有針對性的建議或者提出詳細(xì)解決方案,那么如何寫建議呢?首先,要搞清給誰提建議。不同的目標(biāo)對象所處的位置不同,看問題的角度就不一樣,比如高層更關(guān)注方向,分析報(bào)告需要提供業(yè)務(wù)的深度洞察和指出潛在機(jī)會點(diǎn),中層及員工關(guān)注具體策略,基于分析結(jié)論能通過哪些具體措施去改善現(xiàn)狀。 其次,要結(jié)合業(yè)務(wù)實(shí)際情況提建議。 雖然建議是以數(shù)據(jù)分析為基礎(chǔ)提出的,但僅從數(shù)據(jù)的角度去考慮就容易受到局限、甚至走入脫離業(yè)務(wù)忽略行業(yè)環(huán)境的誤區(qū),造成建議提了不如不提的結(jié)果。因此提出建議,一定要基于對業(yè)務(wù)的深刻了解和對實(shí)際情況的充分考慮。再進(jìn)一步,如果可以給出這個建議實(shí)施后的收益,下單轉(zhuǎn)化提升多少、交易提升多少、能節(jié)省多少成本等,把價(jià)值點(diǎn)直接傳遞給閱讀對象。
上面講了報(bào)告的寫作原則,舉個例子,參考艾瑞網(wǎng),《留存與未來-疫情背后的互聯(lián)網(wǎng)發(fā)展趨勢報(bào)告》
Tips:嘗試站在讀者的角度去寫分析報(bào)告,內(nèi)容通俗易懂,用語規(guī)范謹(jǐn)慎。如果匯報(bào)對象不是該領(lǐng)域的專家,就要避免使用太多晦澀難懂的詞句,同時報(bào)告中使用的名詞術(shù)語一定要規(guī)范,要與既定的標(biāo)準(zhǔn)(如公司指標(biāo)規(guī)范)以及業(yè)內(nèi)公認(rèn)的術(shù)語一致。
Part2數(shù)據(jù)使用及圖表
數(shù)據(jù)分析往往是80%的數(shù)據(jù)處理,20%的分析。大部分時候,收集和處理數(shù)據(jù)確實(shí)會占據(jù)很多時間,最后才在正確數(shù)據(jù)的基礎(chǔ)上做分析,既然一切都是為了找到正確的結(jié)論,那么保證數(shù)據(jù)準(zhǔn)確就顯得格外重要,否則一切努力都是誤導(dǎo)別人。
2.1 分析需要基于可靠的數(shù)據(jù)源
用于鑒別信息/數(shù)據(jù)的可靠性,主要有四種方法:同類對比、狹義/廣義比對、相關(guān)對比和演繹歸謬。2.1.1 同類對比與口徑相同或相近,但來源不同的信息進(jìn)行對比。示例:最常見就是把跑出來的數(shù)據(jù)和報(bào)表數(shù)據(jù)核對校驗(yàn)。2.1.2 狹義/廣義對比通過與更廣義(被包含)或更狹義(包含)的信息進(jìn)行對比。示例:3C品類銷售額與商城總銷售額比較,3C的銷售額更高顯然是錯誤的,因?yàn)樯坛强備N售額包含3C銷售額;某些頁面/頻道的UV與APP總UV比較也類似。 2.1.3 相關(guān)對比通過與具有相關(guān)性、關(guān)聯(lián)性的信息進(jìn)行對比。示例:某平臺的Dn留存率,對于同一個基準(zhǔn)日期來說,D60留存率一定低于D30留存率的,如果出現(xiàn)大于的情況,那就是錯誤數(shù)據(jù)了。2.1.4 演繹歸謬通過對現(xiàn)有證據(jù)的深入演繹,推導(dǎo)出結(jié)果,判斷結(jié)果是否合理。示例:比如某平臺的銷售客單價(jià)2000左右,總銷售額1億左右;計(jì)算得出當(dāng)日交易用戶數(shù)10萬,通過乘以客單價(jià),得到當(dāng)天銷售額2億,顯然與業(yè)務(wù)體量不符,為錯誤的數(shù)據(jù)。
Tips:以上都是常用的方法論,最核心是足夠了解業(yè)務(wù),對關(guān)鍵指標(biāo)數(shù)據(jù)情況了然于心,那么對數(shù)據(jù)準(zhǔn)確性的判斷水到渠成。對此,建議是每日觀測核心業(yè)務(wù)的數(shù)據(jù)情況,并分析波動原因,培養(yǎng)業(yè)務(wù)理解力和數(shù)據(jù)敏感度。
2.2 盡量圖標(biāo)化,提高可讀性
用圖表代替大量堆砌的數(shù)字,有助于閱讀者更形象直觀地看清楚問題和結(jié)論,當(dāng)然,圖表也不要太多,過多的圖表一樣會讓人無所適從。讓圖表五臟俱全,一張圖必須包含完整的元素,才能讓閱讀者一目了然。標(biāo)題、圖例、單位、腳注、資料來源這些圖表元素就好比圖表的五臟六腑。 要注意的條條框框。首先,避免生出無意義的圖表。決定做不做圖的唯一標(biāo)準(zhǔn)就是能否幫助你有效地表達(dá)信息。第二點(diǎn)、不要把圖表撐破。最好一張圖表反映一個觀點(diǎn),突出重點(diǎn),讓讀者迅速捕捉到核心思想。第三點(diǎn)、只選對的,不選復(fù)雜的。第四點(diǎn)、一句話標(biāo)題。
常見的圖表類型選擇:
圖表使用Tips:2.2.1 折線圖選用的線型要相對粗些,線條一般不超過5條,不使用傾斜的標(biāo)簽,縱坐標(biāo)軸一般刻度從0開始。預(yù)測值的線條線型改為虛線。2.2.2 柱形圖同一數(shù)據(jù)序列使用相同的顏色。不使用傾斜的標(biāo)簽,縱坐標(biāo)軸一般刻度從0開始。一般來說,柱形圖最好添加數(shù)據(jù)標(biāo)簽,如果添加了數(shù)據(jù)標(biāo)簽,可以刪除縱坐標(biāo)刻度線和網(wǎng)格線。2.2.3 條形圖同一數(shù)據(jù)序列使用相同的顏色。不使用傾斜的標(biāo)簽,最好添加數(shù)據(jù)標(biāo)簽,盡量讓數(shù)據(jù)由大到小排列,方便閱讀。2.2.4 餅圖餅圖使用場景相對少,如需使用,注意以下事項(xiàng):把數(shù)據(jù)從12點(diǎn)鐘的位置開始排列,最重要的成分緊靠12點(diǎn)鐘的位置。數(shù)據(jù)項(xiàng)不要太多,保持在6項(xiàng)以內(nèi),不使用爆炸式的餅圖分離。不過可以將某一片的扇區(qū)分離出來,前提是你希望強(qiáng)調(diào)這片扇區(qū)。餅圖不使用圖例。不使用3D效果。當(dāng)扇區(qū)使用顏色填充時,推薦使用白色的邊框線,具有較好的切割感。2.2.5 警惕圖表說謊虛張聲勢的增長人們喜歡研究一條線的發(fā)展趨勢,例如股市、房價(jià)、銷售額的增長趨勢,有時候?yàn)榱宋x者故意夸大變化趨勢,如圖1通過截?cái)鄶?shù)軸夸大增長速度,從正常數(shù)軸的圖2看到增長是緩慢的。
3D效果的偽裝3D圖形容易造成視覺偏差,如圖1有3D效果,看上去 A->B->C->D->E依次遞增,實(shí)際是D>E,要格外小心圖表的偽裝。
Part3常見數(shù)據(jù)分析誤區(qū)
“用數(shù)據(jù)說話”,已經(jīng)成為一種流行語。在很多人的心里,數(shù)據(jù)就代表著科學(xué),科學(xué)就意味著真相。“數(shù)據(jù)不會騙人”,也成了說服別人時常用的口頭禪,事實(shí)果真如此嗎?讓我們來談?wù)勀切┏R姷恼`區(qū)。
3.1 控制變量謬誤
在做A/B測試時沒有控制好變量,導(dǎo)致測試結(jié)果不能反映實(shí)驗(yàn)結(jié)果。或者在進(jìn)行數(shù)據(jù)對比時,兩個指標(biāo)沒有可比性。舉個例子,為測試不同營銷時間點(diǎn)對下的轉(zhuǎn)化的影響,但A實(shí)驗(yàn)使用短信營銷、B實(shí)驗(yàn)使用電話營銷,未控制變量(營銷方式),導(dǎo)致實(shí)驗(yàn)無法得出結(jié)論。
3.2 樣本謬誤
3.2.1 樣本量不夠統(tǒng)計(jì)學(xué)的基礎(chǔ)理論基石之一就是大數(shù)定律,只有當(dāng)數(shù)據(jù)量達(dá)到一定程度后,才能反映出特定的規(guī)律。如果出現(xiàn)樣本量極少的情況,建議把時間線拉長,獲得足量的樣本。或者將不重要的限定條件去掉,增加樣本數(shù)。3.2.2 存在選擇性偏見或者幸存者偏見統(tǒng)計(jì)學(xué)的另一大理論基石是中心極限定理。簡單描述就是,總體樣本中,任意一個群體樣本的平均值,都會圍繞在這個群體的整體平均值周圍。舉個例子,在應(yīng)用升級期間,衡量登錄用戶數(shù)、交易用戶數(shù)等指標(biāo),來判斷用戶對新版本的喜歡是否優(yōu)于老版本。聽上去非常合理,但這里實(shí)際就隱藏了選擇性偏見,因?yàn)樾掳姹景l(fā)布時,第一批升級上來的用戶往往就是最活躍的用戶,往往這批用戶的指標(biāo)較好,但不代表新版本更好。3.2.2 混入臟數(shù)據(jù)這種數(shù)據(jù)的破壞性比較大,可能得出錯誤的結(jié)論。通常我們會采用數(shù)據(jù)校驗(yàn)的手段,屏蔽掉校驗(yàn)失敗的數(shù)據(jù)。同時,在分析具體業(yè)務(wù)時,也要針對特定業(yè)務(wù),對所使用的數(shù)據(jù)進(jìn)行合理性限定,過濾掉異常離群值,來確保擁有比較好的數(shù)據(jù)質(zhì)量。
3.3 因果相關(guān)謬誤
會誤把相關(guān)當(dāng)因果,忽略中介變量。比如,有人發(fā)現(xiàn)雪糕的銷量和河溪溺死的兒童數(shù)量呈明顯相關(guān),就下令削減雪糕銷量。其實(shí)可能只是因?yàn)檫@兩者都是發(fā)生在天氣炎熱的夏天。天氣炎熱,購買雪糕的人就越多,而去河里游泳的人也顯著增多。
3.4 辛普森悖論
簡單來說,就是在兩個相差較多的分組數(shù)據(jù)相加時,在分組比較中都占優(yōu)勢的一方,會在總評中反而是失勢的一方。
3.5 個人認(rèn)知謬誤
主觀臆斷、經(jīng)驗(yàn)當(dāng)事實(shí)、個體當(dāng)整體、特征當(dāng)全貌、眼見當(dāng)事實(shí)。舉個主觀臆斷的例子:某個產(chǎn)品A頁面到B頁面的轉(zhuǎn)化率30%,直接判斷為很低,推導(dǎo)出可以提高到75%。但實(shí)際類似產(chǎn)品或者用戶行為決定頁面的轉(zhuǎn)化率就只有這么高,得出一個錯誤的結(jié)論。標(biāo)準(zhǔn)至關(guān)重要,數(shù)據(jù)+標(biāo)準(zhǔn)=判斷。有了判斷才能深入分析。通過分組對比找標(biāo)準(zhǔn)(象限法、多維法、二八法、對比法),有標(biāo)準(zhǔn)通過分析對比,找到“好/壞”的點(diǎn)
統(tǒng)計(jì)學(xué)規(guī)律和理論不會錯,犯錯的是使用它的人。因此,我們在進(jìn)行數(shù)據(jù)分析時,一定要格外小心,錯誤的數(shù)據(jù),披上科學(xué)的外衣,就很難分辨了。