終于,做出一個(gè)高質(zhì)量的數(shù)據(jù)分析項(xiàng)目
大家經(jīng)常找我感慨:“忙來(lái)忙去,感覺(jué)都是常規(guī)數(shù)據(jù)報(bào)表,連個(gè)拿得出手的項(xiàng)目都沒(méi)有!”那到底高質(zhì)量的數(shù)據(jù)分析項(xiàng)目該咋做?
怎樣算高質(zhì)量
想回答這個(gè)問(wèn)題,得先明確:啥叫“高質(zhì)量”項(xiàng)目。從本質(zhì)上看,數(shù)據(jù)分析是個(gè)支撐型崗位,工作質(zhì)量高不高,主要由被服務(wù)的部門決定。如果是在企業(yè)里工作的話,主要看管理層/業(yè)務(wù)部門的評(píng)價(jià)意見(jiàn)。如果在面試時(shí),則主要由面試HR/用人領(lǐng)導(dǎo)評(píng)價(jià)。摸清對(duì)方的需求,擊中對(duì)方的痛點(diǎn)才是關(guān)鍵。
經(jīng)常有同學(xué)在這里犯迷糊,覺(jué)得:用了線性回歸模型的(復(fù)雜的模型不會(huì))/圖表blingbling閃光的/查一個(gè)數(shù)sql 寫了2000行的,才算是“高質(zhì)量”,忽視了這些玩意對(duì)業(yè)務(wù)到底有沒(méi)有用,結(jié)果自然是鬧笑話了。
前幾天還有個(gè)同學(xué)急匆匆來(lái)問(wèn),說(shuō)他們建了流失用戶預(yù)測(cè)模型,結(jié)果運(yùn)營(yíng)表示:“你們搞這干啥?預(yù)測(cè)了我也不知道咋用!”然后項(xiàng)目就黃掉了……這就是典型的閉門造車結(jié)果。
那要怎么弄,才能切中業(yè)務(wù)痛點(diǎn)呢?
找準(zhǔn)核心需求
數(shù)據(jù)分析對(duì)業(yè)務(wù),是個(gè)“隨風(fēng)潛入夜,潤(rùn)物細(xì)無(wú)聲”的事,往往有數(shù)據(jù)看的時(shí)候大家不覺(jué)得很厲害,但是沒(méi)數(shù)據(jù)看了,就有人會(huì)著急。
所以想找到業(yè)務(wù)的痛點(diǎn),最好不要強(qiáng)行推銷:“我有一個(gè)人工智能阿爾法大狗子模型,百測(cè)百準(zhǔn),客官您要不要試試!”而是先看,對(duì)方部門最關(guān)注什么問(wèn)題,最缺什么數(shù)據(jù)。
常見(jiàn)的缺數(shù)據(jù)的情況有四種:
1、基礎(chǔ)數(shù)據(jù)都沒(méi)有,迫切想看到數(shù)
2、有數(shù)據(jù)但不知道怎么解讀,干著急
3、有數(shù)據(jù),有解讀,想進(jìn)一步驗(yàn)證想法
4、有數(shù)據(jù),有解讀,想進(jìn)一步做預(yù)測(cè)
接業(yè)務(wù)方需求的時(shí)候,一定要清晰真實(shí)需求。比如“用戶畫像”,可能上項(xiàng)目時(shí)就是嘴上一說(shuō),到底是業(yè)務(wù)不清楚用戶現(xiàn)狀,還是想基于畫像做啥動(dòng)作,一定要了解清楚。項(xiàng)目開(kāi)始時(shí)不清晰,中間過(guò)程也要逐步清晰,不然哼哧哼哧打了一堆標(biāo)簽再被人質(zhì)疑“你這有啥用!”那就是啞巴吃黃連了……
報(bào)表型項(xiàng)目的要點(diǎn)
報(bào)表型項(xiàng)目數(shù)量最多,但最容易被數(shù)據(jù)分析師們忽視,很多新人總嫌棄它技術(shù)上不復(fù)雜。但實(shí)際上,報(bào)表型項(xiàng)目是最容易出成績(jī)的,關(guān)鍵在于:做領(lǐng)導(dǎo)們關(guān)心的,領(lǐng)導(dǎo)們看得見(jiàn)的。接需求的時(shí)候,區(qū)分報(bào)表使用人,優(yōu)先把領(lǐng)導(dǎo)們需求做可視化,讓領(lǐng)導(dǎo)們直觀感受到數(shù)據(jù)。
并且,通過(guò)報(bào)表型項(xiàng)目,可以有效鑒別業(yè)務(wù)方合作態(tài)度。如果業(yè)務(wù)方態(tài)度好,那么可以深入合作。既然已經(jīng)有了業(yè)務(wù)監(jiān)控報(bào)表,那么下一步就可以做業(yè)務(wù)走勢(shì)異常分析。
先記錄非業(yè)務(wù)主動(dòng)行為產(chǎn)生的異常點(diǎn),之后再深入分析:
- 多大幅度變化算異常
- 是什么因素導(dǎo)致的異常
- 如何通過(guò)數(shù)據(jù)提前發(fā)現(xiàn)異常
有了這些積累,就可以進(jìn)一步做自動(dòng)化異常提醒+問(wèn)題診斷,讓單純的數(shù)據(jù)展示更上一層樓,同時(shí)能為后續(xù)深入分析打好基礎(chǔ)。
分析型項(xiàng)目的要點(diǎn)
在很多人原始印象里,數(shù)據(jù)分析就應(yīng)該是拿到一堆數(shù)字,然后般若媽咪哄一通分析,告訴業(yè)務(wù)三句話,讓業(yè)務(wù)多賺18萬(wàn)!因此往往人們對(duì)分析型項(xiàng)目期望甚高。
但實(shí)際上分析型項(xiàng)目特別容易踩雷。對(duì)業(yè)務(wù)不夠了解,缺少監(jiān)控?cái)?shù)據(jù),缺少異常分析的經(jīng)驗(yàn),都會(huì)讓問(wèn)題分析流于表面。做項(xiàng)目時(shí)“雷聲大、雨點(diǎn)小”是常態(tài)。
因此,分析型項(xiàng)目在報(bào)表型項(xiàng)目基礎(chǔ)上孵化出來(lái),成功率比較高。如果發(fā)現(xiàn)業(yè)務(wù)方對(duì)問(wèn)題本身監(jiān)控不足、認(rèn)識(shí)不清,可以退回到報(bào)表型項(xiàng)目做起。有了一定積累后,想見(jiàn)效,最好的辦法是先共識(shí)業(yè)務(wù)假設(shè),搞清楚業(yè)務(wù)方到底對(duì)啥沒(méi)信心,對(duì)啥有信心。證偽比證真容易,直接驗(yàn)假設(shè)更容易出結(jié)果。
如果問(wèn)題涉及太多難以量化的疑難雜癥,還有個(gè)解決思路,就是把問(wèn)題轉(zhuǎn)化成測(cè)試型項(xiàng)目。直接看業(yè)務(wù)方手頭有什么解決問(wèn)題的辦法,然后測(cè)試哪種辦法管用。這樣也能輸出解決問(wèn)題的方案。
測(cè)試型項(xiàng)目的要點(diǎn)
測(cè)試型項(xiàng)目相對(duì)容易成功,本質(zhì)上看,測(cè)試也屬于“業(yè)務(wù)沒(méi)數(shù)據(jù),特別想看個(gè)數(shù)據(jù)”的情況。只不過(guò)要注意的是,到底要測(cè)啥,得事先想清楚了。在測(cè)試中最重要的就是:對(duì)影響結(jié)果的因素有前期了解,測(cè)試想測(cè)的關(guān)鍵因素,控制其他干擾項(xiàng)。
因此,一般頁(yè)面設(shè)計(jì)測(cè)試容易成功,對(duì)消費(fèi)結(jié)果測(cè)試容易亂套。因?yàn)轫?yè)面設(shè)計(jì)測(cè)試點(diǎn)少,容易出準(zhǔn)確、穩(wěn)定的結(jié)果。但影響消費(fèi)結(jié)果的因素太多了在做測(cè)試之前沒(méi)想清楚,很容易因?yàn)闇y(cè)試方案之間可比性不高,參與測(cè)試群體差異大,關(guān)鍵干擾因素沒(méi)排除等原因?qū)е陆Y(jié)果失靈。
所以,在做測(cè)試前,基礎(chǔ)分析工作是很必要的,梳理清楚到底哪些因素會(huì)有影響,幾套測(cè)試方案之間差異點(diǎn)到底有多大,能有效提升項(xiàng)目質(zhì)量。
預(yù)測(cè)型項(xiàng)目的要點(diǎn)
預(yù)測(cè)型項(xiàng)目的關(guān)鍵在于:確認(rèn)真實(shí)的預(yù)測(cè)需求,避免盲目賭命式的“我要100%精確”。不但做不到,而且沒(méi)意義。
比如開(kāi)篇講的流失用戶預(yù)測(cè),如果運(yùn)營(yíng)是全量投放資源召回流失用戶,那把目標(biāo)改成預(yù)測(cè):“哪些人自然會(huì)回流”這樣就能節(jié)省經(jīng)費(fèi)。如果運(yùn)營(yíng)想獲取最大效果,可以把目標(biāo)改成:“用戶預(yù)計(jì)響應(yīng)哪種方式的召回”這樣可以做多輪推送最大化喚醒用戶。
總之,先搞清楚運(yùn)營(yíng)的計(jì)劃再下手,比自己閉門造模型管用得多。