關(guān)于數(shù)據(jù)分析技能的思考

作者：數(shù)師兄 2021-03-15 08:25:49

師兄之前和大家聊了聊找工作面試的要點。看了大家在后臺留言，想了解下數(shù)據(jù)分析都需要懂什么工具，知道什么數(shù)學(xué)原理。今天我們就來聊聊關(guān)于數(shù)據(jù)分析的技能。

首先說結(jié)論：業(yè)務(wù)是第一位，其次才是工具和數(shù)學(xué)原理。為什么這么說?因為數(shù)據(jù)分析是為了解決業(yè)務(wù)問題，如果脫離了業(yè)務(wù)，什么都不是。

比如：80%，單看這個數(shù)字是沒有什么意義的。但是如果我們說某APP的次留是80%，就將這個單獨的數(shù)字賦予了業(yè)務(wù)意義。

所以，數(shù)據(jù)分析一定是與業(yè)務(wù)強相關(guān)的。下面我們就來說說數(shù)據(jù)分析所需要的技能。

工具類技能

工具，必須要學(xué)習一下 SQL 和 Excel。

數(shù)據(jù)分析一定是和業(yè)務(wù)強相關(guān)。所有數(shù)據(jù)都是為業(yè)務(wù)服務(wù)。但是前提是，你得拿到數(shù)據(jù)對吧。所以，SQL是必須會的技能。這個是我們拿到數(shù)據(jù)的主要工具。

那拿到數(shù)據(jù)了，我們肯定還需要對數(shù)據(jù)進行一定的作圖，對比，處理。這里常用的就是Excel。

其次，大家肯定還會想到Python，R語言。這些就是偏進階的工具了。后期建議大家學(xué)習Python，更通用一些。

我們分別來說下這幾個工具所需要了解的基礎(chǔ)能力：EXCEL：常用函數(shù)vlookup，match，index等，數(shù)據(jù)透視表功能，圖表功能。SQL：聚合函數(shù)，窗口函數(shù)，表格關(guān)聯(lián)，數(shù)據(jù)傾斜優(yōu)化等。Python：循環(huán)、字典、字符串、pandas、numpy等常用包的使用。

理論類技能

關(guān)于理論，如果要劃分一個常用的范圍，那么就是數(shù)理統(tǒng)計和概率論。

數(shù)據(jù)有兩種指標。一種是均值型指標，比如日活，NU，GMV;一種是比值型指標，比如注冊率，滲透率。這些指標，在AB測試中，所需要的檢驗方式也是不同的。這些就需要統(tǒng)計學(xué)的基礎(chǔ)。

我們在依據(jù)歷史數(shù)據(jù)預(yù)測未來數(shù)據(jù)時，會需要一些概率和數(shù)理統(tǒng)計的知識。比如，某功能的滲透率是70%，如果我們想要提升至80%，可以選擇哪些用戶進行推廣。這里，我們就需要計算不同用戶組合下的滲透的概率。這時，我們就需要運用概率論，數(shù)理統(tǒng)計。

我們來說說統(tǒng)計學(xué)和概率論的基礎(chǔ)知識：

1、統(tǒng)計推斷：置信區(qū)間、置信度、假設(shè)檢驗(t檢驗、z檢驗、卡方檢驗)，以及這些檢驗適用的數(shù)據(jù)類型及樣本情況;

2、中心極限定律、大數(shù)定律、辛普森悖論等;

3、概率與概率的分布、統(tǒng)計量及抽樣分布、參數(shù)估計等;

4、回歸分析、方差分析、分類分析、時間序列等。

這些基礎(chǔ)知識可以去看看浙大出版的《概率論與數(shù)理統(tǒng)計》，賈俊平老師寫的《統(tǒng)計學(xué)》。

再往上，全概率公式、貝葉斯公式、馬爾科夫鏈這些也需要深入的學(xué)習和思考一下。因為這些公式，在業(yè)務(wù)中的應(yīng)用也非常多。

比如，我們某功能點擊率下降了，我們想知道是新用戶引起的，還是老用戶引起的，我們就可以用全概率公式。

比如，我們在進行內(nèi)容的小流量實驗，想通過用戶的點擊，評估用戶對內(nèi)容的偏好，我們就可以用貝葉斯公式。

比如，我們想要對用戶的APP使用進行引導(dǎo)，我們就需要選擇最優(yōu)使用路徑，我們就可以用馬爾科夫鏈。... ... 這些，就是比較進階的內(nèi)容。推薦看《概率導(dǎo)論》和《線性代數(shù)應(yīng)該這樣學(xué)》。

業(yè)務(wù)類技能

說到業(yè)務(wù)類技能，師兄認為，需要會拆，也要會比。

先說“拆”。大家應(yīng)該都聽過“人貨場”，“5W2H”，“4P”這些常用的分析方法論。這些方法論的本質(zhì)是告訴大家一種業(yè)務(wù)上的通用拆分方法。這些拆分方法可以讓我們將業(yè)務(wù)拆分為幾個相對獨立的變量，讓我們更好的了解及度量業(yè)務(wù)。

當然，我們也可以按照公式來拆。比如，DAU = NU + 老用戶;GMV = DAU * ARPU = NU * ARPU + 老用戶 * ARPU 等等。

結(jié)合我們對業(yè)務(wù)的理解，以及從大到小的層級拆分順序。我們可以將業(yè)務(wù)映射至不同的業(yè)務(wù)變量上，通過公式組合，得到最終的業(yè)務(wù)指標。

這樣，當我們要解決某個業(yè)務(wù)問題，或者建立某個業(yè)務(wù)的指標時，我們可以非常清楚的知道每個業(yè)務(wù)變量在公式中的作用。

再說“比”。是指同比，環(huán)比，定基比。

為什么一定要對比?

舉個例子：3月1日某APP日活100w。

這句話陳述了一個事實。但是這個事實是好還是壞，我們并不能有一個結(jié)論。

為什么?

與其他的APP比較：如果每個同類型APP的3月1日的日活都是1000w，那其實這個APP流量很小;如果每個同類型APP的日活都是10w，那這個APP的流量就很大。

與歷史數(shù)據(jù)比較：如果2月1日日活是200w，那么其實預(yù)示著業(yè)務(wù)流量在下降;如果在2月1日日活是50w，那么業(yè)務(wù)是有增長的。

所以，我們在拆分之后，還需要去對比。

如果說，拆分是為了讓我們更清楚的度量業(yè)務(wù)子變量，知道每個子變量對核心業(yè)務(wù)的影響，讓我們能夠有針對性的落地;那么，對比就是讓我們知道業(yè)務(wù)當前的狀況如何，發(fā)展是好是壞，我們最應(yīng)該解決什么問題，給我們業(yè)務(wù)一個明確的發(fā)展方向。

當然，以上這些，都是一個數(shù)據(jù)分析師的基礎(chǔ)技能。

無論是工具，還是理論，還是業(yè)務(wù)理解，最后都需要數(shù)據(jù)分析師們始于業(yè)務(wù)，之后高于業(yè)務(wù)，最后反哺業(yè)務(wù)。

當然，由于我們的拆分和對比，都是比較“數(shù)學(xué)”的過程，我們最后還需要會講故事。將這些“數(shù)學(xué)過程“用業(yè)務(wù)的語言講述出來，才算是一個“發(fā)現(xiàn)問題-拆解問題-實施策略-解決問題”的閉環(huán)。

師兄認為，數(shù)據(jù)分析師會有三個比較明確的階段：

第一：助力業(yè)務(wù)階段這個階段，就是俗稱的SQL Boy，表哥表姐。因為我們沒有很深的理解業(yè)務(wù)，對業(yè)務(wù)判斷不清。我們所需要做的是支持業(yè)務(wù)同學(xué)或者更資深同學(xué)。

第二：指導(dǎo)業(yè)務(wù)階段這個階段，我們已經(jīng)較深入的了解了業(yè)務(wù)，我們可以通過數(shù)據(jù)判斷出業(yè)務(wù)的狀態(tài)，知道業(yè)務(wù)哪里有問題，需要從哪個方向去進行相關(guān)的優(yōu)化，以及優(yōu)化的步驟是什么，該如何進行實驗，實驗結(jié)果該如何評估。

第三：引領(lǐng)業(yè)務(wù)階段這個階段，就類似于業(yè)務(wù)的操盤手。我們不僅要非常了解業(yè)務(wù)，我們也需要從眾多的業(yè)務(wù)發(fā)展方向中選擇更適合業(yè)務(wù)當前狀態(tài)的方向。決策業(yè)務(wù)的未來道路。這個階段，就可以稱的上業(yè)務(wù)的專家了。

當然，百米高樓平地起。我們還是要一點一滴的積累，不斷深耕業(yè)務(wù)，學(xué)習工具和理論。最后量變引起質(zhì)變。不斷提高自己的能力，擴大自己的影響力，成為一個優(yōu)秀的數(shù)據(jù)分析師。

責任編輯：姜華來源：數(shù)師兄

數(shù)據(jù)分析互聯(lián)網(wǎng)運營大數(shù)據(jù)

成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

關(guān)于數(shù)據(jù)分析技能的思考

工具類技能

理論類技能

業(yè)務(wù)類技能