成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

什么是頂級的數據分析方法?

大數據 數據分析
數據分析的方法是非常多的。但為什么很多同學感覺自己沒用上方法呢?因為每種方法是和業務場景、領導風格、數據質量、息息相關的。

經常有同學疑惑:

“什么是頂級的數據分析方法”

“面試的時候,被人問:用過什么方法,怎么回答好?”

“為什么我講的分析方法,會被人嫌棄簡單?”

今天系統盤點下數據分析方法,大家也好對號入座,看看自己講的水平如何。

首先,并不是名字帶“分析”倆字的,就是數據分析方法。有很多XX分析,是統計學、運籌學、數學的專業工具,并不直接指向業務問題的答案。當人們在問:“有什么分析方法”的時候,更多期望聽到一個能給出結論的方法。

所以想回答好這個問題,要回到:數據分析到底解決哪些業務問題上去。

從業務用途上看,數據分析可以解決5大類問題

1、是多少(數據描述狀況)

2、是什么(樹立數據標準)

3、為什么(探索問題原因)

4、會怎樣(預測業務走勢)

5、又如何(綜合判斷狀況)

圍繞每個問題場景,有特定的方法組合(如下圖)

             

圖片圖片

              

一、解決“是多少”的方法

用數據描述狀況,需要建立完善的數據指標體系。建立數據指標體系,則需要梳理清楚數據指標之間的邏輯。數據指標間有兩種基本的邏輯:串行邏輯和并行邏輯,因此衍生出兩種基本的分析方法:漏斗分析法&指標拆解法。

圖片圖片

拆解的業務多了,人們發現,某些數據指標可以固定的組合使用,比如:

用戶運營場景:AARRR指標、RFM指標

零售門店場景:人、貨、場指標

商品管理場景:進、銷、存指標

這些也習慣性被稱為:分析模型。但注意,這些都只是在展示數據。數據+判斷標準,才有分析結論。有關判斷標準的分析,就是:是什么類問題。

二、解決“是什么”問題的方法

判斷標準可以很簡單,比如領導的指令、KPI要求、過往同期數據,都能作為標準。這些統稱為:簡單標準。但很多時候,指標走勢是否正常,并無明確的KPI約束,甚至KPI達標,但是走勢奇特,領導們還是會覺得有問題。這時候就需要找其他參照物。因此衍生出一系列分析方法。

比如:

與業務自身規律比較,判斷好壞:生命周期法、自然周期法

與同類型,同期發展的業務比較:同期群分析法

與其他業務個體進行比較:分層分析法

這樣對比,即使只有1個數據指標,也能得出好壞判斷。如果業務發展違背過往規律,明顯比其他個體更差,則可以判定為:不好。

圖片圖片

當然,也可以使用2個指標,比如經典的矩陣分析法,通過兩指標交叉+兩指標平均值,分出四類業務,從而得出好壞判斷。

圖片圖片

如果用更多指標也行,比如常用的Kmean聚類,可以先利用多個指標對業務個體聚類,之后再看各類型之間表現優劣。

以上這些方法,都能將業務的好/壞區分出來,從而在一定程度上輔助判斷。

三、解決“為什么”問題的方法

“分析下這個問題是什么原因導致的……”是常見的要求,這就是“為什么”問題。解決為什么問題,有兩大基本思路:

一:結果推斷:問題發生后,用各種數據尋找差異,建立假設。

常見的,比如:

結構分析法:通過結構分析,找到問題發生點

標簽分析法:通過打標簽,做個體對比,找到問題原因

相關分析法:通過計算指標相關關系,找到相關指標,再形成假設

MECE法:講多個業務假設,按MECE原則合并成分析邏輯,一一驗證

結果推斷,可以把業務口中“我覺得這是XX原因”,抽象成一個數據可驗證的假設,因此適用范圍非常廣。但結果推斷只是單方面從結果做歸納,有可能有偏頗,還需要實驗驗證。

圖片圖片

二:實驗推斷:先有假設,然后通過實驗/分組對比,驗證假設。常見的方法,包括ABtest、DID、PSM、RDD、Uplift等方法。

這些方法更接近傳統統計學的實驗,大部分都要求:

1、開展數據實驗,驗證假設

2、設參照組/實驗組,且參照組/實驗組特征相似

3、區分控制變量、環境變量,重點測控制變量的影響

實驗推斷有統計學依據,計算過程復雜,看起來更量化一些。但是對實驗條件要求太高,比如大促銷類ALL in的業務,比如商品、店鋪這些無法控制環境的業務場景,比如業務員行為、內容傳播等難采集數據的領域,都很難用。

理想的狀態,肯定是兩者結合,事實-假設-驗證,不斷循環,接近真相。但現實中有很多條件制約。導致我們只能從一個角度切入,慢慢靠近真相。

四、解決“會怎樣”問題的方法

預測類問題,是所有人都感興趣的話題,也是統計學/算法最有可能發揮作用的地方。唯一限制方法使用的,是:到底有多少數據&業務人員要不要參與。

如果業務人員堅持參與預測過程,就只能用業務假設法或者滾動預測法,這些方法把影響結果的參數都列出來,方便業務人員拍腦袋,也能幫他們清晰:我要做多少。

圖片圖片

如果業務人員不參與,則視數據量的多少。數據少,則使用時間序列預測,數據多,且有影響結果的原因數據,則可以用諸如回歸模型一類算法預測。

圖片圖片

五、解決“又如何”問題的方法

綜合評估與分配問題,統稱“又如何”問題。這是決策的最后一步,決定是否對業務做動作,做多大動作。有些簡單的評估是很容易的,比如銷售簽了生死狀,達不成業績目標就炒魷魚。

但大部分情況,評估很復雜,要考慮方方面面。這里最大的區別,在于要不要考慮領導的主觀意見。如果要,果斷使用主觀評分法!滿足領導的打分欲是第一位的。如果不要,再考慮使用有監督的機器學習算法,或者因子分析法,DEA法(求的是相對效率)等客觀方法。

至于:做多少,誰來做。就是更復雜的問題了。想做好分配,得先把前邊幾步分析做完,對每個業務線基礎能力有充分認識,才好下判斷。這里,線性規劃的方法,可以用來做支持。

圖片圖片

六、為什么感覺沒用上方法?

綜上可見,數據分析的方法是非常多的。但為什么很多同學感覺自己沒用上方法呢?因為每種方法是和業務場景、領導風格、數據質量、息息相關的。

比如因果推斷算法大多基于分組測試展開,而實際業務中,很多因果分析是事后再查原因,也不給二次實驗的機會。

比如很多公司的分配方案,根本就是領導拍腦袋,一言堂,根本沒機會讓分析師用算法。

比如預測問題,很多公司根本沒有足夠數據積累,只有一條銷售數據,那撐死了也只能用時間序列法。

這種理想與現實的差距,讓很多同學很痛苦。一方面不清楚到底這些方法該如何用,另一方面不了解,自己該如何應對業務需求。面試和工作都很吃力。

責任編輯:武曉燕 來源: 接地氣的陳老師
相關推薦

2017-09-28 16:31:02

大數據數據分析漏斗模型

2015-03-04 11:01:36

大數據數據分析分析

2015-07-29 16:19:54

大數據時代分析

2022-05-12 13:44:35

數據分析數據

2017-04-11 09:08:02

數據分析Python

2016-09-30 01:04:45

數據分析數據

2022-09-16 11:33:40

數據分析MVP

2016-09-07 14:41:43

數據分析數據分析方法論

2019-10-14 15:57:36

數據分析多維度二八法

2020-07-16 17:26:05

數據分析轉化用戶

2020-10-25 08:56:31

數據分析數據大數據

2022-03-29 14:49:14

大數據數據分析

2024-12-09 13:11:22

2017-11-29 12:45:37

Apache Spar大數據數據分析

2017-12-13 10:04:05

2022-08-02 11:29:17

數據分析場景RFM

2017-08-08 10:55:03

大數據R語言數據分析

2017-02-27 16:35:00

HDFS大數據分析

2022-06-13 08:00:00

數據湖數據倉庫大數據

2022-09-07 15:47:21

數據分析對比分析大數據
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产一在线观看 | 国产精品福利在线观看 | 一区二区三区视频在线观看 | 福利久久| 欧洲亚洲视频 | 国产欧美日韩在线观看 | 国产美女福利在线观看 | 欧美日韩1区2区 | 中文字幕人成乱码在线观看 | av一级在线观看 | 黄色男女网站 | 久久高清亚洲 | 精品欧美一区二区久久久伦 | 一级欧美黄色片 | 极品销魂美女一区二区 | 日本视频在线播放 | 久久精品色欧美aⅴ一区二区 | 毛片日韩| 欧美黄色性生活视频 | 免费人成激情视频在线观看冫 | av片在线播放 | 国产一区免费 | 国产一区二区三区色淫影院 | 日韩一区二区精品 | 国产日韩一区二区 | 中文字幕一区二区三区不卡在线 | 国产精品777一区二区 | 午夜视频免费在线观看 | 精品久久一区二区三区 | 免费久久精品视频 | 国产精品一区久久久 | av一级久久 | a国产一区二区免费入口 | 免费在线成人 | 91精品国产91久久综合桃花 | 99精品久久 | 中文字幕 亚洲一区 | 精品不卡 | 91视频网址 | 亚洲一区国产 | 欧美成人精品一区二区男人看 |