成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

你和數據分析高手之間,真的只差這一點

大數據 數據分析
在開發的時候,先做能用基礎標簽+現有數據指標,直接計算出來的標簽。這種標簽也被稱作:規則標簽。即業務給到計算規則后,可以基于基礎標簽+現有指標直接計算。這種標簽獲得速度快,也容易驗證。

很多同學覺得自己在工作中進步很少,拿著數據,翻來覆去就是同比、環比,做了兩三年也沒進步。在這背后,有個很大問題是:缺少有業務含義的標簽積累,導致只會零散地看數據,既無法推導有業務意義的結論,也積累不了業務分析經驗。今天我們就借一個例子,讓大家看出其中的區別。諸位坐好扶穩,我們馬上發車。

問題場景

某同學提交了一份店鋪分析報告,指出:A門店業績排行靠后,低于其他店,建議搞高。然而沒想到,這么平平無奇一句話,立馬捅了馬蜂窩了。業務部門同事開始七嘴八舌地爭論:

甲同事:A是新開門店,不應該和其他店這么比,A其實很好

乙同事:雖然A是新開店,但是A是標準店,不能和mini店比,A其實不好

丙同事:雖然A是標準店,但A是撿漏店,不能和普通標準店比,A其實很好

丁同事:雖然A是撿漏店,但是A營銷力度并不低于普通店,A還是不好

戊同事:雖然A營銷力度很大,但是營銷投入并不重,A還是很好

……

大家吵成一團。最后總結:“數據分析做得不深入,只有數字沒解讀,要結合業務深入分析”留下做數據的同學在風中凌亂:

“你們說的都是啥???”

“我要怎么深入法???”

那么,要怎么深入分析呢?

破局關鍵:標簽的業務含義

這里最大的問題,在于業務討論的各種細節,無法直接表示成一個數據指標,導致量化都做不了,更不要提分析了。而量化業務的關鍵在于貼標簽。注意!很多同學一提標簽,本能地想到“性別、年齡、包裝尺寸、包裝顏色”這些數據庫里現成的,直接從基礎信息導入的標簽。這些基礎標簽,大部分時候沒有直接的業務含義,對業務解讀能力很弱,需要二次加工才好用。

有業務含義的標簽,則是直接指向業務關心的問題,對問題指標有區分度,對業務行為有指導能力的標簽。比如“這個店長能力不行”,這就是個有業務含義的標簽,如果確認了能力不行,那下一步就是換店長或者做培訓,對業務行為指導很清晰。這種標簽,需要復雜的轉化過程與數據驗證,不是一蹴而就的。

圖片

那么要怎么打呢?一步步來看。

從整理業務假設開始

既然是打業務標簽,首先就得從整理“影響業務指標的假設”開始。這樣打出來的標簽才是直接指向業務問題的。比如開頭的問題,我們可以根據業務部門七嘴八舌的議論,分別列出:

1、待描述的業務對象

2、衡量業務對象好壞的指標

3、影響指標的假設

4、假設的影響方向

這樣就有了一張清晰的,待開發的標簽列表(如下圖):

下一步可以一一進行開發。

先做簡單的標簽

在開發的時候,先做能用基礎標簽+現有數據指標,直接計算出來的標簽。這種標簽也被稱作:規則標簽。即業務給到計算規則后,可以基于基礎標簽+現有指標直接計算。這種標簽獲得速度快,也容易驗證。

比如:是否新開店。理論上只要根據開店日期做分類即可。比如規定6個月及以內的都是新開店。那么大于等于7個月的就是老店,小于等于6個月的都是新店。

這里有個關鍵問題:這個“6個月”的標準要怎么來。這里有兩種做法:

第一種,如果業務部門有共識的話,我們可以直接用業務的標準,比如大家共識了是6個月,那就是6個月。

第二種,業務沒有具體數值的共識,但是有一個概念,比如:

1、新開店階段,門店閉店概率很高

2、新開店階段,門店營業額/訂單量處于上升期

此時,雖然沒有明確標準,但是業務給出找標準的方法。我們可以統計所有門店的生命周期數據,看閉店概率/營業額/訂單量的拐點在哪里,從而清晰標準(如下圖)。

圖片

原則上,即使業務口頭給出了第一種標準,我也建議大家引導業務做出第二種標準。因為第二種才是有業務邏輯的標準。萬一哪天不同業務部門吵架,或者業務換了領導,不再認可第一種標準,第二種標準就是調整的原則。

類似地,門店面積標簽也可以這么打。先列出業務假設:

1、門店面積大,對應的成本就高

2、營業面積大,收入也應該高。

之后就可以把現有的幾種店面面積列清單,看參數范圍,做出標簽(如下圖)。

圖片

這里特別要提醒:很多同學做標簽,不和業務溝通,自己憑感覺或者看數據分布下判斷,比如怎么區分新店,丫自己拍個3個月……這種閉門造車的結果,很容易被業務挑戰,也無法與業務場景結合,最終使標簽工作淪為自嗨。

有了簡單標簽打底,可以再來處理復雜標簽情況。

常見的復雜標簽

常見復雜情況一:一個業務問題,需要分幾個標簽來描述。比如“促銷”這個標簽,促銷形式,力度,可能需要分開描述。比如:

1、促銷范圍:參與促銷的商品SKU數量

2、促銷力度:按原價折算,用戶拿到優惠比例

3、促銷形式:買贈、滿減、送禮、加一件……

(如下圖)

圖片

可能一個業務場景,需要好幾個標簽組合才能說清楚。

常見復雜情況二:兩個/多個基礎標簽合并出來的標簽(又稱綜合計算標簽)。比如“撿漏店”,潛臺詞是:這個店面積很大,但店租比正常低,同時客流并沒有比正常少很多,因此被我們撿漏了。這個時候,撿漏店是有三個基礎標簽拼接出來的(如下圖)。

圖片

類似的,比如:“這個店長能力不行”,怎么證明能力不行,可能得從業績、工作數量、個人履歷好幾個維度來論證,考察的維度一多,就涉及如何付權重問題。付權重本身有一套方法論,同學們感興趣的話,我稍后單獨分享。

圖片

常見復雜場景三:標簽是預測未來的情況,并非已發生的情況,比如我們預判這個店是“高潛力門店”,因此要求它表現比普通更好。注意!預測本身是個復雜的活,可以基于規則判斷,可以建模,建模也有好幾種方式,因此處理起來略復雜,有興趣的話,也是稍后單獨分享。

總之,經過這么一堆復雜計算,現在標簽已經打好,可以利用分析了。

標簽的綜合利用

標簽的直接應用,就是把復雜的業務問題量化,進而進行分析和檢驗。比如文章開頭那一堆復雜的業務理由,用標簽就可以直接做單維度對比,檢驗說法。

如果有多個標簽疊加,則可以構建復雜的分析邏輯,一層層進行推導。這種復雜的分析邏輯,就是我們常說的“深入分析”,一般習慣性,把考慮了很多種情況,稱為“分析全面”,把推導了多少層,稱為“分析深入”(如下圖)。

圖片

當然,標簽不止這一種用法,比如標簽可以作為進一步建模的特征值,輸入模型做綜合性評估/預測。很多同學的評估模型/預測模型做得不準確,就是因為缺少標簽積累,直接把幾個簡單的原始數據懟進模型。

比如,標簽還可以用來推導業務行動。諸如“店長能力不行”“營銷力度不足”,可以直接導向“我要培訓店長”“我要增加營銷投入”這種結論。

責任編輯:武曉燕 來源: 接地氣的陳老師
相關推薦

2021-09-17 08:04:28

Hooks函數組件架構

2019-11-15 14:11:41

工業革命工業4.0信息化

2019-07-10 06:08:33

IT運維網絡故障故障排除

2021-04-29 22:11:28

Python排序算法

2018-10-15 21:12:08

2021-03-25 09:42:37

CIO首席信息官IT領導

2021-10-18 21:55:08

Windows 10Windows微軟

2024-05-06 09:02:57

數據分析標簽模型

2019-04-07 16:40:46

WiFi無線路由器網絡

2020-12-24 10:34:59

防火墻網絡安全

2018-03-08 16:22:39

FlutterAndroid代碼

2024-12-26 11:49:14

2016-05-10 10:43:02

2018-06-25 16:18:58

Python人工智能

2017-06-27 13:50:37

數據分析Session

2018-12-10 08:36:42

Leader管理模塊

2024-12-09 13:11:22

2017-08-04 13:12:44

2009-01-20 14:04:58

數據挖掘信息整合應用

2017-04-18 20:09:14

數據分析電影評分
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 日韩影院一区 | 亚洲欧美一区二区三区视频 | 亚洲精品视频一区二区三区 | 九九在线视频 | 亚洲精品成人在线 | 91麻豆精品国产91久久久更新资源速度超快 | 91成人精品视频 | 欧美视频 亚洲视频 | 免费一级黄色录像 | 日韩美女在线看免费观看 | 久久久久国 | 成人在线观看网址 | 狠狠视频 | 久久国产精品99久久久久久丝袜 | 欧洲免费视频 | 在线免费观看毛片 | 成人性视频免费网站 | 亚洲免费人成在线视频观看 | 免费在线观看av片 | 国产小网站 | 国产 欧美 日韩 一区 | 在线观看国产视频 | 99re6在线视频精品免费 | 第一福利社区1024 | 国产在线精品一区 | 中文字幕第一页在线 | 国产精品视频一区二区三区 | 色爱综合网 | 国产精品一区二区久久久久 | 国产精品亚洲二区 | 成人小视频在线观看 | 国产99久久 | 中文字幕在线三区 | 中文字幕一区在线观看视频 | 日韩有码在线播放 | 亚洲精品久久久久久下一站 | 日韩精品一区二区三区视频播放 | 精品成人一区 | 日韩在线精品强乱中文字幕 | 国产精品日韩欧美一区二区三区 | 免费黄色网址视频 |