成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

數據分析常見效應&定律

大數據 數據分析
今天師兄整理了一下咱們數分領域常見的效應和規律,希望可以幫大家。

[[392009]]

在討論數據和業務的過程中,如果對方時不時蹦出個這效應,那定律,自己沒有了解的話會感覺一臉懵,其實這些概念也沒有什么神秘的,今天師兄整理了一下咱們數分領域常見的效應和規律,希望可以幫大家。

馬太效應

馬太效應出自圣經《新約·馬太福音》里有一則寓言:“凡有的,還要加倍給他叫他多余;沒有的,連他所有的也要奪過來”。中國也有類似的古語,看過83版射雕英雄傳的同學應該對九陰真經里面 “天之道,損有余而補不足” 這句話印象深了,這句話出自老子的《道德經》,完整的古語為“天之道,損有余而補不足;人之道則不然,損不足以奉有余”,意思是:自然的法則,是損減有余來補充不足。人類社會世俗的作法卻不然,而是損減貧窮不足來供奉富貴有余。這兩句古語比較直觀地表述了馬太效應,通俗地解釋為 “強的越強,弱的越弱”。

馬太效應在業務中非常常見。比如在推薦算法中,被判定為質量較好的用戶所得到的資源就越多,這種情況也會形成反饋,得到的資源越多越會被判定為質量較好的用戶,從而加劇這種效應(類似于短視頻點贊越多曝光越多,曝光越多點贊越多)。

虹吸效應

有些同學小時候可能做過這樣的事情,把一根軟管子一頭插入水槽里面,用嘴把水吸出來,然后把軟管子的另一頭放地比水槽里水面低,那么水就能源源不斷地流出來,其中的道理就是虹吸效應:液態分子間存在引力與位能差能,使液體會由壓力大的一邊流向壓力小的一邊。在業務中的虹吸效應指的是,某一主體將資源吸引過去,從而使得自身相比其他主體更加有吸引力,并導致其他主體營養不良的現象。

這與馬太效應有相似之處但是并不相同,如果說馬太效應通俗理解為“強者越強,弱者越弱”,那么虹吸效應的通俗解釋為“大樹地下不長草”。強者越強不一定是以犧牲弱者為代價,而虹吸就像一塊干海綿,把周邊的資源吸干,導致周邊沒有資源可用甚至寸草不生。

比如,在勞動力市場,每年985,211畢業的本科研究生數量是有限的,大公司用誘人的薪資待遇吸引人才,導致這部分人才大部分流向大公司,小公司則相對較難招聘到這部分畢業生,這也是一種虹吸現象。再比如,在渠道投放時,假如渠道投放的總體預算是固定的,假如增加某一廠商渠道A的費用使此渠道的ECPM值(可以理解為廠商對品牌方的一種評價指標,ECPM值越高在投放中將獲得更好的資源)上漲,進而導致渠道A的成本下降,渠道投放人員就有可能把其他渠道的預算轉移到A,久而久之A渠道的預算占比會越來越高,其他渠道預算占比越來越低,長尾的小渠道可能會停止投放。

幸存者偏差

幸存者偏差講的目光聚焦于“幸存下來”的群體具備的某些特征,但是忽略了“未幸存下來”的群體是否也是具備相同的特征。這里“幸存”的概念,其實更合理的說法應該是“篩選”。

在二戰中統計學家沃德教授曾收到美國軍方邀請,為降低飛機被擊落的概率提出建議。經過觀察發現機翼是被擊中最多的地方,而機尾被擊中概率比較小。當時軍方的指揮官認為應該加強機翼的防御,但是沃德教授的結論是要加強機尾的防御。原因在于樣本僅統計了返航的飛機,機翼被集中多次依然能夠返航說明機翼并非是致命的地方。機尾被打中的飛機,會導致引擎受損而無法返航。

辛普森悖論

辛普森悖論指的是,當對比AB兩個群體的數據,并將數據拆分成多個維度時,A組在各個維度下的表現均好于B,整體A組的表現卻并不一定好于B。

舉一個栗子,對比AB兩個競品的留存,將留存拆分成新用戶和老用戶兩部分,競品A新老用戶的留存均高于競品B,但是競品A的整體留存卻低于競品B。出現這種情況的原因在于兩點,第一是兩個競品新老用戶的占比不一致;第二是競品A老用戶的留存高于競品B新用戶的留存(也可以是競品A新用戶的留存高于競品B老用戶的留存,在此以其中一種情況進行說明)。如果競品A老用戶占比高于競品B,那么競品B在老用戶留存累計的優勢就有可能抹平競品B新用戶留存積累的劣勢,使得整體留存高于A。

通俗地講,就好比兩個拳擊手X,Y對打,Y在各個方面都比X有優勢,如果X采取以牙還牙的策略定是贏不了Y,所以X需要集中優勢力量攻打Y的軟肋,雖然X自己也會收到攻擊,但是如果X對Y造成的傷害遠遠高于自己可以承受的傷害,就有可能先把Y撂倒。那“農村包圍城市,武裝奪取政權” 是否也是有類似的思想呢?

想要詳細了解的話可以看師兄之前寫的文章:秒懂辛普森悖論---一篇文章就夠了

本福特定律

本福特定律,是說一堆從實際生活得出的數據中,以1為首位數字的數的出現機率約為總數的三成(30.1%),這個定律至今沒有經過一個嚴格的證明,他就像是大自然賦予我們的一個監控指標,當一組數據不符合本福特定律時,就有理由懷疑數據是否造假。所以此定律經常用在檢測上市公司財報是否造假以及選舉中是否有舞弊現象。

想要詳細了解的話可以看師兄之前寫的文章:秒懂本福特定律

帕累托定律

這個名字大家可能并不熟悉,但是一定聽過二八定律,管理學家帕累托通過研究大量事實發現:社會上20%的人占有80%的社會財富。后來經過豐富與發展這個定律表述為,在任何一組東西中,最重要的只占其中一小部分,約20%,其余80%盡管是多數,卻是次要的。比如活躍用戶中僅有20%的付費用戶,付費用戶中20%的用戶貢獻了80%的收入等等。當然20%與80%只是一個統計數據,其實質講的是 “在因和果、努力和收獲之間,普遍存在著不平衡關系” , 即不平衡關系存在的確定性和可預測性。

二八定律告訴我們把精放在更本質的事情上,不經規劃地做事情很有可能會浪費80%的精力去產出20%的東西。有些同學在做分析的時候,可能有這種感受,跑了n個sheet的數據,結果寫報告的時候,只用了四五個數據。所以在分析的習慣是先思考產生問題的原因,并對每個可能的原因賦予權重,然后以最簡單快捷地方式來驗證各個原因,快速排除錯誤方向,而不是在每個原因上都做詳細的解釋。

這一期的概念就整理到這里,你還知道有什么與數據分析相關的效應么?

 

 

責任編輯:姜華 來源: 數師兄
相關推薦

2019-07-31 14:16:35

大數據人工智能算法

2022-06-15 15:34:12

數據分析分析模型誤區

2017-07-24 09:18:55

大數據數據分析行為事件分析

2017-04-13 12:59:43

數據分析

2022-10-12 00:13:20

數據分析人工智能數據可視化

2019-05-06 09:27:13

數據分析大數據開發數據

2020-05-28 08:58:29

數據分析分析系統數據

2021-04-09 13:14:52

數據分析技術大數據

2015-08-14 10:28:09

大數據

2021-08-12 11:37:23

數據分析錯誤

2022-06-30 15:12:48

數據分析工具大數據

2017-04-11 09:08:02

數據分析Python

2020-05-11 18:00:48

規范數據分析架構

2020-05-28 11:34:08

互聯網數據分析數據

2022-11-14 10:36:55

數據科學數據分析

2016-03-16 10:39:30

數據分析數據科學可視化

2020-11-06 08:30:45

數據分析數據思維錯誤

2024-07-01 08:51:19

可視化數據分析漏斗

2015-10-26 10:41:10

數據分析思想指南

2015-08-11 15:52:52

大數據數據分析
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 操视频网站| 超碰网址 | 一a级片| 国产一区二区精品 | 欧美日韩久久 | 精品久久一区二区三区 | 欧美大片久久久 | 欧美成人精品一区二区男人看 | 亚洲精品一区二区 | 亚洲精品一区二区冲田杏梨 | 日本视频免费观看 | 日本精品免费 | 国产乱码精品一区二区三区忘忧草 | 日韩成人免费中文字幕 | 欧美亚洲视频 | 天堂精品 | 亚洲精品色 | 黄色片视频 | av官网在线 | 狠狠操你 | 国产日韩免费视频 | 91视频www.| 超碰人人在线 | 日本中文字幕一区 | 天天操一操 | 午夜影院在线观看 | 精品亚洲二区 | 毛片在线免费播放 | 久久成人人人人精品欧 | 中文字幕视频一区 | 亚洲午夜视频在线观看 | 99pao成人国产永久免费视频 | 影音先锋中文字幕在线观看 | 精品区一区二区 | 五月激情综合网 | 中文字幕国产视频 | 欧美aaaaa| 亚洲一av | 午夜欧美a级理论片915影院 | 久久久久国产一区二区三区四区 | h视频在线免费观看 |