過快、過量、過度:三類數據驅動型決策中的常見問題
在大數據的時代,很多公司通過采用數據驅動方式進行決策。在本文中我想談一下我們在數據分析過程中三種常見失誤:過快–急于求成、過量–圖圇吞棗、過度–信息過載。
過快:急于求成
還沒找到實際問題就提出解決方案
不要擔心在定位問題上花費太多時間。關于越早開始行動,越能提前完成項目的理論不一定正確,如果未能充分理解關鍵問題可能會浪費更多時間。無論你是在思考一個新的產品特性,對公司未來發(fā)展方向的戰(zhàn)略決策,建立機器學習模型,還是給你的同事寫郵件,都要確保你有花時間去了解項目的真正需求,而不是浪費了大量時間和精力后才發(fā)現方向錯了。
別忘了,你所要解決問題的類型決定了對應的解決辦法。比如在數據科學領域,建立模型前必須要了解該模型是為了加強調用(你的模型在多大程度上可以反饋特定數據),還是加強準確性(在所有正向預測中,有多少是準確的)。從最初開始定位項目目標有助于增強模型的準確性,降低漏報(針對調用)及報錯(針對準確性)發(fā)生的可能性。
《哈佛商業(yè)評論》一篇相關文章推薦了以下方法幫助你解決真正問題>>>Are You Solving the Right Problem?
- ***步:設定解決方案的需求
- 第二步:調整該需求
- 第三步:將問題情境化處理
- 第四步:寫下問題陳述
另一個著名方法是MBA項目教授的“五問法”>>>MBA項目教授的“五問法” 一種由豐田集團開發(fā)的問題解決技巧,有助于通過重復拷問“為什么”來觸及問題的根源。
過量:圖圇吞棗
對于重要的和無關緊要的指標不做區(qū)分
生活在大數據時代,我們能通過大量工具追蹤各類用戶活動,擁有各種指標來定義每一個用戶的行動。然而有多少指標是真正有用的?你能夠通過觀測這些指標來得出可行的方案么?
重要的是質量而非數量。比起追蹤全部的數據,不如試著找出那些真正能夠衡量產品健康程度并加以改善的關鍵績效指標(KPI)。根據商業(yè)模式,公司目標和產品生命周期,決定哪些KPI是你需要關注的重點。
我推薦大家了解下Dave McClure的演講,他將項目開發(fā)的指標分成了五類:
- 用戶獲取
- 用戶激活
- 用戶留存
- 用戶推薦
- 收益增加
Dave McClure的演講>>>Customer Lifecycle: 5 Steps to success
另一個知名的極簡方法是《精益數據分析》(Lean Analytics)中提到找到“***關鍵指標”>>>Video: Lean Analytics: One Metric That Matters (OMTM)
過度:信息過載
試圖發(fā)現根本不存在的模式
因為我們的直覺并不總是對的,而數據有時令人驚訝,盡管我們一直在尋求通過數據驅動進行決策,應用常識也很重要。要記住,模型世界并不是世界本身。你的模型存在假設和局限性,有時這些會將你引入歧途。不管模型告訴你什么,無論是肯定了你的預測還是告訴你特殊結果,你都要用自己的判斷力,思考預測正確的概率以及信號的強烈程度。
有時候被發(fā)現的并不是“真相”。我們可能沒有意識到,自己自己有時在無意識的尋找不存在的信號。通過了解行業(yè)的更多方面,競爭格局,宏觀經濟因素,周期性影響和其他因素有助于更準確的設定增長目標并依據數據得出科學的結論。例如,某些參與指標的下降不一定是消極型號,可能只是周期性影響,客戶投訴的增加可以是一個健康增長的跡象,因為它體現了用戶基數的上升。
“相關性不一定是因果關系”在統(tǒng)計學中,這用來強調兩個變量之間的相關性并不意味著一個因素會影響另一個。有時人們閱讀博客是為了優(yōu)化他們的數據驅動決策,有時事情就這么發(fā)生了。