常見數據分析誤區有哪些?你犯了嗎?
做一份客觀的數據應該規避的常見數據分析誤區:
1、數據一定客觀
其實數據也會騙人,舉個例子,二戰時英軍發現從戰場飛回來的戰機,機身上的彈孔比引擎和油箱上的要多得多,根據這個數據很容易得出要加強機身的防護的建議。但事實的真相是引擎和油箱上中彈的飛機已經回不來了更應加強引擎和油箱的防護,這就是常說的“幸存者偏差”。
數據可能被人為操縱。如店鋪的評論,如電影的評分,如某公司發布的關于其所在行業的分析報告都具有一定的主觀性?;阱e誤的數據做出的分析結論是無益甚至是有害。在數據分析前先要考證數據的來源及可信度還要關注不符合常理的數據變化,對數據采集方法進行調整。
2、過度依賴數據
對于業務決策來說數據分析只是輔助手段,而不是核心推動力。許多數據是無意義的,過度依賴數據于決策無益甚至會引導上級做出錯誤的決策。
在書籍《大數據時代》中,提到了這樣一種情況:瑪麗莎·邁爾在任谷歌高管期間,有時會要求員工測試41種藍色的陰影效果,哪種被人們使用最頻繁從而決定網頁工具欄的顏色。這是陷入“數據之上”的誤區,這樣的數據是毫無意義,訪客能不能看出細微的差別不說,幾乎沒有人會因為陰影效果的不同而決定訪問/不訪問這一網頁。
一份靠譜的分析結論既來源于對關鍵數據的分析來源于經驗的積累,來源于分析師對業務的認識。如果簡單地把論證過程簡單地簡化為數據分析過程事實上是一種偷懶行為。
3、輕視業務
數據分析初學者極易犯的錯誤,只懂技術不懂業務不能真正理解業務需求。很多新手認為工作中只需要勤勤懇懇敲代碼就行,無數SQL boy/girl就這么誕生。好的分析師既懂技術又懂業務。因為技術為業務服務,公司衡量技術的價值不在于分析技術有多高超而是對業務有沒有貢獻。
數據分析師也要多去一線了解業務運作,幫助解決業務運營中遇到的各種問題。除了深入了解業務,還需要積累豐富的數據分析模型庫以應對各種業務場景,比如金字塔模型、KANO分析模型、RFM模型、購物籃分析模型、四象限模型......這些經典且廣泛應用的模型。
4、忽略效率
數據分析是整個商業活動的一環,而商業是追求效率的。很多新人容易陷入追求完美算法的陷阱,放著簡單的方案不用,非要花大量時間在鉆數據算法的牛角尖上,最后交出一份領導懶得看的長文報告。對企業來說,這樣的工作態度并不可取。推動分析結論落地是數據分析價值的體現,數據分析師除了要用最具效率的算法,還需要拿出讓決策層和執行層都信服的分析報告。
5、“套路式”分析
在數據分析學習時或許習慣了各種解題套路,但實操時其實并不存在通用的分析套路。不同的行業、不同的業務,不同的階段,哪怕用的是同一種分析方法結論都應有所區別。
對待每一次分析,應該結合業務場景中思考,結論要有針對性,不能被套路束縛住,也不能簡單依賴過往的類似案例。大數據時代,企業的數據體量不斷擴大,業務需求不斷變化數據分析的環境也不斷變化。要實時更新知識和工具庫也要警惕和避免踩中上面這些數據分析的誤區。