數(shù)據(jù)分析師們,每天到底在忙些什么?
這個問題總能見到一些朋友問。新人問,因為數(shù)據(jù)分析這個事兒聽起來挺抽象又很高大上,具體需要做哪些,大家不知道。有些已經(jīng)在做數(shù)據(jù)分析的老人也會問,因為自己當(dāng)前做的工作和入行之前理解的似乎不太一樣。
今天就系統(tǒng)來說一說這個問題:數(shù)據(jù)分析師們,每天到底在干些什么?
如果對數(shù)據(jù)分析行業(yè)不太了解,教大家一個最簡單的方法,就是去招聘網(wǎng)站上看數(shù)據(jù)分析崗位的招聘要求(這個方法適用于各個行業(yè)),通常來說職位描述中提到的內(nèi)容,就是該崗位入職后可能需要做的事情。當(dāng)然,不排除面試造火箭,入職扭螺絲的情況。
下面就進(jìn)入正題。因為不同行業(yè)(互聯(lián)網(wǎng)、電商、零售、醫(yī)療……)、不同方向(產(chǎn)品、運營、銷售……)的數(shù)據(jù)分析崗位之間仍有因業(yè)態(tài)不同而產(chǎn)生的差別,此處不做細(xì)分講解,講的是偏業(yè)務(wù)型分析師普遍性的工作內(nèi)容。
比較全面,建議看完。
臨時性需求的溝通和管理。
很多人以為數(shù)據(jù)分析就是和數(shù)據(jù)打交道,其實不然,溝通需求也是數(shù)據(jù)分析師們每天主要的工作內(nèi)容之一,數(shù)據(jù)分析師每天會接收到來自業(yè)務(wù)方的各種需求,可以分為數(shù)據(jù)支持需求和分析型的需求。
比如運營想看某段時間內(nèi)xx的xx指標(biāo)的表現(xiàn)情況,請分析師拉一下相關(guān)數(shù)據(jù);某個指標(biāo)有異動,請分析師歸因;某場活動結(jié)束了,幫忙做一個活動數(shù)據(jù)復(fù)盤……這些臨時的需求在確認(rèn)、溝通、開會上往往就會占用很多時間,因此深入了解業(yè)務(wù)、快速get到業(yè)務(wù)的需求和目的,合理地做好需求的管理排期,都是一名優(yōu)秀數(shù)據(jù)分析師的必修課。
這里提一個建議:不要一接到需求就無腦執(zhí)行,明確需求才是第一步,不妨多問問需求提供方,究竟要做什么事情、什么目的。在把數(shù)據(jù)結(jié)果給需求提供方時,再提一句:預(yù)計什么時候看到結(jié)果和反饋,我們到了那個時間點一起看反饋結(jié)果。這樣的完整的過程才談得上是一個閉環(huán)。
數(shù)據(jù)提取
數(shù)據(jù)提取簡稱取數(shù),就是根據(jù)數(shù)據(jù)分析的目的或業(yè)務(wù)方的需求,從數(shù)據(jù)庫中提取所需數(shù)據(jù)的過程,可以算是正式數(shù)據(jù)分析流程的第一步。但公司的大數(shù)據(jù)平臺或者數(shù)據(jù)倉庫建設(shè)不完善,數(shù)據(jù)基礎(chǔ)建設(shè)不規(guī)范、或者對業(yè)務(wù)庫表的不熟悉等等因素,都會導(dǎo)致數(shù)據(jù)提取效率較低,再加上頻繁來自業(yè)務(wù)方高頻的取數(shù)需求,這就導(dǎo)致很多人會陷入到取數(shù)的工作中,大家是否聽說過sql boy、茶(查)樹(數(shù))菇(姑)的稱呼,其實就是對陷入取數(shù)怪圈的數(shù)據(jù)人的一種戲稱。有些新人雖然掛著數(shù)據(jù)分析的title,但每天80%都干的是取數(shù)的工作。工作第一年經(jīng)常取數(shù)無需憂慮,但是這個狀態(tài)保持3年以上,就一定要爭取轉(zhuǎn)變了。
數(shù)據(jù)處理與分析
數(shù)據(jù)處理是指對初步收集到的數(shù)據(jù)進(jìn)行加工、整理,可能是數(shù)據(jù)分析過程中最耗費時間的,尤其取決于數(shù)據(jù)質(zhì)量。中小型公司和小數(shù)據(jù)量的情況下,數(shù)據(jù)分析師們通常會用Excel來處理數(shù)據(jù),在大數(shù)據(jù)量的情況下,SQL和python的使用更為常見。
明確好分析目的和分析方法,準(zhǔn)備好數(shù)據(jù)后,就可以著手開始分析了。分析師們需要通過分析工具、分析方法對數(shù)據(jù)進(jìn)行探索,從中發(fā)現(xiàn)因果關(guān)系、內(nèi)容聯(lián)系和業(yè)務(wù)規(guī)律等,為商業(yè)目的提供參考。
對于懂業(yè)務(wù)的分析師來說,數(shù)據(jù)分析的過程其實不占用太多時間,面對業(yè)務(wù)提出來的需求和存在問題,基本能快速明確分析思路。
分析總結(jié)
這是一整套數(shù)據(jù)分析全流程的終點站,通常一些臨時性的分析需求,數(shù)據(jù)分析師們做一個結(jié)果和重點明確的需求回復(fù)郵件即可;完整的、復(fù)雜的數(shù)據(jù)分析,一般會使用PPT來制作數(shù)據(jù)分析報告,如果涉及到了多位業(yè)務(wù)相關(guān)人員,還可能需要做presentation。因此抓重點、PPT制作和說話的能力,也是一位優(yōu)秀的數(shù)據(jù)分析是不可或缺的。
制作、維護(hù)報表
每個公司都會需要將重點關(guān)注的數(shù)據(jù)指標(biāo)做到一個表中,去周期性的更新和維護(hù),這一步就需要寫sql查詢、生成報表。一般公司的報表數(shù)量可能多達(dá)上百個,部分公司會有專門的報表工程師進(jìn)行開發(fā)和維護(hù),也有的公司是由數(shù)據(jù)分析師來進(jìn)行。很多數(shù)據(jù)分析師上午來公司的第一件事,就是監(jiān)控自己對應(yīng)業(yè)務(wù)的報表是否有數(shù)據(jù)異常現(xiàn)象發(fā)生,及時發(fā)現(xiàn)、解決問題。如果是在部分?jǐn)?shù)據(jù)平臺建設(shè)不完善的公司,數(shù)據(jù)分析師還要將當(dāng)天的監(jiān)控情況進(jìn)行圖文描述,郵件抄送給業(yè)務(wù)方的關(guān)鍵人。因此在做這項工作時,對數(shù)據(jù)指標(biāo)的敏感性、對業(yè)務(wù)的理解都是很重要的。
數(shù)據(jù)可視化
主要是設(shè)計可視化看板。設(shè)計看板時的一般步驟是:確認(rèn)指標(biāo)、設(shè)計可視化方式,最后如果公司購入了FineReport等可視化工具的,就由分析師自行使用工具設(shè)計看板,當(dāng)然也可以提需求給前后端的同事讓他們進(jìn)行開發(fā)。這里很考察數(shù)據(jù)可視化的思維,把數(shù)字往折線圖、柱狀圖、餅圖上一套,這大部分人都知道,更重要的是需要思考,哪一種圖能夠更好的體現(xiàn)指標(biāo)的特性和關(guān)注的目的,是看走勢,還是分布,看絕對值,還是百分比。
這里提醒一句話:可視化一定是為數(shù)據(jù)和業(yè)務(wù)服務(wù)的,切勿將可視化效果凌駕于業(yè)務(wù)效果之上。
專項分析
專項分析是很多初入門的數(shù)據(jù)分析師非常渴望能參與的,因為上面提到的很多工作內(nèi)容其實都是在輔助和配合,而專項分析則可以由數(shù)據(jù)分析師去主導(dǎo)推進(jìn)數(shù)據(jù)項目,整體性地完成一項業(yè)務(wù)的全方位分析、分析體系建設(shè)、優(yōu)化等,從而定位業(yè)務(wù)問題、提供業(yè)務(wù)發(fā)展建議,發(fā)現(xiàn)新的業(yè)務(wù)發(fā)展點,真正實現(xiàn)崗位價值,尤其是一些復(fù)雜、深度的分析,像涉及到建模的項目,需要做分詞、聚類、回歸等,只能由專業(yè)的數(shù)據(jù)分析師來執(zhí)行。
比如對接銷售部門,可能需要根據(jù)公司的銷售情況搭建銷售分析體系,建立銷售預(yù)測模型,生成客戶畫像;對接產(chǎn)品、運營相關(guān)部門,數(shù)據(jù)分析師就需要負(fù)責(zé)公司各產(chǎn)品線的用戶相關(guān)數(shù)據(jù)體系搭建、流程優(yōu)化、建立AB test產(chǎn)品迭代體系、測試方面的專項分析。
也非常建議新人數(shù)據(jù)分析師們能抓住機(jī)會參與到一個完整的分析項目中去,這對了解分析流程和業(yè)務(wù),以及對未來的跳槽都是有幫助的。
數(shù)據(jù)基礎(chǔ)建設(shè)
這個因公司而異,公司規(guī)模越大,其下的數(shù)據(jù)崗位就會越細(xì)分,會有專人去做數(shù)據(jù)平臺搭建、數(shù)據(jù)倉庫、數(shù)據(jù)分析……但大部分的中小型公司,數(shù)據(jù)分析師往往身兼多職,建設(shè)數(shù)據(jù)平臺、做數(shù)據(jù)規(guī)范、梳理建立數(shù)據(jù)指標(biāo)體系等等。比如在梳理指標(biāo)體系時,數(shù)據(jù)分析師會需要和業(yè)務(wù)一起確定當(dāng)前重點關(guān)注的指標(biāo)、進(jìn)行優(yōu)先級排布、指標(biāo)定義、統(tǒng)計規(guī)則、埋點規(guī)則……這些基礎(chǔ)建設(shè)和定義性的工作可以說是奠基性的,基礎(chǔ)打好、數(shù)據(jù)明確好,后續(xù)的數(shù)據(jù)分析效率會得到顯著提升,否則面臨臟亂差的數(shù)據(jù),第一步的取數(shù)和洗數(shù)就是一道坎。
一般來說,越初級的數(shù)據(jù)分析崗位,在前面幾個取數(shù)、做表、臨時需求溝通上面花費的時間就越多,有一定工作和業(yè)務(wù)經(jīng)驗后,數(shù)據(jù)分析師們的工作就逐漸開始向分析項目、資源協(xié)調(diào)、總結(jié)上傾斜。