如何面對繁雜的數據需求?
大家好,我是一哥,最近有一位數據新人小伙伴伴私聊我:在平時的工作中會面臨著大量的數據需求,不僅多,而且雜,請問如何處理面對這些問題?有沒有什么好的提高工作效率的方法?
其實不止是作為數據新人會面臨這樣的“困境”,很多數據工程師都有著這樣的困惑,干了一兩年感覺沒意思,抱怨天天就是“提數”。一哥之前寫過一篇文章《數倉工程師如何避免淪為“提數機”》,大家可以參考下。
面對這位小伙伴的困惑,我思考后給了她一些建議的,今天也系統的整理一下,給大家作為參考。
業務的重要性
一哥做數據工作,也呆過了三家公司了,做過新人也帶過新人。經過“被工作的毒打”后,建議大家入職后較好的順序是先理解業務,多跟業務打交道,對底層數據和業務之間的邏輯關系先大致心里有個譜。然后自己開始梳理業務體系,心里有個框架,一般純業務的需求都比較平常,基本跳不出體系框架,一哥之前也寫過另一篇文章來說業務的重要性《業務重要?還是技術重要?》。
熟悉業務后,開始對接需求。有時候不同業務有時可能會提重復的需求,對于這種需求,要么把代碼和計算流程優化好,要么覺得不合理“懟”回去(當然不是硬懟哈,我們有業務滿意度考核……),要么你就得開始研究下,看可不可以在平臺上做成固化的數據產品。比較特別的,尤其是探索性的分析項目,是可以接受稍長一些時間的,中間可以和業務做探討。
業務是可以分門別類的,最好可以自己梳理好,做好一些好的小工具。不過只接提數需求確實沒啥意思,慢慢對業務熟悉了,就可以參與業務流程的制定,也可以自己給自己提的業務問題做數據分析(瞎折騰)才是真好玩。
“提數神器”的重要性
有時候確實沒辦法拒絕業務部門需求,各種姿勢各種要求,由于有績效這座大山,提高自己的效率來應對層出不窮的需求可謂最好的方法,同時提數的過程也有助于加強業務理解(熟能生巧嘛)。
正所謂你有政策我有對策,好的方法和工具往往能高效完成工作以免不必要的加班,在這列舉幾個常用的提數加工神器:
Excel熟練數據透視表,Vlookup等常見公式,不要瞧不起Excel,有時候它的效率確實挺高的。
針對業務部門需求固定格式的數據或者報表,可用Excel將模版寫好備用,有新數據需求時直接復制套入,即刻完成。
Sql數據人必備語言,針對業務定時需求的數據或者報表,可以用類似navicat的定時功能,提前將查詢語句寫好排版,軟件會在指定時間將結果文檔推送至郵箱。
Pythonpython的numpy,pandas,matplot是數據分析三個神器 。python可以直連數據庫,連接Hive,連接Spark(好像沒有它不能連的……)。也可以導入現有數據,只需提前將數據處理語句寫好,需要的時候應用就行,一勞永逸。
shell前幾天有同學問shell除了執行部署的jar包,還能做什么?那么你一定不知道awk、sed有多強大。曾經用shell腳本寫過上千行的數據處理腳本,離開公司4年了,聽說還在用呢!
每天一個shell命令,趕緊學起來吧!
工作方法論的重要性
首先,需求多,說明你們公司數據需求很多,給你施展才華的機會很多!
現在流行一個詞——“套路”,工作同樣也是有“套路”的,我們稱之優雅的稱之為為“方法論”。
需求優先級
1)繁雜的需求
需要抽絲剝繭,把復雜的類目整理成簡單的條目,并且明確其中的主次重點,再逐條拆解。不過數據分析本身,有些需求,的確是很復雜,需要一些時間去思考整理的。這就要看你手上的工作情況了,包括判斷個人在處理這些問題上的難易程度。
2)突然的需求
說明需求很緊急,這就需要對工作需求的輕重緩急,有個明確的判斷。再結合完成需求的時間長短,有的需求的確比較著急,是需要優先處理,有的相對可以緩一緩,復雜度高的需求,又急的話,可以先給其中個別重要的,其他的給出完成計劃。
溝通
自己對需求有了上述判斷后,并不是立刻就開始執行了,一定要和業務溝通,否則可能會出力不討好。
如果兩個需求方都要的比較急,必要的時候讓他們自己協調下,畢竟你一個人時間有限,而且數據需求,又要求精確細致,不能通過壓縮分析時間來完成任務,要有自己的工作標準,保證給出的數據都是準確率的,可使用的。
三人行,……
如果是日常的工作,總結出方法論,快速處理即可;如果是難度較高、挑戰較大的工作,也是值得花更多心思的,就理應花更多心思去研究;如果是難到自己不能完成,需要求助的,一定要和同事多討論。古人有云:三人行,必有我師焉。雖然我們可能是諸葛亮,但古人亦有云:三個臭皮匠頂個諸葛亮。在討論過程中或許你就會會發現一些其他方法。
個人認為,不論是數據工程師,或是產品經理、運營,亦或是其他崗位的工作,都是會遇到這樣類似的情況,提高效率最有效的方法:總結方法論,找到最為快捷解決復雜問題的工作思路。學會對本質問題的分析,善于抓住重點,這樣就不會被紛繁瑣碎的事情干擾而浪費掉大量的時間。善于利用自己的時間去處理更為緊要更有價值的事情,用最少的時間,掙更多的錢。
本文轉載自微信公眾號「數據社」,可以通過以下二維碼關注。轉載本文請聯系數據社公眾號。