一文講清:數(shù)據(jù)分析與數(shù)據(jù)挖掘到底有什么區(qū)別?
雖然崗位title里都有數(shù)據(jù)這兩個字,但這是兩條不同的發(fā)展路線,數(shù)據(jù)分析走的是業(yè)務(wù)和管理路線,數(shù)據(jù)挖掘走的是技術(shù)路線,二者有高下之分嗎?
我認識一位年薪10萬刀的數(shù)據(jù)分析師,只會Excel,不存在別的技能,但人家就是有能力把技術(shù)問題轉(zhuǎn)變成業(yè)務(wù)問題,不需要會算法和模型。
因為“SQL+Excel+BI工具+PPT”這套組合拳,就能滿足工作中的絕大部分需求了,如果你再能用PPT把故事講漂亮,領(lǐng)導就覺得你很厲害了,你大搞機器學習,神經(jīng)網(wǎng)絡(luò),數(shù)據(jù)算法,如果超出了領(lǐng)導的認知范圍并且沒有什么好效果的話,你的背景和你的技術(shù)也就沒什么價值了。
扯遠了,先來看看數(shù)據(jù)分析和數(shù)據(jù)挖掘這兩塊分別會涉及到什么。
數(shù)據(jù)分析
數(shù)據(jù)分析是比較大的概念,因為它的流程是由很多個部分組成的,包含了數(shù)據(jù)獲取、數(shù)據(jù)清洗、數(shù)據(jù)處理、數(shù)據(jù)分析、數(shù)據(jù)可視化等。
相比于那些長篇大論的言論,基本上就是這六大塊可以完整地概括出一整個數(shù)據(jù)分析的流程,這也是數(shù)據(jù)分析概念的體現(xiàn)。
那就我個人而言,平時的數(shù)據(jù)分析工作都是在做什么?
- 從0到1搭建數(shù)據(jù)分析體系
- 數(shù)據(jù)分析工具化,產(chǎn)品化
- 支撐領(lǐng)導、部門決策的專題分析及業(yè)務(wù)方向探索
- 數(shù)據(jù)規(guī)范制定及提升數(shù)據(jù)質(zhì)量等基礎(chǔ)工作
可以看出,數(shù)據(jù)分析師比較看重分析策略和業(yè)務(wù)知識,而這些東西,都是需要在平時的工作中,依靠項目經(jīng)驗去積累,比較吃資歷、經(jīng)驗和對業(yè)務(wù)的認知深度。
數(shù)據(jù)挖掘
什么是數(shù)據(jù)挖掘?
專業(yè)來說,數(shù)據(jù)挖掘是從大量的、不完全的、有噪聲的、模糊的、隨機的數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但有潛在的有用信息和知識的過程。
可以看出,數(shù)據(jù)挖掘是一個過程結(jié)果的稱謂,即主要目標是從數(shù)據(jù)中挖取隱藏的信息。它是一個交叉科學領(lǐng)域,受多個學科影響,包括數(shù)據(jù)庫系統(tǒng)、統(tǒng)計、機器學習、可視化和信息科學。
通俗點解釋,數(shù)據(jù)挖掘就是透過數(shù)據(jù)的表象發(fā)現(xiàn)隱藏在背后的蛛絲馬跡,從而找到潛伏的規(guī)律以及看似無關(guān)事物之間背后的聯(lián)系,用此來洞察或預(yù)測未知事項,輸入的是數(shù)據(jù),輸出的是知識。
都說數(shù)據(jù)挖掘,那從哪挖掘出來?基于以下4點:
(圖源網(wǎng)絡(luò))
數(shù)據(jù)挖掘能做到什么?我覺得舉例子更容易理解。
工廠或者制造業(yè),可以預(yù)測以后一段時間的產(chǎn)品銷量,然后來調(diào)節(jié)生產(chǎn)計劃或采購計劃。
頭條和抖音,預(yù)測用戶會對哪個內(nèi)容感興趣,然后進行精準的推薦,這也是和算法有關(guān)。
電商,可以根據(jù)用戶購買商品,個性化推薦其他。
券商,關(guān)聯(lián)分析用戶的數(shù)據(jù),認定用戶的能力等級。
……
兩個崗位的對比
1、入行門檻
數(shù)據(jù)分析<數(shù)據(jù)挖掘,很多年前數(shù)據(jù)分析的門檻是很低的,但是現(xiàn)在不同了,不過比起數(shù)據(jù)挖掘所需要的背景,還是要差不少。
舉個例子,數(shù)據(jù)分析師的學歷背景:需要985211學校,有互聯(lián)網(wǎng)公司的實習,最好能參與一個項目全程;
數(shù)據(jù)挖掘的背景:985碩士優(yōu)先,要有知名互聯(lián)網(wǎng)公司項目經(jīng)歷,最好有從0-1的經(jīng)驗
2、職業(yè)發(fā)展
都差不多,上面也說了,走的是不同的路線,你在清華,我在北大,我們都有光明的未來
3、薪酬
總體上來說,數(shù)據(jù)分析<數(shù)據(jù)挖掘,畢竟對數(shù)據(jù)挖掘的技術(shù)背景要求高,當然這只是平均薪酬,做的好的數(shù)據(jù)分析師薪酬的天花板也是高的,后續(xù)往戰(zhàn)略、管理崗發(fā)展,薪資水漲船高也是完全沒問題。
4、跳槽含金量
看人,看項目。如果你只在大廠當螺絲釘,沒業(yè)務(wù)經(jīng)驗積累/技術(shù)沉淀,兩三年后想跳出來,其實是不好跳的,因為想要你的公司,你看不上給開的薪資,你想去的公司,會覺得你在大廠沒參與完整項目,給你的錢和你能帶來的經(jīng)濟效益不成正比,最后哪都去不了。
總結(jié)
數(shù)據(jù)分析不比數(shù)據(jù)挖掘的含金量低,職業(yè)前景也不比數(shù)據(jù)挖掘差。而數(shù)據(jù)挖掘走技術(shù)路線,競爭激烈程度沒數(shù)據(jù)分析大,保住飯碗是沒問題的。但是這些都在一個前提中:你處于數(shù)據(jù)部門,而不是業(yè)務(wù)部門,并且你的公司要重視數(shù)據(jù),你的領(lǐng)導能給團隊帶來好的資源。