學(xué)Python就能做好數(shù)據(jù)分析?萬(wàn)能語(yǔ)言背后是一片韭菜地
“會(huì)python的大學(xué)生,找工作有多賺?“
“python到底是什么鬼,學(xué)姐靠他拿了5個(gè)offer"
“數(shù)據(jù)分析還在用Excel?學(xué)會(huì)python效率高10倍!“
......
這樣的標(biāo)題你在朋友圈、公眾號(hào)一定見(jiàn)過(guò),不管是技術(shù)類公眾號(hào),還是求職公眾號(hào),甚至情感雞湯類公眾號(hào)都會(huì)時(shí)不時(shí)地給你推一篇讓你學(xué)python的文章,尤其在數(shù)據(jù)分析領(lǐng)域,“python數(shù)據(jù)分析“的公眾號(hào)或者文章遍地都是,當(dāng)然,你隨手點(diǎn)開(kāi)一個(gè)類似上述標(biāo)題的文章,拉到最后一定都是一個(gè)python課程的報(bào)名廣告...
在鋪天蓋地廣告的洗腦下,讓很多想要學(xué)習(xí)數(shù)據(jù)分析或者已經(jīng)從事數(shù)據(jù)分析的人產(chǎn)生了這樣的疑問(wèn):python真的很厲害嗎?學(xué)數(shù)據(jù)分析一定要python嗎?它為什么可以這么火?
首先,不可否認(rèn),python的確是一門(mén)非常好的編程語(yǔ)言,應(yīng)用非常廣泛,語(yǔ)法簡(jiǎn)潔、代數(shù)邏輯清晰,而且擁有海量的第三方庫(kù)。
在數(shù)據(jù)分析領(lǐng)域功能十分強(qiáng)大, 數(shù)據(jù)爬取、清洗、可視化分析,挖掘....python無(wú)所不能。開(kāi)發(fā)效率高、運(yùn)營(yíng)速度快、而且入門(mén)簡(jiǎn)單,據(jù)說(shuō),部分地區(qū)的小學(xué)生信息課程甚至也加入了Python,看起來(lái)學(xué) python是大勢(shì)所趨,勢(shì)不可擋。
但是數(shù)據(jù)分析的都要學(xué)python嗎?
答案顯然不是。
不管是python、R還是Excel、spss,這些都是數(shù)據(jù)分析的工具,對(duì)于數(shù)據(jù)分析,我一直強(qiáng)調(diào)核心是業(yè)務(wù),通過(guò)業(yè)務(wù)的分析邏輯影射到數(shù)據(jù)分析的處理邏輯,而數(shù)據(jù)分析工具則是幫助我們實(shí)現(xiàn)結(jié)果的手段。
如果把數(shù)據(jù)分析的結(jié)果比喻成你要去的一個(gè)目的地,那么python只是可以到達(dá)這個(gè)目的地的一個(gè)交通工具,換句話來(lái)說(shuō),你換個(gè)工具也能做到,所以python和數(shù)據(jù)分析之間,并沒(méi)有不可分割的關(guān)系。
既然關(guān)乎到選工具,肯定是選擇最好用工具才能夠最快達(dá)到目的,那python是不是數(shù)據(jù)分析工具的最佳選擇呢?
不一定是。不一樣的路適合的交通工具不一樣,同樣,不一樣的類型的數(shù)據(jù)分析工作,合適的數(shù)據(jù)分析工具也不一樣。
在實(shí)際工作中,數(shù)據(jù)分析這個(gè)大類的崗位層次不一,崗位職能也大不相同,在不同的公司,同樣都叫數(shù)據(jù)分析師的崗位,可能一個(gè)就是給業(yè)務(wù)取數(shù),提供基礎(chǔ)數(shù)據(jù)支撐,而另一個(gè)卻要涉及數(shù)據(jù)建模、挖掘。這兩種人需要掌握的工具技能肯定也大不相同。
我這里把數(shù)據(jù)分析籠統(tǒng)的分類業(yè)務(wù)向和技術(shù)向兩類:
業(yè)務(wù)類分析師,側(cè)重業(yè)務(wù)分析,一般掛靠在業(yè)務(wù)部門(mén),或者有單獨(dú)數(shù)據(jù)分析部門(mén),最要工作內(nèi)容就是對(duì)特定業(yè)務(wù)做專題分析,通過(guò)對(duì)數(shù)據(jù)分析來(lái)做一些業(yè)務(wù)規(guī)劃、方案等。日常的工作大多就是整理報(bào)表,做一些探索性的業(yè)務(wù)分析,解決業(yè)務(wù)問(wèn)題。
技術(shù)類分析師,一般都在IT部、數(shù)據(jù)中心。根據(jù)從事的工作環(huán)節(jié)不同,被分成數(shù)據(jù)庫(kù)工程師,ETL工程師,爬蟲(chóng)工程師,算法工程師等角色,主要的工作一般有數(shù)據(jù)倉(cāng)庫(kù)搭建、專題分析、建模分析、數(shù)據(jù)挖掘預(yù)測(cè)等。
說(shuō)完數(shù)據(jù)分析師的工作內(nèi)容,再來(lái)看目前市場(chǎng)流行的幾類數(shù)據(jù)分析工具:Excel、python/R、BI工具
先說(shuō)大家都熟悉的Excel,excel在數(shù)據(jù)分析領(lǐng)域的地位不可動(dòng)搖,尤其對(duì)入門(mén)新手來(lái)說(shuō),大部分的人在進(jìn)入工作之前都多少接觸Excel,所以在此基礎(chǔ)上要做數(shù)據(jù)分析,學(xué)習(xí)Excel是最合適不過(guò)的,從簡(jiǎn)單的表格制作,數(shù)據(jù)透視表,寫(xiě)公式,再到VBA語(yǔ)言,基本能夠滿足80%業(yè)務(wù)人員的分析需求。而且學(xué)習(xí)Excel的成本比學(xué)習(xí)一門(mén)編程語(yǔ)言低多了。
(見(jiàn)過(guò)有很多機(jī)構(gòu)開(kāi)始利用職場(chǎng)焦慮忽悠普通職場(chǎng)人學(xué)python,說(shuō)句良心話,花費(fèi)大幾千甚至破萬(wàn)的價(jià)格去報(bào)班學(xué)python,沒(méi)有基礎(chǔ)幾個(gè)月也只能學(xué)個(gè)皮毛,回到自己的工作中根本用不上,除非你認(rèn)真考慮轉(zhuǎn)行,當(dāng)然轉(zhuǎn)行也不可能像培訓(xùn)機(jī)構(gòu)說(shuō)的那么簡(jiǎn)單)
回到正題,我們?cè)僬f(shuō)BI工具,BI的誕生,目的是為了縮短從業(yè)務(wù)數(shù)據(jù)到經(jīng)營(yíng)決策的時(shí)間,提高決策效率,所以它的產(chǎn)品設(shè)計(jì)理念就是圍繞提高數(shù)據(jù)分析的過(guò)程展開(kāi)的。
和Excel相比,BI工具在分析流程上更加簡(jiǎn)化,以我用過(guò)的FineBI為例,從數(shù)據(jù)鏈接、數(shù)據(jù)處理、到可視化圖表分析,很多功能都是封裝好的,鼠標(biāo)點(diǎn)擊拖拽就能迅速完成一次分析。這樣的可視化操作界面讓BI的學(xué)習(xí)門(mén)檻大大降低,更適合面向企業(yè)中的業(yè)務(wù)分析人員。
另外,在面對(duì)大數(shù)據(jù)量分析時(shí),BI工具也能彌補(bǔ)Excel的不足,還有一個(gè)吸引人的點(diǎn),就是BI工具的可視化效果,在Excel中制作動(dòng)態(tài)圖表或者高級(jí)的可視化圖表效果,需要經(jīng)過(guò)諸多復(fù)雜的步驟,用編程語(yǔ)言實(shí)現(xiàn),也需要一行行代碼調(diào)整,才能得到想要的效果,但是在BI工具中,簡(jiǎn)單拖拽設(shè)置,就能制作出令人驚艷的可視化圖表
不過(guò),因?yàn)锽I工具是非開(kāi)源的,所以在功能上有局限性,如果產(chǎn)品沒(méi)有設(shè)計(jì)某一項(xiàng)功能,可能就沒(méi)有辦法完成分析工作。這時(shí)候python或R這類編程語(yǔ)言就顯得更加靈活了,只要代碼寫(xiě)得好,基本沒(méi)有實(shí)現(xiàn)不了的東西。
而且在數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)領(lǐng)域,BI和Excel就更加無(wú)能為力了,在這個(gè)階段,python語(yǔ)言是一個(gè)絕佳選擇,它對(duì)復(fù)雜的數(shù)據(jù)處理、建模、預(yù)測(cè)更加游刃有余。
最后總結(jié)一下,工具的選擇要根據(jù)自身需要,而不是哪個(gè)火學(xué)哪個(gè),只有最適合自己的才是最好的。
像財(cái)務(wù)、人事、運(yùn)營(yíng)這類的基礎(chǔ)業(yè)務(wù)分析,excel完全就夠用了,如果想要提升效率,追求可視化效果,BI工具也是不錯(cuò)的選擇,完全沒(méi)有必要花費(fèi)極大的精力去湊Python的熱鬧,當(dāng)然如果你對(duì)編程很感興趣,那當(dāng)我沒(méi)說(shuō)。
最后再來(lái)回答最后一個(gè)問(wèn)題,為啥python這么火?
當(dāng)然是因?yàn)楹觅嶅X(qián),以前互聯(lián)網(wǎng)興起的時(shí)候,各種java、C++的培訓(xùn)炒的火熱,培訓(xùn)機(jī)構(gòu)大把大把撈金,現(xiàn)在大數(shù)據(jù)時(shí)代來(lái)了,數(shù)據(jù)分析、數(shù)據(jù)挖掘、人工智能的概念又火了,一片新的韭菜地出現(xiàn)在眼前,培訓(xùn)機(jī)構(gòu)們還能放著這么多的錢(qián)不賺?
隨便拿個(gè)業(yè)內(nèi)TOP數(shù)據(jù)分析師的薪資給你畫(huà)個(gè)月入2W的大餅,實(shí)際上你入職大概率6-8K,而且你在培訓(xùn)課里學(xué)到那點(diǎn)皮毛功夫還要面臨全網(wǎng)被割韭菜的各行各業(yè)神仙轉(zhuǎn)行來(lái)和你PK,最后能找到心儀工作的少之又少。
更慘的是一些無(wú)辜小白,在原來(lái)的崗位干的好好的,看到營(yíng)銷(xiāo)文案,一股心血來(lái)潮要轉(zhuǎn)行,花了大價(jià)錢(qián)大精力去報(bào)班學(xué)python,最后轉(zhuǎn)行也轉(zhuǎn)不了,反而沒(méi)在自身的崗位上有什么提升,掙大錢(qián)的夢(mèng)破碎了。
最后再?gòu)?qiáng)調(diào)一下,大部分的數(shù)據(jù)分析師本質(zhì)是個(gè)業(yè)務(wù)輔助崗位,核心是對(duì)業(yè)務(wù)的理解能力和數(shù)據(jù)敏感度,像下面這張圖里寫(xiě)的,那些告訴你學(xué)python就能入門(mén)數(shù)據(jù)分析,學(xué)python就能做好數(shù)據(jù)分析的,百分之90都是為了賺錢(qián),另外,想轉(zhuǎn)行數(shù)據(jù)分析的也要慎重考慮,這一行也并不是你想象的那么美好。