到2025年,這些優(yōu)秀技術(shù)的地位仍將保持不變
本文轉(zhuǎn)載自公眾號“讀芯術(shù)”(ID:AI_Discovery)
近來,我花了大量時間采訪了許多中小企業(yè)、數(shù)據(jù)科學(xué)家、商業(yè)分析師、領(lǐng)導(dǎo)和客戶、程序員、數(shù)據(jù)愛好者以及來自世界各地不同領(lǐng)域的專家們,整理出一個列表,這些技術(shù)將會在該領(lǐng)域保留很長一段時間。
R語言編程

數(shù)據(jù)科學(xué)家喜歡R的原因很多。它雖然語法簡單,但是處理各種復(fù)雜的數(shù)據(jù)驅(qū)動任務(wù)、統(tǒng)計工具的選擇以及海量函數(shù)庫的功能非常強大,且易于安裝。它與ggplot2(基于圖像語法)相得益彰,可以創(chuàng)建爽心悅目的儀表盤。Shiny使得構(gòu)建交互式儀表盤變得輕而易舉。
Python
Python是一種成熟的面向?qū)ο蟮木幊陶Z言,除了常規(guī)的數(shù)據(jù)科學(xué)之外,它還專門用于深度學(xué)習(xí)、web開發(fā)和軟件開發(fā)。像Django和Flask之類的開發(fā)框架,可以更輕松且用更少代碼,更快地構(gòu)建成更好的web應(yīng)用。
我對python和R用戶的選擇進行了深入調(diào)查,并測試他們是否會愿意轉(zhuǎn)向其他編程語言。以下是他們的觀點和簡要回應(yīng)。
研究R語言編程的數(shù)據(jù)科學(xué)家期望在深度學(xué)習(xí)和計算機視覺領(lǐng)域得到更多的支持。在與我進行了交流的人中,R用戶可以非常輕松地使用tidyverse、dplyr、data.table執(zhí)行一流的數(shù)據(jù)操作。并且,大多數(shù)用戶都具有統(tǒng)計學(xué)背景、ETL、IDE和數(shù)據(jù)處理能力,能更快地執(zhí)行復(fù)雜數(shù)據(jù)處理。
而Python用戶們已經(jīng)聽說過ggplot2且對其印象深刻,并期望matplotlib & seaborn 也能達(dá)到同樣的效果,他們認(rèn)為數(shù)據(jù)操作的復(fù)雜性和速度都可以改進。在利用theano、TensorFlow、 Keras上,Python用戶有極大優(yōu)勢,一些行業(yè)最好的API都是用Python編寫的。
SQL(結(jié)構(gòu)化查詢語言)

數(shù)據(jù)無處不在。如何輕易地提取我們需要的數(shù)據(jù)以及/或者如何與數(shù)據(jù)進行交互,是我們?nèi)缃衩媾R的一大挑戰(zhàn)。
SQL是一種與數(shù)據(jù)庫進行交流的語言。很多受訪者表示,SQL是一種必須了解的數(shù)據(jù)操作及檢索編程語言,用來與各種數(shù)據(jù)庫進行接口。大數(shù)據(jù)也是一個有趣的話題,可以參考sparklyr 和 pyspark。Python 和 R 的用戶可以從他們的IDEs連接到各種數(shù)據(jù)庫并與數(shù)據(jù)表通信。
Java
Java編程擁有龐大的粉絲群。在軟件開發(fā)領(lǐng)域,這種新興的編程語言仍然炙手可熱。當(dāng)今時代,像react.js和 Vue.js這樣的JavaScript框架在先進web開發(fā)領(lǐng)域越來越受歡迎。
Adobe AfterEffects(Adobe公司的一款圖形視頻處理軟件)
一位數(shù)據(jù)科學(xué)高級總監(jiān)在討論圍繞data2insights展開的活動時,呼吁大家一起創(chuàng)建一些很酷的信息圖表,重拾數(shù)據(jù)驅(qū)動動畫。他認(rèn)為:在將數(shù)據(jù)轉(zhuǎn)化為信息時,有許多無比有趣的信息都被忽略了。
領(lǐng)導(dǎo)團隊始終依賴那些創(chuàng)建出的數(shù)據(jù)儀表盤,在建造時嵌入一些很具創(chuàng)意的“混凝土”, “磚塊”就是一條條富有價值的信息。
此外,使用Tableau的數(shù)據(jù)科學(xué)現(xiàn)在受到可視化專家的熱捧,它在商業(yè)智能領(lǐng)域有很大的潛能;Power BI 與微軟現(xiàn)有的應(yīng)用生態(tài)系統(tǒng)無縫對接。二者都在不斷創(chuàng)新,前景一片光明。
這些都是很具發(fā)展?jié)摿屠m(xù)航力的技術(shù),入股不虧。