Kaggle調查:2018年數據科學家常用(和推薦)的編程語言榜單
摘要
Kaggle對超過23,000名數據專業人員的調查結果為數據專業人員勾勒ei了最流行的編程語言。到目前為止,Python是最流行的編程語言,其次是SQL和R.毫不奇怪,Python是有抱負的數據科學家最推薦的編程語言,Python幾乎也成為數據科學和機器學習的默認編程語言。
數據科學的實踐需要使用分析工具,技術和編程語言來幫助數據專業人員從數據中提取見解和價值。Kaggle最近對近24,000名數據專業人員進行的調查顯示,Python,SQL和R是最流行的編程語言。到目前為止,最受歡迎的是Python(使用率為83%)。此外,四分之三的位數據專業人士建議有抱負的數據科學家首先學習Python。
Kaggle于2018年10月對23,859名數據專業人員進行了全球調查(2018年機器學習和數據科學原始調查數據下載鏈接)。調查內容包括有關數據科學,機器學習,教育等方面的各種問題。Kaggle發布了原始調查數據(見上面的鏈接)。本文主要分析了調查數據中關于2018年數據專業人員使用的數據科學和機器學習編程語言的情況。
最常用的編程語言
該調查包括一個問題,“您定期使用哪些編程語言?(選擇所有適用的選項)。“平均而言,數據專業人員在2018年使用了3種(中位數)語言。如圖1所示,2018年的頂級編程語言是Python(83%的受訪者表示他們使用這種語言),其次是SQL(44%)和R(36%)。前十種語言由C / C ++,Java,Javascript / Typescript,Bash,MATLAB,C#/。Net和Visual Basic / BVA完成。
在確定為數據科學家的數據專業人員中,93%使用Python,54%使用SQL,46%使用R.
該調查還詢問了受訪者,“您最常使用哪種特定的編程語言?”如圖2所示,超過一半(54%)的數據專業人員最常使用Python。剩下的編程語言不太受歡迎,只有13%的數據專業人士說他們使用R,8%的人說他們使用SQL。
比較2017年的編程語言使用情況,我們發現Python的使用率增加了23個百分點(2017年使用率為60%)SQL使用量增加了2個百分點(2017年使用率為44%)。然而,R使用率下降了10個百分點(2017年使用率為46%)。
數據科學家最推薦哪種編程語言?
該調查還詢問了受訪者會向有志成為數據科學家的人推薦哪種首選編程語言(見圖3)。結果顯示,4位數據專業人員中有3位會推薦Python作為首先學習的編程語言。其他編程語言的推薦率要低得多(12%的受訪者推薦使用R; 5%的受訪者推薦使用SQL。
將統計范圍縮小到數據科學家身份的數據專業人士時,推薦數據為:Python(78%),R(13%)和SQL(5%)