每種編程語言的平均收入
幾周前我提到過如何通過使用git的提交元數(shù)據(jù)(metadata)和Rapleaf API 來收集Github上熱門組織的一些統(tǒng)計資料(日志, 每個組織的數(shù)據(jù))。現(xiàn)在我又對這些數(shù)據(jù)按編程語言而不是組織進行劃分產(chǎn)生了興趣。網(wǎng)上關(guān)于各編程語言對應(yīng)的屌絲程序員的描述比比皆是,但我還是很好奇它們 是如何與現(xiàn)實中的人們對應(yīng)起來的。
幾周前我提到過如何通過使用git的提交元數(shù)據(jù)(metadata)和Rapleaf API 來收集Github上熱門組織的一些統(tǒng)計資料(日志, 每個組織的數(shù)據(jù))。
現(xiàn) 在我又對這些數(shù)據(jù)按編程語言而不是組織進行劃分產(chǎn)生了興趣。網(wǎng)上關(guān)于各編程語言對應(yīng)的屌絲程序員的描述比比皆是,但我還是很好奇它們是如何與現(xiàn)實中的人們 對應(yīng)起來的。一開始,我想先簡單地統(tǒng)計一下每種編程語言使用者的年齡、收入和性別。基于我已經(jīng)收集的數(shù)據(jù),這一工作還是比較輕松的:
- 對于統(tǒng)計每個repo使用的編程語言,我使用Github自帶的語言統(tǒng)計結(jié)果。例如,Github估計這個項目中75%是java代碼。
- 統(tǒng)計了每個項目中某種語言代碼占用大于50%的那些貢獻者的收入
- 過濾出那些收入點>100的編程語言
下面是收入的統(tǒng)計結(jié)果,升序排列:
Language | Average Household Income ($) | Data Points |
Puppet | 87,589.29 | 112 |
Haskell | 89,973.82 | 191 |
PHP | 94,031.19 | 978 |
CoffeeScript | 94,890.80 | 435 |
VimL | 94,967.11 | 532 |
Shell | 96,930.54 | 979 |
Lua | 96,930.69 | 101 |
Erlang | 97,306.55 | 168 |
Clojure | 97,500.00 | 269 |
Python | 97,578.87 | 2314 |
JavaScript | 97,598.75 | 3443 |
Emacs Lisp | 97,774.65 | 355 |
C# | 97,823.31 | 665 |
Ruby | 98,238.74 | 3242 |
C++ | 99,147.93 | 845 |
CSS | 99,881.40 | 527 |
Perl | 100,295.45 | 990 |
C | 100,766.51 | 2120 |
Go | 101,158.01 | 231 |
Scala | 101,460.91 | 243 |
ColdFusion | 101,536.70 | 109 |
Objective-C | 101,801.60 | 562 |
Groovy | 102,650.86 | 116 |
Java | 103,179.39 | 1402 |
XSLT | 106,199.19 | 123 |
ActionScript | 108,119.47 | 113 |
這是上表對應(yīng)的柱狀圖:
對于大多數(shù)語言的排名還是比較符合預(yù)期的,得出了一下結(jié)論:
- Haskell是一種非常學(xué)術(shù)化的(academic)語言,因此學(xué)術(shù)界不會以薪資而聞名。
- PHP是一種非常通用的語言,普通的、年輕的、低收入的程序員都可以上手。
- 從圖譜右側(cè)***的部分可看出,Java和ActionScript多用于企業(yè)級軟件的開發(fā),因此其薪資待遇是相當(dāng)?shù)目捎^。
另一方面,由于對某些語言,像XSLT, Puppet, CoffeeScript不太熟悉,大家知道為什么這些語言排名較高或收入較低嗎?感謝告知。
需要說明的是:
- 所有這些數(shù)據(jù)都來自開源項目,因而可能無法精確地體現(xiàn)那些閉源開發(fā)者們的收入水平。
- Rapleaf并沒有完全統(tǒng)計所有人的收入,因此數(shù)據(jù)可能存在偏差。
- 數(shù)據(jù)(年齡、性別……)有誤差
- 沒有對Github上所有項目進行統(tǒng)計,因此結(jié)論可能不具有代表性。
***,對統(tǒng)計結(jié)果或方法有任何想法或建議請告知我,我還會再出一份按年齡、性別排名的編程語言報告。