20名Python人工智能和機器學習開源項目
本文用Python更新了頂級的AI和機器學習項目。Tensorflow已經成為了貢獻者的三位數增長的第一位。 Scikit-learn下降到第二位,但仍有非常大的貢獻者群體。
進入機器學習和人工智能并非易事。考慮到今天可用的大量資源,許多有抱負的專業人員和愛好者發現難以在該領域建立正確的路徑。這個領域正在不斷發展,我們必須跟上飛速發展的步伐。
經過信息的更新、檢查,本文用Python更新了頂級的AI和機器學習項目。Tensorflow已經成為了貢獻者的三位數增長的第一位。 Scikit-learn下降到第二位,但仍有非常大的貢獻者群體。
與2016年相比,貢獻者人數增長最快的項目是:
1.TensorFlow增長169%,從493個增加到1324個貢獻者
2.Deap,增長86%,從21到39個貢獻者
3.Chainer,增長83%,從84到154個貢獻者
4.Gensim,增長81%,從145到262個貢獻者
5.Neon,增長66%,從47到78個貢獻者
6.Nilearn提高了50%,從46個到69個貢獻者
2018年的更新:
1.Keras,629名貢獻者
2.PyTorch,399名貢獻者
Github上的前20名Python人工智能和機器學習項目
大小與貢獻者的數量成正比,顏色代表貢獻者數量的變化,紅色更高,藍色更低。雪花形狀適用于深度學習項目,否則適用于其他項目。
我們看到像TensorFlow、Theano和Caffe這樣的深度學習項目是最受歡迎的項目之一。
下面的列表是根據Github上貢獻者的數量以降序給出的項目。貢獻者人數的變化是相對于2016年發布的前20名Python機器學習的開源項目。
1.TensorFlow最初是由谷歌機器智能研究機構的Google Brain Team的研究人員和工程師開發的。該系統的設計是為了便于機器學習的研究,并使其快速、容易地從研究原型過渡到生產系統。
貢獻者:1324(168%),Github 網址:https://github.com/tensorflow/tensorflow
2.Scikit-learn是用于數據挖掘和數據分析的簡單而高效的工具,可供所有人訪問,并且可在各種環境中重用,基于NumPy、SciPy和matplotlib、開源、商業可用,BSD許可證。
貢獻者:1019(39%上),Github網址: https://github.com/scikit-learn/scikit-learn
3.Keras是一種高級神經網絡API,用Python編寫,能夠在TensorFlow、CNTK或Theano上運行。
貢獻者:629(新),Github網址: https://github.com/keras-team/keras
4.Python中的PyTorch,張量和動態神經網絡以及強勁的GPU加速。
貢獻者:399(新),Github網址:https://github.com/pytorch/pytorch
5.Theano允許你高效地定義、優化和評估涉及多維數組的數學表達式。
貢獻者:327(24%上),Github網址: https://github.com/Theano/Theano
6.Gensim是一個免費的Python庫,它具有可擴展的統計語義,分析用于語義結構的純文本文檔,檢索語義相似的文檔。
貢獻者:262(81%上升),Github網址: https://github.com/RaRe-Technologies/gensim
7.Caffe是一個深思熟慮的表達,速度和模塊化的深度學習框架。它由伯克利視覺和學習中心(BVLC)和社區貢獻者開發。
貢獻者:260(提高21%),Github網址: https://github.com/RaRe-Technologies/gensim
8.Chainer是一個基于Python的深度學習模型的獨立開源框架。 Chainer提供靈活、直觀和高性能的手段來實施全面的深度學習模型,其中包括最新的模型,如遞歸神經網絡和變分自動編碼器。
貢獻者:154(上升84%),Github網址: https://github.com/chainer/chainer
9.Statsmodels是一個Python模塊,允許用戶探索數據,估計統計模型并執行統計測試。描述統計、統計測、繪圖功能和結果統計的廣泛列表適用于不同類型的數據和每個估算器。
貢獻者:144(上升33%),Github網址: https://github.com/statsmodels/statsmodels/
10.Shogun是機器學習工具箱,它提供了廣泛的統一和高效的機器學習(ML)方法。該工具箱無縫地允許組合多個數據表示、算法類和通用工具。
貢獻者:139(上升32%),Github網址: https://github.com/shogun-toolbox/shogun
11.Pylearn2是一個機器學習庫。其大部分功能都建立在Theano之上。這意味著你可以使用數學表達式編寫Pylearn2插件(新模型,算法等),Theano將為你優化和穩定這些表達式,并將它們編譯為你選擇的后端(CPU或GPU)。
貢獻者:119(3.5%上),Github網址: https://github.com/lisa-lab/pylearn2
12.NuPIC是一個開源項目,它基于稱為分層時間存儲器(HTM)的新大腦皮層理論。部分HTM理論已經在應用中實施、測試和使用,HTM理論的其他部分仍在開發中。
貢獻者:85(提高12%),Github網址: https://github.com/numenta/nupic
13.Neon是Nervana基于Python的深度學習庫。它提供易用性,同時提供最高的性能。
貢獻者:78(66%上),Github網址: https://github.com/NervanaSystems/neon
14.Nilearn是一個Python模塊,用于在NeuroImaging數據上進行快速簡單的統計學習。它利用scikit-learn Python工具箱進行多變量統計,并提供預測建模、分類、解碼或連接分析等應用。
貢獻者:69(上升50%),Github網址: https://github.com/nilearn/nilearn/branches
15.Orange3是開源機器學習和數據可視化新手,同時也是專家。使用大型工具箱交互式數據分析工作流程。
貢獻者:53(上升33%),Github網址: https://github.com/biolab/orange3
16.Pymc是一個python模塊,實現貝葉斯統計模型和擬合算法,包括馬爾可夫鏈蒙特卡羅。其靈活性和可擴展性使其適用于大量問題。
貢獻者:39(上升5.4%),Github網址: https://github.com/pymc-devs/pymc
17.Deap是用于快速原型設計和測試思想的新型演化計算框架。它試圖使算法明確、數據結構透明。它與多處理和SCOOP等并行機制完美協調。
貢獻者:39(86%上),Github網址: https://github.com/deap/deap
18.Annoy(近似最近鄰居Oh Yeah)是一個C ++庫,它使用Python綁定來搜索接近給定查詢點的空間點。它還創建映射到內存的大型只讀基于文件的數據結構,以便許多進程可以共享相同的數據。
貢獻者:35(46%上),Github網址: https://github.com/spotify/annoy
19.PyBrain是Python的模塊化機器學習庫。其目標是為機器學習任務提供靈活、易于使用但仍然強大的算法,以及各種預定義環境來測試和比較的算法。
貢獻者:32(3%上),Github網址: https://github.com/pybrain/pybrain
20.Fuel是一個數據管道框架,它為你的機器學習模型提供他們需要的數據。計劃由Blocks和Pylearn2神經網絡庫使用。
貢獻者:32(10%上),Github網址:https://github.com/mila-udem/fuel
(貢獻者在2018年2月錄得。)