Python機器學習資源菜單,選庫找工具不愁,GitHub精選列表都齊了
本文經AI新媒體量子位(公眾號ID:QbitAI)授權轉載,轉載請聯系出處。
用Python搞機器學習、數據科學,需要很多相關的資料,各種庫、工具,都是常用、常找、常查的內容。
最近,維也納的數據科學家Florian Rohrer把這類相關資料整理成了一個Python機器學習工具合輯,可以照著更新一下自己的收藏夾了。
四十幾類項目
整個列表中,包含超過40類內容:
核心工具、Pandas和Jupyter、文本提取、大數據、統計、特征提取、可視化、地理工具、推薦系統、決策樹、NLP、CV、神經網絡、GPU、聚類、機器學習可解釋性、強化學習……
具體都有什么呢?比如***部分核心工具:

pandas、scikit-learn這些常用的庫都有,直接鏈接到它們的GitHub或者官網頁面。
再比如說可視化部分:

包括可以生成3D效果圖的physt:

做各種統計圖表的Yellowbrick:

這哪怕是做PPT,都非常有用啊!
資源列表大集結
另外,項目貢獻者還安利了幾個GitHub上不錯的資源列表:

大部分都是幾百幾千星的資源表,也有不少標星數萬的經典內容,比如awesome-machine-learning:

各種語言項目都有,是真的awesome。
常用代碼
***,還有一個部分是“經常Google的內容”。

可能對大家有用的代碼:

傳送門
***,送上資源傳送門:
https://github.com/r0f1/datascience