這份有原理、有代碼、有Demo的算法資源火了!GitHub上超過2900星
最近,有一份很全面的算法資源在GitHub上火了,不僅有相應的原理介紹和實現代碼,還提供了Demo,目前GitHub上標星已經突破2900星。
這份資源中,一共有5個算法,分別是:線性回歸、邏輯回歸、K均值算法、基于高斯分布的異常檢測、多層感知器(MLP)。
每一個算法,都會有數學原理解釋、Python實現的示例和交互式的Jupyter Notebook Demo。大多數情況下,這些算法的解釋,都是基于吳恩達的機器學習課程。
基于這些資源,你可以進行相應的數據訓練、算法配置,并立即在瀏覽器中查看結果、圖表和預測。
資源里都有什么?
5個算法, 一共分為了監督學習、無監督學習和神經網絡3個類別。每個大的類別,都有相應的介紹,并給出了相應的應用范圍。然后就是相應算法的資源。
以神經網絡為例,這個類別之下的算法是多層感知器,一共有4個資源。
***個資源是文檔,介紹了神經網絡和多層感知器背后的原理與實現邏輯,并提供了相應的參考資料,可以進一步學習。
第二個資源是代碼,呈現了如何用Python實現多層感知器。基本上每一塊代碼前,都有相應的注釋,標明了代碼的功能和注意事項。
后兩個資源是基于Jupyter Notebook的Demo,用算法和數據集訓練模型,來進一步的熟悉多層感知器算法的運用。
一個使用MNIST數據集訓練一個識別手寫數字(0-9)的分類器。另一個使用是Fashion-MNIST數據集,訓練一個衣服分類器。
需要什么先決條件?
資源的上手門檻不高,最基本的要求就是安裝Python。因為項目中的所有Demo都可以在瀏覽器中運行,所以不需要在本地安裝Jupyter。
所有用于Jupyter Notebook的數據集都可以在data文件夾中找到。
誰干的好事?
制作這份資源的,是一位名叫Oleksii Trekhleb的烏克蘭工程師,目前正在一家軟件技術咨詢公司EPAM Systems擔任***軟件工程師。
他說,建立這個存儲庫的目的,不是通過使用第三方庫的“一行程序”來實現機器學習算法,而是從頭開始實踐這些算法,從而讓大家能夠更好地理解每個算法背后的原理。
傳送門
https://github.com/trekhleb/homemade-machine-learning