面向Python語言的三大頂級機(jī)器學(xué)習(xí)庫
譯文【51CTO.com快譯】事實證明,無需掌握艱深的數(shù)據(jù)科學(xué),我們同樣能夠在機(jī)器學(xué)習(xí)的世界中徜徉。當(dāng)然,這段旅程不可避免地需要借助各類大數(shù)據(jù)、人工智能、深度學(xué)習(xí)與規(guī)模化統(tǒng)計與分析工具的幫助。
在今天的文章中,我們將共同了解三款***人氣的Python機(jī)器學(xué)習(xí)庫,相信能夠幫助大家?guī)砀鼮轫樌臄?shù)據(jù)科學(xué)探索體驗。
1.Theano
約十年前誕生的機(jī)器學(xué)習(xí)方案Theano,是目前機(jī)器學(xué)習(xí)領(lǐng)域使用范圍最廣的CPU與GPU數(shù)學(xué)編譯器之一。
在《Theano:用于快速實現(xiàn)數(shù)學(xué)表達(dá)計算的Python框架》這篇論文當(dāng)中,作者對這套庫進(jìn)行了全面的概述。“Theano包含多款軟件包,用以強(qiáng)化自身功能。能提供高水平用戶界面,足以處理多種特定目標(biāo),”論文解釋稱:“其中的Lasagne與Keras能夠有效簡化深度學(xué)習(xí)模型以及作為數(shù)學(xué)表達(dá)式的訓(xùn)練算法的架構(gòu)表達(dá)。事實上,概率編程框架PyMC3就在利用Theano以自動生成表達(dá)式并快速執(zhí)行所生成的C代碼。(Keras與Lasagne同時運(yùn)行在TensorFLow與Theano之上。)。”
Theano目前在GitHub上擁有超過2萬5千項提交成果以及近300名貢獻(xiàn)者,fork次數(shù)將接近2千次。
2.TensorFlow
TensorFlow是一套利用數(shù)據(jù)流圖形進(jìn)行數(shù)值計算的開源庫。盡管只是開源領(lǐng)域的一名新兵,但這一由谷歌公司牽頭的項目已經(jīng)擁有近1萬5千條提交成果以及超過600名GitHub貢獻(xiàn)者,模型庫的星評更是逼近1萬2千顆。
在***份《開源年鑒》當(dāng)中,TensorFlow被選為2016年最值得fork項目。而在***的《開源年鑒》內(nèi),TensorFlow同樣多次亮相。基于TensorFlow的Magenta項目甚至在嘗試將機(jī)器智能同藝術(shù)領(lǐng)域加以聯(lián)系,探索如何利用它來實現(xiàn)音樂與藝術(shù)創(chuàng)作,并由此建立起以藝術(shù)家、程序員以及機(jī)器學(xué)習(xí)研究者的混合型社區(qū)。另外,Tensorflow支持多種前端語言,但對Python的支持是***的,Python還被列入2017年熱門編程趨勢排行。
TensorFlow 1.0于今年2月中旬推出。谷歌在其開發(fā)者博客中寫道:“盡管剛剛誕生一年,但TensorFlow已經(jīng)切實幫助研究人員、工程師、藝術(shù)家、學(xué)生以及其他各類用戶完成各類工作,它范疇涵蓋語言翻譯、皮膚癌早期診斷乃至糖尿病患者并發(fā)性失明預(yù)防等領(lǐng)域等”。
3.scikit-learn
這套方案立足于NumPy、SciPy以及Matplotlib,并被Spotfiy公司的工程師們用于進(jìn)行音樂推薦。而在OkCupid公司,是負(fù)責(zé)對匹配系統(tǒng)進(jìn)行評估與改進(jìn)。在Birchbox公司,工作人員正在摸索如何利用scikit-learn支持新產(chǎn)品的開發(fā)。
Scikit-learn目前在GitHub上擁有近2萬2千條提交成果與800名貢獻(xiàn)者。
【51CTO譯稿,合作站點轉(zhuǎn)載請注明原文譯者和出處為51CTO.com】