良心整理15個超級Python庫,不要錯過
Python 是很流行和使用比較廣泛的編程語言之一,它已經(jīng)超越了業(yè)界許多編程語言,名列前茅。它在開發(fā)人員中流行的原因有很多,最重要的一點就是它有大量的庫供用戶使用。Python 的易用性、靈活性吸引了許多開發(fā)人員為機器學(xué)習(xí)創(chuàng)建新的庫。有一個庫大家必都會介紹,就是TensorFlow,這里就不多說了。那么,以下就是今日份干貨,大家有什么自己最喜歡的庫也可以在評論中留言分享~

1.Keras
Keras是由python編寫的機器學(xué)習(xí)API,其運行在機器學(xué)習(xí)的優(yōu)秀平臺TensorFlow上。好處在于可以很快地實現(xiàn)網(wǎng)絡(luò)模型的搭建,數(shù)據(jù)輸入輸出也很方便,讓你可以專注于網(wǎng)絡(luò)模型本身,適合新手。比較大的缺點就是慢!作為高層API,推理速度等等肯定沒tf,mxnet那些快。
2. PyTorch
它的特點:處理N維度張量,和numpy類似,但是可以在GPU上運行。支持自動微分來構(gòu)建和訓(xùn)練大型的神經(jīng)網(wǎng)絡(luò)。
3. fastai
用過的都說好,通過利用當(dāng)下優(yōu)秀的技術(shù)實踐,fastai極快地簡化了訓(xùn)練過程也加速了神經(jīng)網(wǎng)絡(luò)。只要一個API就包含了幾乎所有常見的深度學(xué)習(xí)應(yīng)用。
4. JAX
Jax 是 Autograd 和 XLA 的結(jié)合用來提供高性能機器學(xué)習(xí)研究。作為 Autograd 的更新版本,JAX 可以自動微分原生 Python 和 Numpy 函數(shù)。可通過 loops、branches、recursion 和 closures,進(jìn)行微分,并且能夠?qū)?dǎo)數(shù)的導(dǎo)數(shù)求導(dǎo)。支持反向模式微分通過 grad。
5. FastText
它是一個可以讓你高效學(xué)習(xí)單詞表意和句子分類的庫。
6. spaCy
spaCy v3.0具有所有新的基于transformer的管道,讓spaCy的準(zhǔn)確率達(dá)到SOTA。你可以使用任意預(yù)訓(xùn)練transformer來訓(xùn)練你自己的管道,也可以在多組件和多任務(wù)之間共享transformer。spaCy的transformer支持與PyTorch和HuggingFace transformers庫的集成,在管道中可以訪問許多預(yù)訓(xùn)練模型。
7. gensim
它通過使用大型語料庫進(jìn)行主題建模、文檔索引和相似性檢索。目標(biāo)受眾是自然語言處理(NLP)和信息檢索(IR)社區(qū)。
8. NLTK
它是自然語言工具箱,是一整套針對自然語言處理研究和開發(fā)的開源Python模塊、數(shù)據(jù)集和教程。
9. TextBlob
簡單,Python風(fēng)格,是一個用于處理文本數(shù)據(jù)的庫。它為潛入常見的自然語言處理(NLP)任務(wù)提供了一個簡單的API,例如詞性標(biāo)注,名詞短語提取,情感分析,分類,翻譯等。
10. Pillow
它是個對用戶十分友好的PIL分支。PIL是Python圖像庫。
11. OpenCV
開源計算機視覺庫。
12.LightGBM
它可以幫助開發(fā)人員使用重新定義的基本模型,即決策樹來構(gòu)建新的算法。LightGBM 的特點:計算速度快、生產(chǎn)效率高、直觀、易于使用。這個庫提供了高度可擴展、優(yōu)化和快速的梯度增強實現(xiàn),這使它在機器學(xué)習(xí)開發(fā)者中很流行。
13.Pandas
Pandas是Python中的一個機器學(xué)習(xí)庫,它提供高級的數(shù)據(jù)結(jié)構(gòu)和各種各樣的分析工具。主要是能夠使用一個或兩個命令轉(zhuǎn)換復(fù)雜的數(shù)據(jù)操作。它還有許多內(nèi)置的分組、數(shù)據(jù)組合、過濾和時間序列功能的函數(shù)。當(dāng)和其他庫一起使用時,Pandas保證了高性能和良好的靈活性。
14..Numpy
數(shù)組接口是 Numpy 的最佳特性。它非常容易理解和使用,讓復(fù)雜的數(shù)學(xué)實現(xiàn)變得非常簡單。廣泛使用,因此有很多開源貢獻(xiàn)者。該接口可用于將圖像、聲音和其他二進(jìn)制原始流表示為 n 維實數(shù)數(shù)組。
15.Click
Click的開發(fā)初衷就是使用最少的代碼,以一種可組合的方式創(chuàng)建漂亮的命令行接口。它的目的是使編寫命令行工具的過程快速而有趣,同時防止由于無法實現(xiàn)預(yù)期的CLI API而導(dǎo)致的任何問題。主要有三個特點:命令的任意嵌套、自動幫助頁面生成、支持在運行時延遲加載子命令。