5個神話般的Python數據科學軟件包
您知道這些軟件包嗎?

因此,我們都可能知道動態的Data-Science三重奏,Numpy,Pandas和Matplotlib。

您可能熟悉這些軟件包及其工作方式。 當然,您可能還會喜歡使用其他一些很酷的軟件包,例如Plotly,Seaborne,Scikit-Learn,Tensorflow和Pytorch。 即使這些都是奇妙的軟件包,也有數百萬個用于Pythonic機器學習的軟件包,其中有些未被充分理解,而其中某些卻是完全未知的!
№1:Gleam
您聽說過Plotly,聽說過Matplotlib,也許還聽過Seaborn,但您可能沒有聽說過Gleam。 Gleam是用于創建帶有頁面,面板和按鈕的交互式可視化效果的出色工具。 這些交互式Web可視化也完全與Web集成在一起,這意味著您可以將它們放入從網站到端點的任何內容中! Gleam使用wtforms進行交互,并且可以使用任何范圍的不同可視化工具來實際顯示數據。

如果您想要一個很酷的交互式窗格,基本上可以使用任何圖形庫,那么Gleam是適合您的模塊!
№2:Table
好吧,我知道你在想什么,
"為什么不只使用Pandas?"
這當然是一個可行的論點。 Table包使該清單成為Pandas的輕巧替代品。 與使用Pandas.py相比,使用Table.py讀取海量數據集要容易得多,這實際上是使其成為該列表的唯一原因。 總的來說,我會說在某些情況下這可能是工作的包,但在大多數情況下,我只會堅持
import pandas as pd
№3:Shogun
> (src = https://www.shogun-toolbox.org/)
Shogun是用C ++編寫的機器學習庫,它也恰好具有Python端口。 Shogun的一大優點是,它可以在多種不同的編程語言中使用,并且在這方面相對統一。 如果您要使用Python學習Shogun,則可以利用該知識并將其應用于它支持的任何其他語言,這真是太神奇了!
Shogun擁有廣泛的前沿機器學習算法,這無疑是任何科學家都可以欣賞的。 當然,它也是開源的,并且根據GNU通用許可發布,這總是一個加分!
№4:OpenCV
OpenCV是另一個很棒的機器學習程序包,實際上是最初由Intel開發的。 盡管有專有的根源,但是OpenCV是開源的,并根據FreeBSD許可許可證發布。 OpenCV真正很棒的一件事是它專注于實時計算機視覺。 與Shogun一樣,OpenCV最初是用C ++編寫的,但是具有Python和其他語言的接口。
№5:Mlpy
> (src = http://mlpy.sourceforge.net/)
Mlpy為有監督和無監督學習提供了廣泛的最新機器學習方法。 與同行不同的是,它旨在為數據科學提供一種多合一的方法。 盡管此時它有點過時,但無疑是Pythonic機器學習引起的巨大包裝爆炸的一個很好的起步器。 盡管年代久遠,但我認為仍然值得一試。 這是由于其易用性,有趣的算法以及包容性。
Mlpy試圖創建一種在重現性,調制和效率之間取得平衡的包裝。 我認為此軟件包之所以成功,是因為盡管許多對口產品的更新頻率更高,當然也包括行業標準,但許多此類想法似乎在翻譯中卻以一種或另一種方式丟失了。 這是有道理的,因為這些都是由大量開發人員用C編寫的龐大程序包,但是,我想說這可能是使用它們的不利方面。
結論
這樣就可以了,我認為有五個軟件包是無法識別的,它們所取得的成就也沒有得到什么好評。 盡管這些軟件包確實很酷,但我可以肯定,您可以將數百個甚至不是數千個其他很酷的模塊添加到您的Pip環境中,這些模塊也很棒而且聞所未聞!
Python有一個壓倒性的生態系統和許多可挖掘的軟件包,而這正是使其變得如此強大的部分原因! 不斷學習如何使用新模塊將使您的知識庫不斷擴展,并使您的程序員頭腦活躍!