【干貨】Pycon 2017: Python可視化庫大全
本文主要摘錄自 pycon 2017大會的一個演講,同時結合自己的一些理解。
pycon 2017的相關演講主題是“The Python Visualization Landscape”。
先來一張全景圖鎮樓~~
看完這張圖是不是有點懵?
別著急,我們一起來看看后面的闡述。
python可視化庫可以大致分為幾類:
- 基于matplotlib的可視化庫
- 基于JS的可視化庫
- 基于上述兩者或其他組合功能的庫
基于matplotlib的可視化庫
matplotlib是python可視化庫的基礎。matplotlib庫的設計參考了matlab,甚至連名稱也是以“mat”開頭。
matplotlib庫的一些優勢:(翻譯比較別扭,英文原文也附后)
- 設計很像Matlab,容易進行轉換(Designed like Matlab: switching was easy)
- 有很多渲染后端(Many rendering backends)
- 差不多可以繪制任何圖(當然需要花費些努力)(Can reproduce just about any plot with a bit of effort)
- 有長時間良好運行的歷史 (Well-tested, standard tool for over a decade)
matplotlib庫的一些缺點:
- 必須要掌握API,且描述較為冗長(API is imperative & often overly berbose)
- 有時候默認的樣式設計比較弱(Sometimes poor stylistic defaults)
- 對網頁以及交互式繪圖的支持較弱(Poor support for web/interactive graphs)
- 數據量大時經常運行較慢(Often slow for large & complicated data)
Matplotlib自2003年發布以來,使用情況還是呈現了良好的趨勢:
Matplotlib部分繪圖實例如下:
也因此,后續開發者都吸取了matplotlib庫的優點,經過對matplotlib庫的缺點進行改進,從而衍生出一系列的可視化庫。
基于matplotlib的庫概覽如下:
下面介紹兩個重要的基于matplotlib的第三方庫:pandas以及seaborn
Pandas
可能我們平時使用pandas時更多的是用來進行數據分析和處理,其實pandas也提供了較為簡單的API來進行圖形繪制。
我個人一般是用pandas來處理數據,然后結合其他可視化庫(如matplotlib,seaborn,bokeh等)來繪圖圖形。
Pandas部分繪圖實例如下:
seaborn
Seaborn是基于matplotlib的Python可視化庫。它提供了一個高級別接口用于圖形繪制。
Seaborn在matplotlib的基礎上進行了更高級的API封裝,從而使得作圖更加容易,在大多數情況下使用seaborn就能做出很具有吸引力的圖。
Seaborn部分繪圖實例如下:
詳細信息可在其官方網站查閱:
http://seaborn.pydata.org/
基于JavaScript的可視化庫
兩個受歡迎度較高的可視化庫 bokeh 和 plotly
bokeh
Bokeh (Bokeh.js) 是一個 Python 交互式可視化庫,支持現代化Web瀏覽器,提供非常***的展示功能。Bokeh 的目標是使用 D3.js樣式提供優雅,簡潔新穎的圖形化風格,同時提供大型數據集的高性能交互功能。Boken 可以快速的創建交互式的繪圖,儀表盤和數據應用。
bokeh部分繪圖實例如下:
詳細信息可在其官方網站查閱:
http://bokeh.pydata.org
plotly
Plotly是另一個免費進行數據分析和繪制圖表的APP,建立在d3.js上。 Plotly圖可下載為SVG,EPS或PNG格式,并簡單地導入到Illustrator或者Photoshop中。
跟bokeh類似,也可以制作一些交互式的web圖。
plotly部分繪圖實例如下:
詳細內容可以去官網參考:
https://plot.ly/python/
其他綜合類型庫
Holoviews
Holoviews能夠讓用戶構建有助于可視化的數據結構,而且它包含豐富的可組合元素庫,可以覆蓋、嵌套和輕松定位。同時,它還支持快速數據探索。
Holoviews可以和Seaborn、pandas或者bokeh組合使用。
由于筆者還沒具體了解過Holoviews的使用功能,這里將英文的描述直接放在下面,以免個人理解不準確而產生誤導。
關于Holoviews的效果圖,可參考下面動態圖,建議觀看原視頻,效果會好點。
Altair
Altairs起源于D3,但代碼編寫量要比D3簡單。這里有兩幅對比的圖如下:
用D3繪制的柱狀圖
用Altairs繪制的柱狀圖
Altair 是 Python 高級聲明式可視化庫。Altair 提供一個 Python API 在聲明式 manner 中構建靜態統計可視化庫。
什么是聲明式可視化庫呢,不管是翻譯成中文的名稱還是看英文的名稱,我都一臉懵圈。幸好,有英文的進一步描述,如下:
總的來說,Altairs讓開發者們更專注于數據及他們之間的關系,而不是一些不重要的細節。
***,再放上這張Python可視化的全景圖,對于個人而言,不一定能全部熟悉使用,但是能熟練用好其中的一部分,實際應用于工作及項目中,也就OK了。