使用這些 Python 工具可視化地探索數據
開源工具在推動技術進步和使其更加普及方面發揮了重要作用。數據分析也不例外。隨著數據變得越來越豐富和復雜,數據科學家 始終在尋找簡化工作流程并創建交互式和吸引人的可視化的方式。PyGWalker 就是為解決此類問題而設計的。
PyGWalker(Graphic Walker 的 Python 綁定)將 Python Jupyter Notebook 的工作環境連接到 Graphic Walker,以創建開源數據可視化工具。你可以通過簡單的拖放操作將 Pandas 數據幀 轉化為精美的數據可視化。
Exploring data through a visual interface with Pygwalker
開始使用 PyGWalker
使用 pip
安裝 PyGWalker:
$ python3 -m pip install pygwalker
導入 pygwalker
和 pandas
以在項目中使用它:
import pandas as pd
import pygwalker as pyg
將數據加載到 Pandas 數據報中并調用 PyGWalker:
df = pd.read_csv('./bike_sharing_dc.csv', parse_dates=['date'])
gwalker = pyg.walk(df)
你現在有一個圖形用戶界面來探索和可視化你的 Pandas 數據幀!
使用 Graphic Walker 探索數據
Graphic Walker 的主要功能之一是能夠更改標記類型以創建不同類型的圖表。例如,通過將標記類型更改為折線來創建折線圖。
Line charts generated by Pygwalker
你還可以通過創建 concat 視圖來比較不同的度量,該視圖將多個度量添加到行和列中。
Comparing data in the Graphic Walker interface.
將維度放入行或列中,以創建一個 facet 視圖,這個視圖包含多個子視圖,這些子視圖由一個維度中的值分隔開。
The facets view in Graphic Walker.
在 數據Data
Table data in Graphic Walker.
使用 PyGWalker 進行數據探索
你可以使用 PyGWalker 將 Pandas 數據轉換為高度可定制的圖形圖表。你也可以使用 PyGWalker 作為探索數據的強大工具,以發現潛在的模式、趨勢和洞察力。
數據探索選項可以在“探索模式Exploration Mode”選項(工具欄中)中找到。它們可以設置為點模式或刷模式。
- 點模式:通過將你的鼠標光標指向數據的一個特定部分來探索數據。
- 刷模式:通過在數據范圍周圍畫一個選擇框來探索數據,然后拖動選擇框來查看生成的報告。
試試看你的數據
你可以在這些云演示中試用 PyGWalker:Google Colab、Binder 或 Graphic Walker Online Demo。
PyGWalker 是一個用于簡化數據分析和可視化工作流程的優秀工具,特別是對于那些想要使用 Pandas 進行界面可視化的人。借助 PyGWalker 和 Graphic Walker,數據科學家可以在 Jupyter Notebook 中通過簡單的拖放操作輕松創建令人驚嘆的可視化效果。請查看 PyGWalker Git 倉庫獲取源代碼。
對于尋求自動化數據探索和高級增強分析的開源解決方案的數據科學家,該項目還適用于 RATH,這是一種開源自動 EDA、人工智能支持的數據探索和可視化工具。你還可以查看 RATH Git 倉庫 獲取源代碼和活躍的社區。
(題圖:MJ/21c21716-b900-4466-98a9-51268960c9b8)