使用PyGWalker可視化分析表格型數據
簡介
想象一下,在Jupyter Notebook中擁有大量數據,想要對其進行分析和可視化。PyGWalker就像一個神奇的工具,能讓這項工作變得超級簡單。它能獲取用戶的數據,并將其轉化為一種特殊的表格,可以與之交互,就像使用Tableau一樣。可以直觀地探索數據,玩轉數據,查看模式和洞察力,而不會迷失在復雜的代碼中。PyGWalker簡化了一切,讓用戶可以毫不費力地快速分析和理解數據。PyGWalker由Kanaries開發。
【官方GitHub代碼庫】:
https://github.com/Kanaries/pygwalker
【代碼】:
Google Colab(https://colab.research.google.com/drive/171QUQeq-uTLgSj1u-P9DQig7Md1kpXQ2?usp=sharing)
Kaggle Notebook(https://www.kaggle.com/code/asmdef/pygwalker-test/notebook)
【開發者簡介】:
https://github.com/ObservedObserver
具體探索
通過pip安裝PyGWalker庫。
!pip install pygwalker -q
要開始在Jupyter Notebook中使用PyGWalker,需要導入兩個基本庫:pandas和pygwalker。
import pandas as pd
import pygwalker as pyg
import pandas as pd這一行允許你處理表格格式的數據,而import pygwalker as pyg則引入了PyGWalker庫。
導入后,你就可以將PyGWalker無縫地集成到現有工作流程中。
例如,你可以使用pandas加載數據。
df = pd.read_csv('my_data.csv')
然后,你可以創建一個PyGWalker實例,命名為“gwalker”,將數據幀作為參數傳遞,如下所示:
gwalker = pyg.walk(df)
執行提供的命令后,代碼單元格下方會出現一個新的輸出。該輸出將包含一個交互式用戶界面。
圖片
該界面提供了各種拖放功能,可用于分析和探索數據。它提供了一種與數據交互的便捷互動方式,讓你能夠執行可視化數據、探索關系等任務。
有了PyGWalker,你現在就擁有了一個類似于Tableau的用戶界面,可以對數據進行分析和可視化。
圖片
PyGWalker提供了改變標記類型的靈活性,使你能夠創建不同的圖表。例如,你可以通過選擇所需的變量和線條標記類型,輕松切換到折線圖。
圖片
你還可以通過創建拼接視圖來比較不同的測量值。通過將多個測量值添加到行或列,可以輕松地對它們進行并排分析和比較。
圖片
你可以根據特定類別或特征將數據整理成不同的部分。這有助于對數據的不同子集進行單獨分析和比較。
圖片
PyGWalker允許你以表格格式查看數據,并自定義分析類型和語義類型。你可以輕松地以結構化的方式將數據可視化,并根據具體需求調整數據分析和解釋的方式。
圖片
你還可以將數據探索結果保存到本地文件中。
總結
PyGWalker是一個提供多種功能的通用庫。探索這個強大的工具可以提高你在數據分析和可視化方面的技能。