成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Pandas做數據可視化具體操作,快來看看吧

大數據 數據可視化
在本文我們可以學到用pandas做,導入數據、繪制最簡單的圖plot()、多個y的繪制圖、折線圖、條形圖、餅形圖和散點圖繪制、統計信息繪圖、箱型圖、軸坐標刻度、plot()更多精細化參數、可視化結果輸出保存等。

常見的數據可視化庫有:

  • matplotlib 是最常見的2維庫,可以算作可視化的必備技能庫,由于matplotlib是比較底層的庫,api很多,代碼學起來不太容易。
  • seaborn 是建構于matplotlib基礎上,能滿足絕大多數可視化需求。更特殊的需求還是需要學習matplotlib
  • pyecharts 上面的兩個庫都是靜態的可視化庫,而pyecharts有很好的web兼容性,可以做到可視化的動態效果。

但是在數據科學中,幾乎都離不開pandas數據分析庫,而pandas可以做

  • 數據采集 如何批量采集網頁表格數據?
  • 數據讀取 pd.read_csv/pd.read_excel
  • 數據清洗(預處理) 理解pandas中的apply和map的作用和異同
  • 可視化,兼容matplotlib語法(今天重點)

在本文我們可以學到用pandas做

  • 導入數據
  • 繪制最簡單的圖plot()
  • 多個y的繪制圖
  • 折線圖、條形圖、餅形圖和散點圖繪制
  • 統計信息繪圖
  • 箱型圖
  • 軸坐標刻度
  • plot()更多精細化參數
  • 可視化結果輸出保存

準備工作

如果你之前沒有學過pandas和matpltolib,我們先安裝好這幾個庫

  1. !pip3 install numpy!pip3 install pandas!pip3 install matplotlib 

已經安裝好,現在我們導入這幾個要用到的庫。使用的是倫敦天氣數據,一開始我們只有12個月的小數據作為例子

  1. #jupyter notebook中需要加這行代碼%matplotlib inlineimport  
  2. matplotlib.pyplot as pltimport numpy as npimport pandas as pd#讀取天 
  3. 氣數據df = pd.read_csv('data/london2018.csv')df  
pandas做數據可視化具體操作,快來看看吧

plot最簡單的圖

選擇Month作為橫坐標,Tmax作為縱坐標,繪圖。

大家注意下面兩種寫法

  1. #寫法1df.plot(x='Month', y='Tmax')plt.show()  
pandas做數據可視化具體操作,快來看看吧
  • 橫坐標軸參數x傳入的是df中的列名Month
  • 縱坐標軸參數y傳入的是df中的列名Tmax
  • 折線圖

上面的圖就是折線圖,折線圖語法有三種 

  1. df.plot(x='Month', y='Tmax' 
  2. df.plot(x='Month', y='Tmax', kind='line' 
  3. df.plot.line(x='Month', y='Tmax'
  1. df.plot.line(x='Month', y='Tmax')plt.show()  
pandas做數據可視化具體操作,快來看看吧

 

  1. #grid繪制格線df.plot(x='Month', y='Tmax', kind='line',  
  2. grid=True)plt.show()  
pandas做數據可視化具體操作,快來看看吧

多個y值

上面的折線圖中只有一條線, 如何將多個y繪制到一個圖中

比如Tmax, Tmin

  1. df.plot(x='Month', y=['Tmax''Tmin'])plt.show()  
pandas做數據可視化具體操作,快來看看吧

條形圖

  1. df.plot(x='Month',        y='Rain',        kind='bar')#同樣還可以這樣 
  2. 畫#df.plot.bar(x='Month', y='Rain')plt.show()  
pandas做數據可視化具體操作,快來看看吧

水平條形圖

bar環衛barh,就可以將條形圖變為水平條形圖

  1. df.plot(x='Month',        y='Rain',        kind='barh')#同樣還可以這 
  2. 樣畫#df.plot.bar(x='Month', y='Rain')plt.show()  
pandas做數據可視化具體操作,快來看看吧

多個變量的條形圖

  1. df.plot(kind='bar', x = 'Month', y=['Tmax''Tmin'])plt.show()  
pandas做數據可視化具體操作,快來看看吧

散點圖

  1. df.plot(kind='scatter', x = 'Month', y = 'Sun')plt.show()  
pandas做數據可視化具體操作,快來看看吧

餅形圖

  1. df.plot(kind='pie', y='Sun')plt.show()  
pandas做數據可視化具體操作,快來看看吧

上圖繪制有兩個小問題:

  1. legend圖例不應該顯示
  2. 月份的顯示用數字不太正規
  1. df.index =  
  2. ['Jan','Feb','Mar','Apr','May','Jun','Jul','Aug','Sep','Oct','Nov','D 
  3. ec']df.plot(kind='pie', y = 'Sun', legend=False)plt.show()  
pandas做數據可視化具體操作,快來看看吧

更多數據

一開頭的數據只有12條記錄(12個月)的數據,現在我們用更大的倫敦天氣數據

  1. import pandas as pddf2 = pd.read_csv('data/londonweather.csv')df2.head()  
pandas做數據可視化具體操作,快來看看吧

 

  1. df2.Rain.describe() 
  2.  
  3. count    748.000000mean      50.408957std       29.721493min     
  4.     0.30000025%       27.80000050%       46.10000075%        
  5. 68.800000max      174.800000Name: Rain, dtype: float64 

上面一共有748條記錄, 即62年的記錄。

箱型圖

  1. df2.plot.box(y='Rain')#df2.plot(y='Rain', kind='box')plt.show()  
pandas做數據可視化具體操作,快來看看吧

直方圖

  1. df2.plot(y='Rain', kind='hist')#df2.plot.hist(y='Rain')plt.show()  
pandas做數據可視化具體操作,快來看看吧

縱坐標的刻度可以通過bins設置

  1. df2.plot(y='Rain', kind='hist', bins=[0,25,50,75,100,125,150,175,  
  2. 200])#df2.plot.hist(y='Rain')plt.show()  
pandas做數據可視化具體操作,快來看看吧

多圖并存

  1. df.plot(kind='line',         y=['Tmax''Tmin''Rain''Sun'], #4個 
  2. 變量可視化         subplots=True,   #多子圖并存         layout=(2,  
  3. 2),   #子圖排列2行2列         figsize=(20, 10)) #圖布的尺寸plt.show()  
pandas做數據可視化具體操作,快來看看吧

 

  1. df.plot(kind='bar',         y=['Tmax''Tmin''Rain''Sun'], #4個變 
  2. 量可視化         subplots=True,   #多子圖并存         layout=(2, 2), 
  3.    #子圖排列2行2列         figsize=(20, 10)) #圖布的尺寸plt.show()  
pandas做數據可視化具體操作,快來看看吧

加標題

給可視化起個標題

  1. df.plot(kind='bar',         y=['Tmax''Tmin'], #2個變量可視化     
  2.      subplots=True,   #多子圖并存         layout=(1, 2),   #子圖排列1 
  3. 行2列         figsize=(20, 5),#圖布的尺寸         title='The Weather  
  4. of London')  #標題plt.show()  
pandas做數據可視化具體操作,快來看看吧

保存結果

可視化的結果可以存儲為圖片文件

  1. df.plot(kind='pie', y='Rain', legend=False, figsize=(10, 5), title='Pie of Weather in London')plt.savefig('img/pie.png')plt.show()  
pandas做數據可視化具體操作,快來看看吧

df.plot更多參數

df.plot(x, y, kind, figsize, title, grid, legend, style)

  • x 只有dataframe對象時,x可用。橫坐標
  • y 同上,縱坐標變量
  • kind 可視化圖的種類,如line,hist, bar, barh, pie, kde, scatter
  • figsize 畫布尺寸
  • title 標題
  • grid 是否顯示格子線條
  • legend 是否顯示圖例
  • style 圖的風格
  • 查看plot參數可以使用help
  1. import pandas as pdhelp(pd.DataFrame.plot)  
pandas做數據可視化具體操作,快來看看吧

 

 

責任編輯:未麗燕 來源: 今日頭條
相關推薦

2018-03-12 10:35:01

LinuxBash快捷鍵

2021-04-19 09:23:26

數字化

2017-11-24 08:00:55

前端JSCSS

2025-01-13 00:00:05

2025-01-13 07:10:00

前端開發

2020-11-04 08:40:23

C++多元組Tuple

2018-03-06 09:54:48

數據庫備份恢復

2020-09-27 11:15:37

可視化PandasPython

2018-01-19 10:37:00

2020-03-11 14:39:26

數據可視化地圖可視化地理信息

2024-06-03 00:00:06

高性能數據傳輸應用程序

2011-03-17 09:06:58

iptables映射端口

2020-04-16 09:35:53

數據科學機器學習數據分析

2018-04-18 17:08:45

2023-02-15 08:24:12

數據分析數據可視化

2009-12-30 15:47:40

Silverlight

2018-01-30 17:54:37

數據庫MySQLSQL Server

2018-05-02 15:41:27

JavaScript人臉檢測圖像識別

2017-10-14 13:54:26

數據可視化數據信息可視化

2009-12-31 15:36:13

SilverLight
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 综合久久久 | 日韩国产精品一区二区三区 | 日韩三级在线 | 欧美性猛交一区二区三区精品 | 91社区在线高清 | 成人在线视频网址 | 人人做人人澡人人爽欧美 | 中文字幕日本一区二区 | www.com久久久| 亚洲日韩中文字幕一区 | 四虎永久在线精品免费一区二 | 国产在线精品一区二区三区 | 欧美高清视频一区 | 久久久久久高潮国产精品视 | 国产精品毛片一区二区三区 | 国产精品一区在线观看 | 中文字幕精品一区 | 日韩在线小视频 | 毛片a区| 久久久夜夜夜 | 日本欧美大片 | 精品欧美一区二区精品久久久 | 国产成人精品久久二区二区 | 成人免费视频一区 | 中文在线一区二区 | 亚洲精品视频免费观看 | 午夜电影网 | 久久国产精品91 | 热99| 69av在线视频| 成人免费在线观看 | 亚洲免费网 | 精品欧美黑人一区二区三区 | 欧美一极视频 | 一区二区三区国产精品 | 久色 | 91欧美 | 国产精品日韩一区二区 | 久久久久久免费精品一区二区三区 | 99福利在线观看 | 午夜精品久久久久久久久久久久久 |