成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

使用 Plotly 創建 60+ 令人驚嘆的交互式圖表、地圖

大數據 數據可視化
在本文中,我們展示了如何在交互式數據可視化中使用整體部分講故事技術。我們使用數據科學家感興趣的 22 個公共領域數據集討論了大量代碼片段、圖形用戶界面和 EDA 示例。

在這篇文章中,云朵君演示如何利用我最喜歡的數據可視化庫 -- Plotly 的強大功能,用我們都喜歡的 Python 繪制出論文級質量的圖表、地圖和動畫。

Plotly 可以輕松創建交互式工具提示,傳達有關鼠標懸停的數據點的額外信息。

為什么選擇 Plotly

說到 Python 中的數據可視化,人們經常會想到三個名字: Matplotlib、Seaborn 和 Plotly。

Plotly 是一個功能強大、用途廣泛的 Python 庫,提供多種圖表類型,從基本的線圖和散點圖到復雜的三維可視化和地理地圖。Plotly 還提供了直觀、友好的用戶界面,因此深受數據科學家和分析師的歡迎。

Plotly 提供多種圖表,從統計或科學圖表到金融或地理圖表。這些圖表可以使用各種方法顯示,包括 Jupyter 筆記本、HTML 和 Dash 網絡應用程序。

Plotly 以其交互性而聞名。與主要生成靜態圖表的 Matplotlib 和 Seaborn 不同,Plotly 生成的交互式圖表允許用戶縮放、平移和懸停以獲取更多細節。這一功能對于 EDA 來說非常有用。

你準備好提升自己的 Plotly 數據可視化技能了嗎?

公共數據集

  • timesData.csv [1]2015-2016年世界大學排名[2]
  • gapminder_data_graphs.csv[3] / gapminder.csv (參見 px.data.gapminder() )該數據集是使用來自[4]Gapminder 網站[5]的數據生成的,該網站專注于收集和分享有關地方、國家和全球層面的社會、經濟和環境發展的統計數據和其他信息。
  • 1950–2018 年預期壽命與 GDP.csv[6]
  • honeyproduction.csv[7]蜂蜜產量
  • WHR2023.csv 2023年世界幸福報告[8]
  • Pokemon.csv[9]完整的寶可夢數據集[10]。該數據集包含所有七代寶可夢的 802 只寶可夢的信息。數據集中包含的信息包括基礎屬性、與其他類型的寶可夢的對抗表現、身高、體重、分類、蛋的步數、經驗值、能力等。這些信息是從http://serebii.net/抓取的。[11]
  • StudentsPerformance.csv[12]該數據集包含學生在各個科目中獲得的分數。
  • px.data.stocks() 內置規范化股票數據(GOOG、AMZN 等)
  • px.data.iris() 內置鳶尾花數據集[13][16]
  • px.data.tips() 內置Tips 數據集[14]
  • px.data.wind() 內置風數據集
  • px.data.carshare() 內置汽車共享數據集
  • 波士頓犯罪記錄[15]:犯罪時間、地點及描述。數據由 Analyze Boston 提供。
  • weatherAUS.csv[16]該數據集包含來自澳大利亞眾多氣象站的約 10 年每日天氣觀測數據
  • us_covid19_daily.csv[17]美國新冠肺炎疫情日報
  • 使用“heart.csv”數據集探索心臟數據[18]
  • sklearn.datasets.make_classification[19]這會首先創建呈正態分布(std=1)的點簇,并為每個類分配相同數量的簇。它引入了這些特征之間的相互依賴性,并向數據中添加了各種類型的噪聲。
  • winemag-data-130k-v2.csv[20] 130k 條葡萄酒評論,包括品種、地點、酒莊、價格和描述。
  • Consumer_Complaints.csv[21]該數據集包括消費者對金融產品的投訴。
  • kc_house_data.csv[22]該數據集包含美國華盛頓州金縣(King County)的房價數據,該數據也涵蓋西雅圖。該數據集來自 Kaggle 。
  • 2011_us_ag_exports.csv[23] 2011 年美國農業出口。
  • mt_bruno_elevation.csv[24] 圣布魯諾山海拔。

Plotly基本應用

  • Plotly[25]可以使用pip[26]安裝
!pip install plotly==5.24.1
!pip install dash
!pip install folium
  • 在整個研究過程中導入必要的 Python 庫
import numpy as np # linear algebra
import pandas as pd # data processing, CSV file I/O (e.g. pd.read_csv)

# plotly
# import plotly.plotly as py
from plotly.offline import init_notebook_mode, iplot, plot
import plotly as py


import plotly.graph_objects as go
import plotly.express as px

from dash import Dash, dcc, html, Input, Output

import folium 
from folium import plugins

Line Plot

  • 使用內置數據集px.data.gapminder()[27]和 go.Scatter() 創建包含 2 個數據框的線圖。

人均GDP與預期壽命:瑞典與日本人均GDP與預期壽命:瑞典與日本

  • 調用 px.line() 為上述數據集繪制 折線圖[28]

德國的預期壽命德國的預期壽命

大洋洲的預期壽命大洋洲的預期壽命

  • 使用相同的數據集創建 Dash App[29]

各大洲各國預期壽命進展各大洲各國預期壽命進展

  • 我們還可以使用px.line 繪制標準化股票數據

AMZN股票數據AMZN股票數據

  • 使用 2 個數據創建另一個自定義線圖

引用量和教學與世界百強大學排名對比引用量和教學與世界百強大學排名對比

散點圖

  • 使用鳶尾花數據集和 px.scatter() 來演示 散點圖[30]

散點圖:萼片寬度與萼片長度(鳶尾花數據集)散點圖:萼片寬度與萼片長度(鳶尾花數據集)

  • 我們可以使用 px.scatter() 來可視化多個數據框

2014、2015 和 2016 年世界百強大學引文與排名對比2014、2015 和 2016 年世界百強大學引文與排名對比

散點圖矩陣

  • 導入 plotly.figure_factory 來創建結合箱線圖(如下所述)和散點圖的散點圖矩陣。

散點圖矩陣散點圖矩陣

氣泡圖

  • 使用鳶尾花數據集和 px.scatter() 來演示氣泡圖

氣泡圖:萼片寬度與萼片長度(鳶尾花數據集)氣泡圖:萼片寬度與萼片長度(鳶尾花數據集)

  • 使用教學色階和研究規模參數創建“引用量 vs 世界排名”氣泡圖

引用量與世界排名 教學色標 研究規模引用量與世界排名 教學色標 研究規模

  • 可以使用 px.scatter() 創建動畫氣泡圖。

示例 1:讀取數據集 Life Expectancy vs GDP 1950–2018.csv 并調整數據框

  • 創建以下動畫

動畫氣泡圖:人均GDP與預期壽命動畫氣泡圖:人均GDP與預期壽命

示例 2:讀取蜂蜜產量數據集并創建第二個動畫氣泡圖

動畫氣泡圖:蜂蜜生產動畫氣泡圖:蜂蜜生產

直方圖

  • 讀取數據集timesData.csv[31]來繪制以下直方圖

直方圖:2011 年和 2015 年師生比例直方圖:2011 年和 2015 年師生比例

分布圖

  • 這是在 Plotly 中創建分布圖[32]

分布圖分布圖

樹形圖

  • 讀取波士頓犯罪數據集并繪制以下樹狀圖

波士頓主要犯罪事件樹狀圖波士頓主要犯罪事件樹狀圖

子彈圖

  • 方法plotly.figure_factory.create_bullet可用于創建子彈圖,如下所示:

簡單子彈圖簡單子彈圖

面積圖

  • 下面的鳶尾花數據示例展示了填充面積圖

鳶尾花數據填充面積圖示例鳶尾花數據填充面積圖示例

條形圖

  • 繪制波士頓十大重大犯罪的條形圖很有指導意義

波士頓十大重大犯罪事件的條形圖波士頓十大重大犯罪事件的條形圖

餅圖

  • 使用波士頓犯罪數據集創建以下基本餅圖

波士頓犯罪數據集:每年的犯罪數量波士頓犯罪數據集:每年的犯罪數量

  • 讀取數據集 StudentsPerformance.csv 來創建更高級的父母教育水平餅圖.

父母受教育程度餅圖父母受教育程度餅圖

旭日圖

  • 父母的教育水平也可以用旭日圖來分析。

父母受教育程度的旭日圖父母受教育程度的旭日圖

箱線圖

  • 創建 2014 年大學總分/研究的箱線圖。

2014年大學總分/研究箱線圖2014年大學總分/研究箱線圖

  • 讀取 Pokemon數據集[33],創建帶有自定義異常值的箱線圖

Pokemon 數據集:帶有自定義異常值的箱線圖Pokemon 數據集:帶有自定義異常值的箱線圖

  • 我們還可以檢查前面提到的散點圖矩陣

口袋妖怪數據集的散點圖矩陣口袋妖怪數據集的散點圖矩陣

小提琴圖

  • 使用 Pokémon 數據集創建以下小提琴圖

口袋妖怪數據集的小提琴圖口袋妖怪數據集的小提琴圖

帶狀圖

  • 使用 px.data.tips() 數據集創建具有可變點大小的自定義帶狀圖[34]

具有可變點大小的定制帶狀圖(Tips 數據集)具有可變點大小的定制帶狀圖(Tips 數據集)

群體圖

  • 使用 px.data.tips() 數據集創建群體圖[35]

tips數據集:基本群圖tips數據集:基本群圖

極坐標圖

  • 使用 px.data.wind() 創建基本極坐標條形圖[36]

風數據集:極坐標條形圖風數據集:極坐標條形圖

  • 讀取weatherAUS.csv數據集創建風玫瑰圖

玫瑰圖:降雨量與風向(weatherAUS.csv 數據集)玫瑰圖:降雨量與風向(weatherAUS.csv 數據集)

雷達圖

  • 使用weatherAUS.csv數據集創建風雷達圖

雷達圖:降雨量與風向(weatherAUS.csv 數據集)雷達圖:降雨量與風向(weatherAUS.csv 數據集)

密度輪廓

  • 讀取數據集 us_covid19_daily.csv
import numpy as np 
import pandas as pd 
import plotly.express as px

import warnings
warnings.filterwarnings('ignore')

df = pd.read_csv('us_covid19_daily.csv')

df.dropna(inplace = True)
#display(df.head())
display(df.info())
<class 'pandas.core.frame.DataFrame'>
Index: 76 entries, 0 to 75
Data columns (total 25 columns):
 #   Column                    Non-Null Count  Dtype  
---  ------                    --------------  -----  
 0   date                      76 non-null     int64  
 1   states                    76 non-null     int64  
 2   positive                  76 non-null     int64  
 3   negative                  76 non-null     float64
 4   pending                   76 non-null     float64
 5   hospitalizedCurrently     76 non-null     float64
 6   hospitalizedCumulative    76 non-null     float64
 7   inIcuCurrently            76 non-null     float64
 8   inIcuCumulative           76 non-null     float64
 9   onVentilatorCurrently     76 non-null     float64
 10  onVentilatorCumulative    76 non-null     float64
 11  recovered                 76 non-null     float64
 12  dateChecked               76 non-null     object 
 13  death                     76 non-null     float64
 14  hospitalized              76 non-null     float64
 15  lastModified              76 non-null     object 
 16  total                     76 non-null     int64  
 17  totalTestResults          76 non-null     int64  
 18  posNeg                    76 non-null     int64  
 19  deathIncrease             76 non-null     int64  
 20  hospitalizedIncrease      76 non-null     int64  
 21  negativeIncrease          76 non-null     int64  
 22  positiveIncrease          76 non-null     int64  
 23  totalTestResultsIncrease  76 non-null     int64  
 24  hash                      76 non-null     object 
dtypes: float64(11), int64(11), object(3)
memory usage: 15.4+ KB
  • 創建對數域密度等高線圖

美國 COVID-19 日報:對數域正值與深度密度輪廓圖美國 COVID-19 日報:對數域正值與深度密度輪廓圖

  • 看下面的鳶尾花數據集示例

鳶尾花數據集:密度輪廓圖鳶尾花數據集:密度輪廓圖

  • 我們可以通過調用fig.update_traces來更改軌跡的配置,從而在 plotly.express 中創建填充輪廓圖[37]

鳶尾花數據集:填充輪廓圖鳶尾花數據集:填充輪廓圖

密度熱圖

  • 使用上述數據框 Data_to_plot 創建密度熱圖

美國 COVID-19 日報:對數域正值與深度密度熱圖美國 COVID-19 日報:對數域正值與深度密度熱圖

相關矩陣

  • 讀取heart.csv[38]數據集以創建相關矩陣<class 'pandas.core.frame.DataFrame'> RangeIndex: 303 entries, 0 to 302 Data columns (total 14 columns):

Column    Non-Null Count  Dtype

0   age       303 non-null    int641   sex       303 non-null    int642   cp        303 non-null    int643   trestbps  303 non-null    int644   chol      303 non-null    int645   fbs       303 non-null    int646   restecg   303 non-null    int647   thalach   303 non-null    int648   exang     303 non-null    int649   oldpeak   303 non-null    float64 10  slope     303 non-null    int6411  ca        303 non-null    int6412  thal      303 non-null    int6413  target    303 non-null    int64dtypes: float64(1), int64(13) memory usage: 33.3 KB

Theart.csv數據集:連續特征的相關矩陣Theart.csv數據集:連續特征的相關矩陣

  • 這是使用px.imshow()

心臟數據集:使用 px.imshow() 的相關矩陣心臟數據集:使用 px.imshow() 的相關矩陣

決策邊界

  • 使用sklearn.datasets.make_classification[39]生成一些自定義數據點。 我們的任務是 構建二分類(二進制)機器學習分類器的決策邊界。
  • 名稱 =[“Decision Tree”, ”Random Forest”, “ExtraTrees”]。
  • 端到端 ML 可視化工作流程

低信噪比輸入聚類的決策邊界:數據集 = [make_moons(noise=0.6, random_state=0),make_circles(noise=0.4, factor=0.5, random_state=1),make_blobs()]低信噪比輸入聚類的決策邊界:數據集 = [make_moons(noise=0.6, random_state=0),make_circles(noise=0.4, factor=0.5, random_state=1),make_blobs()]

高信噪比的輸入聚類的決策邊界: datasets = [make_moons(noise=0.3, random_state=0) ,make_circles(noise=0.2, factor=0.5, random_state=1) ,make_blobs() ]高信噪比的輸入聚類的決策邊界: datasets = [make_moons(noise=0.3, random_state=0) ,make_circles(noise=0.2, factor=0.5, random_state=1) ,make_blobs() ]

高信噪比的輸入聚類的決策邊界: datasets = [make_moons(noise=0.3, random_state=0) ,make_circles(noise=0.2, factor=0.5, random_state=1) ,make_blobs() ]

甘特圖

  • 使用時間步長創建甘特圖[40]

帶有時間步長的甘特圖帶有時間步長的甘特圖

KDE Histogram2dContour

  • 讀取數據集 winemag-data-130k-v2.csv 以創建 KDE Histogram2dContour 圖

數據集 winemag-data-130k-v2.csv:KDE Histogram2dContour 圖數據集 winemag-data-130k-v2.csv:KDE Histogram2dContour 圖

數據集 winemag-data-130k-v2.csv:KDE Histogram2dContour 圖

  • 我們可以創建更高級的 KDE Histogram2dContour plot[41]
  • 這里,輸出存儲在 HTML 文件temp-plot.html中

2 個正態分布的KDE Histogram2dContour2 個正態分布的KDE Histogram2dContour

平行坐標

  • 使用 Iris 數據集通過plotly.express創建平行坐標圖[42]

鳶尾花數據集:平行坐標圖鳶尾花數據集:平行坐標圖

平行類別

  • 使用 Tips 數據集通過 plotly.express 創建平行類別圖[43]

鳶尾花數據集:平行坐標圖鳶尾花數據集:平行坐標圖

3D繪圖

  • 創建以下人工數據集
df2 =pd.DataFrame(np.random.rand(40,4))
df2['label'] = np.round((3*np.random.rand(40,1) - 3)*-1)
df2[df2['label'] == 0] = 1
df2['label'] = df2['label'].astype(int).map({1:'Label_1', 2:'Label_2', 3:'Label_3'})
df2.columns = ['Value_1','Value_2','Value_3','Value_4', 'Labels']
  • 使用該數據集來說明三維散點圖

3D散點圖3D散點圖

三元組散點圖

  • 使用上面的數據框 df2 創建三元組散點

三元組散點圖三元組散點圖

瀑布圖

  • 使用瀑布圖以圖形方式表示損益

瀑布圖:損益瀑布圖:損益

漏斗圖

  • 創建漏斗圖

漏斗圖漏斗圖

漏斗圖

地圖

  • 讀取Consumer_Complaints.csv[44]數據集來創建美國各州消費者投訴熱圖 [20]。
  • 為此,我們需要從以下來源收集緯度、經度值:

https://gist.githubusercontent.com/meiqimichelle/7727723/raw/0109432d22f28fd1a669a3fd113e41c4193dbb5d/USstates_avg_latLong

https://www.factmonster.com/us/postal-information/state-abbreviations-and-state-postal-codes

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 670598 entries, 0 to 670597
Data columns (total 18 columns):
 #   Column                        Non-Null Count   Dtype 
---  ------                        --------------   ----- 
 0   Date received                 670598 non-null  object
 1   Product                       670598 non-null  object
 2   Sub-product                   472396 non-null  object
 3   Issue                         670598 non-null  object
 4   Sub-issue                     269868 non-null  object
 5   Consumer complaint narrative  114704 non-null  object
 6   Company public response       145197 non-null  object
 7   Company                       670598 non-null  object
 8   State                         665293 non-null  object
 9   ZIP code                      665274 non-null  object
 10  Tags                          94730 non-null   object
 11  Consumer consent provided?    208151 non-null  object
 12  Submitted via                 670598 non-null  object
 13  Date sent to company          670598 non-null  object
 14  Company response to consumer  670598 non-null  object
 15  Timely response?              670598 non-null  object
 16  Consumer disputed?            629179 non-null  object
 17  Complaint ID                  670598 non-null  int64 
dtypes: int64(1), object(17)
memory usage: 92.1+ MB

美國各州熱圖——消費者投訴美國各州熱圖——消費者投訴

  • 以下是各州消費者投訴的地圖

各州消費者投訴各州消費者投訴

散點地圖

  • 調用該函數px.scatter_map在瓦片地圖上創建散點圖

汽車共享數據集:瓦片地圖上的散點圖汽車共享數據集:瓦片地圖上的散點圖

  • 使用go.Scattermapbox()為同一數據集創建與上述散點圖略有不同的版本

汽車共享數據集:go.Scattermapbox()汽車共享數據集:go.Scattermapbox()

汽車共享數據集:go.Scattermapbox()

  • 這是基于 px.scatter_mapbox()  的上述地圖的第三個版本
entroid_lat  centroid_lon    car_hours  peak_hour
  0     45.471549    -73.588684  1772.750000          2
  1     45.543865    -73.562456   986.333333         23
  2     45.487640    -73.642767   354.750000         20
  3     45.522870    -73.595677   560.166667         23
  4     45.453971    -73.738946  2836.666667         19

使用 px.scatter_mapbox() 在 Mapbox 地圖上獲取汽車共享數據使用 px.scatter_mapbox() 在 Mapbox 地圖上獲取汽車共享數據

  • 使用 px.scatter_mapbox() 結合不帶 mapbox  token的公共 USGS 影像地圖來檢查kc_house_data.csv數據集[45]
<class 'pandas.core.frame.DataFrame'>
  RangeIndex: 21613 entries, 0 to 21612
  Data columns (total 21 columns):
   #   Column         Non-Null Count  Dtype  
  ---  ------         --------------  -----  
   0   id             21613 non-null  int64  
   1   date           21613 non-null  object 
   2   price          21613 non-null  float64
   3   bedrooms       21613 non-null  int64  
   4   bathrooms      21613 non-null  float64
   5   sqft_living    21613 non-null  int64  
   6   sqft_lot       21613 non-null  int64  
   7   floors         21613 non-null  float64
   8   waterfront     21613 non-null  int64  
   9   view           21613 non-null  int64  
   10  condition      21613 non-null  int64  
   11  grade          21613 non-null  int64  
   12  sqft_above     21611 non-null  float64
   13  sqft_basement  21613 non-null  int64  
   14  yr_built       21613 non-null  int64  
   15  yr_renovated   21613 non-null  int64  
   16  zipcode        21613 non-null  int64  
   17  lat            21613 non-null  float64
   18  long           21613 non-null  float64
   19  sqft_living15  21613 non-null  int64  
   20  sqft_lot15     21613 non-null  int64  
  dtypes: float64(6), int64(14), object(1)
  memory usage: 3.5+ MB


KC WA 房價數據集:px.scatter_mapbox() 按樓層著色KC WA 房價數據集:px.scatter_mapbox() 按樓層著色

KC WA 房價數據集:px.scatter_mapbox() 按價格著色KC WA 房價數據集:px.scatter_mapbox() 按價格著色

等值線圖

  • 調用px.choropleth為數據集[46]2011_us_ag_exports.csv[47]創建以下等值線圖

等值線地圖等值線地圖

地理散點圖

plotly.express.scatter_geo()函數可用于將地理數據繪制到地圖上。

地理散點圖:px.data.gapminder()地理散點圖:px.data.gapminder()

下拉式菜單

  • 創建一個簡單的下拉菜單,以便在單個圖中可視化不同的類別。

在這個例子中,我們將從www.basketball-reference.com抓取各個球員的NBA統計數據

我們關注場均得分、籃板和助攻排名前十的球員。我們的菜單包含三個條形圖。每個條形圖代表不同的類別(得分、籃板和助攻)

條形圖:前 10 名領導者(積分)條形圖:前 10 名領導者(積分)

B條形圖:前 10 名領導者的得分B條形圖:前 10 名領導者的得分

條形圖:前 10 名領先者的反彈條形圖:前 10 名領先者的反彈

條形圖:前 10 名領導者的協助條形圖:前 10 名領導者的協助

圖像

  • 使用cv2.imread()[48]顯示圖像文件中的圖像

顯示圖像文件中的圖像顯示圖像文件中的圖像

3D表面圖

  • 我們可以調用go.Surface()在 Plotly 中繪制 [3D 表面圖]](https://plotly.com/python/3d-surface-plots/ "3D 表面圖]")

Plotly 中的 3D 表面地形圖示例:布魯諾山海拔Plotly 中的 3D 表面地形圖示例:布魯諾山海拔

Plotly 可視化總結

以下是整個研究中討論的 Plotly 可視化的商業價值和詮釋的摘要:

  • 線形圖強調 Y 軸上的指標隨 X 軸上的變量而發生的變化,是時間序列分析(TSA)的最佳實踐,如氣象學、金融科技、醫療保健、交通等。
  • 散點圖顯示兩組數據之間的關系/相關性,你可以從數據中看出明顯的趨勢。散點圖在現實生活中用于直觀地顯示二元數據(銷售、天氣、醫療、生物、經濟等)
  • 散點圖矩陣是粗略判斷多個變量之間是否存在線性相關關系的好方法。這尤其有助于找出可能與基因組或蛋白質組數據(社會科學、市場研究、金融、醫療保健和環境科學)具有類似相關性的特定變量。該矩陣表示不同變量組合之間的雙變量或成對關系。
  • 氣泡圖評估模式的一致性。某些領域的氣泡大小一致性較低,意味著關系中存在較多差異(銀行業務、消費者滿意度評級、收入預測和繪圖以及特定產品的生產成本)。
  • 直方圖將數值變量值的分布繪制成一系列條形圖。直方圖可以很好地顯示數據集變量的一般分布特征。你可以大致看出分布的峰值在哪里,分布是偏斜還是對稱,以及是否存在異常值用于分析股票市場收益、醫療保健行業、教育、客戶購買金額、制造缺陷和質量控制、社會科學中的調查結果、環境科學中的空氣質量指數、基于人口統計學的城市年齡分布、物理學中的粒子能級、人力資源中的員工任期等)。
  • 分布圖表示連續數據變量的總體分布(參見 Jointplot、Pairplot、Rugplot、Kdeplot )。Distplot 可用于檢查單變量和雙變量分布(參見上述用例)。
  • 樹狀圖用于表示關鍵績效指標,深色可突出極端值、高或低。樹狀圖是一種基于區域的分層數據圖。樹狀圖常見于數據儀表盤(股票市場、抵達延誤、汽車行業、營銷策略、城市各時期的降雨量、特定生物群落中的動植物物種清單等)。
  • 子彈圖用于在一個條形圖中比較兩個衡量指標。它最適合用來比較一個主要衡量標準與一個設定標準(次要衡量標準)的進展情況。例如:需求計劃、實際凈利潤率與目標凈利潤率、KPI 與銷售和零售基準的比較等。
  • 面積圖結合折線圖和柱狀圖,顯示一個或多個組的數值如何隨第二個變量(通常是時間變量)的變化而變化。KPI 業務報告儀表板、多彩折線圖 BI 圖表和極簡面積圖與進度環信息圖表的前 3 個示例。這有助于戰略決策和預測。戰略性地利用這些圖表可以推動業務效益和提升績效,塑造組織的成功之路。
  • 柱狀圖比較不同類別之間的匯總統計數據。每個條形圖代表一個離散類別。它顯示了數字變量和分類變量之間的關系(敏捷制造的工業應用、供應鏈、客戶需求、價格趨勢監控、波動性、安全運動指標等)。
  • 餅圖將部分與整體進行比較。每個切片的大小與每個類別在整體中的相對大小成正比(銷售額、游客流量、出版費、石油儲備、投資組合拆分、安卓系統分布、市場份額)。
  • 旭日圖由一個內圈組成,周圍環繞著更深的層級。它用于將分層數據可視化(產業鏈和企業集團內部關系、增強型戰略決策、高級定制技術)。
  • 方框圖用于比較和對比兩個或多個組(不同組的年齡、年耗電量或溫度)。
  • 小提琴圖是盒圖與核密度圖的混合體,可顯示數據中的峰值。它是雙峰數據的理想選擇,而方框圖本身無法區分單峰數據和雙峰數據(產品用戶的人口統計、不同產品系列中每個客戶的收入范圍、數據驅動的臨床決策和服務管理)。
  • 帶狀圖是一種單軸散點圖,用于可視化許多單個一維值的分布。它非常適合顯示分布中的單個值。帶狀圖適用于各行各業,包括研究、醫療保健和制造業。
  • 蜂群圖是一種分類散點圖,用于可視化數據集中數據點的分布。它通過顯示單個數據點對盒圖或小提琴圖等其他圖進行補充。蜂群圖最適用于有許多獨立特征的分類問題(如醫療保健)。
  • 極坐標圖使用極坐標系表示兩個數值變量。極坐標圖的一些應用領域包括導航、工程、物理和生物等。
  • 雷達圖用于在由 3 個或更多定量變量組成的二維圖表上展示多元數據(例如,比較不同的產品和概念、分析產品在一段時間內的市場表現、做出數據驅動的決策)。它可以在市場營銷、分析、銷售、研究、教育等不同領域發揮重要作用。
  • 密度等值線將數據點的密度描繪成一組離散的層次。與地形圖上的等高線類似,每個等高線邊界都是密度恒定的隔離線。例如,這種繪圖對生態學可能很有用。
  • 密度熱圖是數值數據的圖形表示法,數據集中的單個數據點用不同的顏色表示。熱圖是理解數據的強大工具,在許多行業都有廣泛的用例和應用--從股市分析到網站分析。
  • 相關矩陣可以輕松地將數據中的關聯可視化。這使其成為構建 ML 模型的重要步驟。它還可用于根據數據進行預測和決策。低相關系數表明兩個變量之間的關系并不緊密。
  • 決策邊界(Decision Boundary)是將一類實例與另一類實例分開的線或超平面。它廣泛應用于金融、醫療保健和市場營銷等多個領域。
  • 甘特圖是一種項目管理圖,允許項目經理創建項目進度表。它顯示了項目任務的完成順序、到期時間、持續時間等詳細信息。
  • KDE Histogram2dContour Plot 是一種二維直方圖等高線圖(如城市建筑能源模型)。
  • 平行坐標圖非常適合將多個變量放在一起進行比較,并查看它們之間的關系。提出散點圖矩陣、字形和平行坐標等多維圖形,是為了便于探索多變量數據(如比較汽車模型、細菌與藥物)。
  • 平行分類圖(也稱平行集或沖積圖)是多維分類數據集的可視化。數據集中的每個變量由一列矩形表示,每個矩形對應該變量的一個離散值(如醫學研究、葡萄酒質量探索)。
  • 三維圖是可視化三維數據(如有兩個因變量和一個自變量的數據)的重要工具。在試圖發現三個維度上可能存在的相關性時,三維圖可能非常有用(例如氣候變化、化石損耗、生態毒性、人類健康)。
  • 散點三元圖是一種特殊的三元圖,是一種三角形圖,用于表示三個變量相加等于一個常數的比率(如土壤分析、基因組研究、化合物、市場研究、營養評估、投資分析、人口研究、項目管理、生態學)。
  • 瀑布圖有助于了解初始值(如凈收入)如何受到一系列正值和負值的影響。瀑布圖上的每個條形圖都顯示了增加或減少,最后在圖表右側的條形圖代表了總值。例如,瀑布圖顯示每個 “產品 ”的 “利潤”。金融行業示例:研究各種收入流對組織整體利潤的影響。
  • 漏斗圖是一種專門的圖表類型,用于展示用戶在業務或銷售流程中的流動情況。從漏斗的寬度可以看出流程中每個階段的用戶數量(如 B2B SaaS 產品、消費技術漏斗分析、MINDBODY、電子商務漏斗、Rappi A/B 測試、金融技術產品、QuickBooks、媒體漏斗、NBCUniversal)。
  • 地圖一直被用來幫助人們導航和了解周圍環境。在大數據時代,地圖已成為數據可視化的重要工具。地理信息系統(GIS)將數據與地圖連接起來,整合了地理空間數據。
  • 散點地圖框是地理信息系統中使用的瓦片地圖上的散點圖。航空、運輸、房地產、土木工程、航運、研究人員和咨詢等許多行業都依賴地理信息系統。
  • 等高圖是由彩色多邊形組成的地圖。這些地圖用于表示一個確定地理區域內某一數量的空間變化。縱橫圖在戰略規劃和數據驅動決策中發揮著重要作用。
  • 地理散點圖:地圖上的每一行數據都用一個符號標記來表示。地理空間散點圖可將數據源中的數據分布到各個地理位置,還可根據所選的數據庫字段為數據點著色,并縮放數據點的大小(如關鍵任務應急服務應用程序、大型基礎設施管理項目)。
  • 下拉菜單是簡潔圖形用戶界面的代名詞。它們提供了一個隱藏的功能世界,不會讓用戶因按鈕過多而不知所措。最佳行業案例包括表單填寫、屬性選擇、Bootstrap 服務臺模板、酒店/旅行預訂、Facebook、Apple、Medium、Sunglass Hut、Photoshop、Ryanair、Converse、Shiva、EdTech、Airbnb、Puma、Dribble、Profile Dropdown、The extra cup、Help and Feedback、電子商務、醫療保健和人力資源。
  • 圖像表示由基于人工智能的深度學習算法處理的輸入像素網格(電子商務、人臉識別、智慧城市、交通流動性、質量控制、安全、醫療保健、自動駕駛汽車、農業、制造業、內容管理)
  • 3D表面圖是描述兩個變量函數的圖形。它基本上是三維表面的二維表示。行業實例包括幾乎所有設備應用、暴露于自由基的材料的界面化學、生物和醫學研究領域。

寫在最后

  • 數據可視化是數據科學的關鍵組成部分,它能增強對復雜數據的理解和交流。
  • 在本文中,我們展示了如何在交互式數據可視化中使用整體部分講故事技術。
  • 我們使用數據科學家感興趣的 22 個公共領域數據集討論了大量代碼片段、圖形用戶界面和 EDA 示例。
  • 我們將自定義示例與現實生活中的數據集相結合,用 Python 中的 Plotly 創建了 63 個令人驚嘆的圖形、圖表、地圖和動畫。
  • 在整個研究過程中,我們對 Plotly 進行了深入分析。我們探討了這個著名 Python 庫的優缺點,同時還通過詳細示例和實踐代碼片段展示了它的功能。

參考資料

[1] timesData.csv : https://www.kaggle.com/code/kanncaa1/plotly-tutorial-for-beginners/input?select=timesData.csv

[2] 2015-2016年世界大學排名: https://www.timeshighereducation.com/world-university-rankings

[3] gapminder_data_graphs.csv: https://www.kaggle.com/datasets/albertovidalrod/gapminder-dataset

[4] gapminder.csv (參見 px.data.gapminder() )該數據集是使用來自: https://github.com/kirenz/datasets/blob/master/gapminder.csv

[5] Gapminder 網站: https://www.gapminder.org/data/

[6] 1950–2018 年預期壽命與 GDP.csv: https://www.kaggle.com/code/luxoloshilofunde/life-expectancy-vs-gdp-per-capita-1950-2018/input?select=Life+Expectancy+vs+GDP+1950-2018.csv

[7] honeyproduction.csv: https://www.kaggle.com/datasets/jessicali9530/honey-production

[8] 2023年世界幸福報告: https://www.kaggle.com/datasets/ajaypalsinghlo/world-happiness-report-2023

[9] Pokemon.csv: https://www.kaggle.com/code/thebrownviking20/intermediate-visualization-tutorial-using-plotly/input?select=Pokemon.csv

[10] 數據集: https://www.kaggle.com/datasets/rounakbanik/pokemon

[11] http://serebii.net/抓取的。: http://serebii.net/

[12] StudentsPerformance.csv: https://www.kaggle.com/code/desalegngeb/plotly-guide-customize-for-better-visualizations/input?select=StudentsPerformance.csv

[13] 數據集: https://scikit-learn.org/1.5/auto_examples/datasets/plot_iris_dataset.html

[14] Tips 數據集: https://www.kaggle.com/code/sanjanabasu/tips-dataset

[15] 波士頓犯罪記錄: https://www.kaggle.com/datasets/AnalyzeBoston/crimes-in-boston

[16] weatherAUS.csv: https://www.kaggle.com/code/desalegngeb/plotly-guide-customize-for-better-visualizations/input?select=weatherAUS.csv

[17] us_covid19_daily.csv: https://www.kaggle.com/code/servietsky/plotly-20-best-interactive-graphs-tutorial/input?select=us_covid19_daily.csv

[18] 使用“heart.csv”數據集探索心臟數據: https://www.kaggle.com/datasets/arezaei81/heartcsv

[19] sklearn.datasets.make_classification: https://scikit-learn.org/1.5/modules/generated/sklearn.datasets.make_classification.html

[20] winemag-data-130k-v2.csv: https://www.kaggle.com/code/residentmario/introduction-to-plotly-optional/input?select=winemag-data-130k-v2.csv

[21] Consumer_Complaints.csv: https://www.kaggle.com/code/rajacsp/eda-and-visualization-heatmap-plotly-donutplot/input

[22] kc_house_data.csv: https://www.kaggle.com/datasets/shivachandel/kc-house-data

[23] 2011_us_ag_exports.csv: https://raw.githubusercontent.com/plotly/datasets/master/2011_us_ag_exports.csv

[24] mt_bruno_elevation.csv: https://raw.githubusercontent.com/plotly/datasets/master/api_docs/mt_bruno_elevation.csv

[25] Plotly: https://plotly.com/python/getting-started/

[26] pip: https://pypi.org/project/plotly/

[27] px.data.gapminder(): https://stackoverflow.com/questions/73488602/line-graph-using-plotly

[28] 折線圖: https://plotly.com/python/line-charts/

[29] Dash App: https://dash.plotly.com/

[30] 散點圖: https://plotly.com/python/line-and-scatter/

[31] timesData.csv: https://www.kaggle.com/code/kanncaa1/plotly-tutorial-for-beginners/input?select=timesData.csv

[32] 分布圖: https://stackoverflow.com/questions/70328489/create-plotly-distplot-charts-in-plotly-express

[33] Pokemon數據集: https://www.kaggle.com/datasets/rounakbanik/pokemon

[34] 自定義帶狀圖: https://community.plotly.com/t/how-to-change-size-of-point-in-px-strip-plot/70506

[35] 群體圖: https://stackoverflow.com/questions/61493460/swarm-plots-in-plotly-plotly-express

[36] 極坐標條形圖: https://plotly.com/python/wind-rose-charts/

[37] 在 plotly.express 中創建填充輪廓圖: https://github.com/plotly/plotly.py/issues/2071#top

[38] heart.csv: https://www.kaggle.com/datasets/arezaei81/heartcsv

[39] sklearn.datasets.make_classification: https://scikit-learn.org/1.5/modules/generated/sklearn.datasets.make_classification.html

[40] 甘特圖: https://stackoverflow.com/questions/73247210/how-to-plot-a-gantt-chart-using-timesteps-and-not-dates-using-plotly

[41] KDE Histogram2dContour plot: https://community.plotly.com/t/overlaying-grid-over-contour-graph/38709

[42] 平行坐標圖: https://plotly.com/python/parallel-coordinates-plot/

[43] 平行類別圖: https://plotly.com/python/parallel-categories-diagram/

[44] Consumer_Complaints.csv: https://www.kaggle.com/code/rajacsp/eda-and-visualization-heatmap-plotly-donutplot/input

[45] kc_house_data.csv數據集: https://www.kaggle.com/datasets/shivachandel/kc-house-data

[46] px.choropleth為數據集: https://www.geeksforgeeks.org/choropleth-maps-using-plotly-in-python/

[47] 2011_us_ag_exports.csv: https://raw.githubusercontent.com/plotly/datasets/master/2011_us_ag_exports.csv

[48] cv2.imread(): https://www.geeksforgeeks.org/how-to-display-image-using-plotly/

責任編輯:武曉燕 來源: 數據STUDIO
相關推薦

2012-03-01 11:32:18

硅谷女性

2023-12-10 14:19:31

JupyterPython編碼

2021-11-29 07:02:24

Python函數操作

2011-03-18 09:56:19

JavaScript

2020-11-10 07:11:23

Linux內核補丁

2020-02-19 14:47:25

人工智能技術無人駕駛

2020-12-22 15:47:02

Python開發工具

2023-08-31 08:45:39

Python數據可視化工具

2016-11-29 12:25:56

Python大數據數據可視化

2022-03-23 15:11:04

Arch LinuxLinuxCutefish 桌

2023-12-18 15:02:00

PyechartsPython數據可視化工具

2011-04-07 11:33:00

HTML 5JavaScript

2025-02-17 11:10:49

2024-02-04 18:20:53

AI模型代碼

2013-12-11 10:41:00

jQuery插件

2025-04-01 08:30:00

Plotly數據可視化數據分析

2018-06-19 07:49:49

物聯網足球科技世界杯

2012-11-15 09:59:35

HTML5WebHTML5特效

2024-07-31 08:38:36

2020-08-18 17:21:01

開發工具前端開發
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 作爱视频免费看 | 国产精品毛片久久久久久 | 亚洲精品久久久一区二区三区 | 你懂的在线视频播放 | 国产精品99久久久久久www | 国产1区| 欧美激情99 | 凹凸日日摸日日碰夜夜 | 人人玩人人干 | 99热播精品 | 9999在线视频 | 婷婷久| 久久精品国产99国产精品 | 欧美一区二区三区四区在线 | 久久精品中文 | 在线视频a | 最新免费av网站 | 日韩精品不卡 | 欧美一级免费黄色片 | 日韩欧美中文 | 欧美一区二区三区小说 | 激情网五月天 | 免费看国产精品视频 | 欧美日韩成人一区二区 | 欧美久久久久久久 | 国产精彩视频 | 一级毛片免费完整视频 | 懂色tv | 少妇一级淫片免费放播放 | 正在播放国产精品 | 欧美精品成人一区二区三区四区 | 久久久久久久一区 | 免费精品| 精品久久网 | 91国产精品在线 | 香蕉国产在线视频 | www.日韩在线 | 狠狠爱综合网 | 欧美一区二区三区在线 | 久久国产成人午夜av影院武则天 | 精品1区2区 |