成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

如何成為數據分析師系列(二):可視化圖表進階

大數據 數據可視化
繼上一篇如何成為數據分析師系列(一):可視化圖表初階整理了折線圖、柱形圖、散點圖、餅圖4種基本圖表的特性及其使用場景,這次整理了一些平常不太使用,但在合適的場景的使用它們,往往能為你的分析報告加分不少的圖表。

繼上一篇??如何成為數據分析師系列(一):可視化圖表初階??整理了折線圖、柱形圖、散點圖、餅圖4種基本圖表的特性及其使用場景,這次整理了一些平常不太使用,但在合適的場景的使用它們,往往能為你的分析報告加分不少的圖表。

需要說明的是,這次演示的圖表幾乎都是用Tableau制作的「因自身學習的原因」,不再是Excel制作的圖表。其中有部分圖,仍舊能用Excel制作,有部分已經不適合使用Excel制作了。

樹狀圖(TreeMap)


功能&應用場景

主要功能用于可視化整體與部分關系,以區塊表示部分層級(不同區塊用顏色區分),用矩形面積表示大小關系。

缺點

以面積表示大小,當數值相近時人眼難以辨別,當然可通過填充數值彌補。

漏斗圖(FunnelPlot)

?如何成為數據分析師系列(二):可視化圖表進階?

應用場景

適用于關鍵業務環節數據比較,將各環節串聯起來構成漏斗,量化流程內環節,追蹤各環節轉化率。轉化是漏斗圖主要表達信息。

  1. 電商類:訪問 -> 注冊 -> 購物車 -> 下單 -> 付款;
  2. 營銷推廣:展現 -> 點擊 -> 訪問 -> 咨詢 -> 下單 -> 付款;
  3. CRM:潛在客戶階段 -> 意向客戶階段 -> 談判階段 -> 成交簽約。

以上只是常見漏斗,實際各種業務流程都可構建漏斗。

缺點

漏斗圖在實際分析中并不常見,但在PPT中用作信息描述卻明顯優于干巴巴的數字

  • 追蹤流程較困難,而企業是結果導向的,我們更在意整個流程的轉化率,有時不會深究細節;
  • 有時候我們更關心某環節轉化率在時間維度上的變化。

漏斗圖 vs 行為路徑分析

漏斗圖要區分于行為分析路徑圖,行為分析路往往是你對用戶的訪問路徑未知,而漏斗圖則是基于已知關鍵流程構建。

樣式變種:將面積形式變種為柱形圖樣式,顯得更加清晰

?如何成為數據分析師系列(二):可視化圖表進階?

雷達圖(RadarChart)

?如何成為數據分析師系列(二):可視化圖表進階?

應用場景

雷達圖主要用于靜態的多維對比,它直觀地呈現幾個觀察對象在多個指標上對比情況。

缺點

能表達的靜態數據信息有限,線條不宜超過5條,指標不宜超過8個。

注意事項

雷達圖中的指標必須是正向且可以比較的,也就是指標代表越好,且當指標差異較大時,需要進行標準化,消除單位影響。

  1. 指標必須是相同表征含義:如都是越大代表越好,或越小代表越好;
  2. 雷達圖的數據必須進行標準化;
  3. 雷達圖是靜態數據很量,不可能有時間維度。

制作過程

數據如圖

?如何成為數據分析師系列(二):可視化圖表進階?

  • 數據源-***個指標要重復一列,作為環形的起點和終點;
  • 在Tableau中要進行透視表操作;
  • 生成路徑: CASE [數據透視表字段名稱]

WHEN '認證兩分鐘回復率' then 1

WHEN '認證數' then 2

WHEN '消息兩分鐘內回復率' then 3

WHEN '消息回復率' then 4

WHEN '回復消息數' then 5

WHEN '質檢得分' then 6

ELSE 7

END

  • 生成弧度:IF [路徑]=7 THEN pi()/2 ELSE PI()/2 - ([路徑]-1)*2*PI()/6 END
  • 生成X = [數據透視表字段值]*COS([弧度])、Y = [數據透視表字段值]*SIN([弧度])

?如何成為數據分析師系列(二):可視化圖表進階?

箱線圖/盒須圖(Box plot)

?如何成為數據分析師系列(二):可視化圖表進階?

箱線圖是利用五個統計量:最小值、第1分位數、第2分位數、第3分位數、***值 來描述數據的圖形。

應用場景

主要用于觀察數據分布:觀察分布&異常值&偏態等

  1. 箱線圖可直觀明了地觀察數據的分布情況,對不同數據批的數據分布進行對比;
  2. 箱線圖可直觀明了地識別數據批中的異常值;
  3. 箱線圖可初步判斷數據批中的偏態和尾重; 異常值出現于一側的概率越大,中位數也越偏離上下四分位數的中心位置; 異常值集中在較小值一側,則分布呈現左偏態;異常值集中在較大值一側,則分布呈現右偏態。

圖形元素說明

?如何成為數據分析師系列(二):可視化圖表進階?

矩盒兩端的位置分別對應數據的Q1、Q3分位數,矩形盒內部繪制一中位數線

  • 內限=Q1-1.5*IQR、=Q3+1.5*IQR IQR(四分位矩)=Q3-Q1,它反映了中間50%數據的離散程度(數值越小,中間50%數據越集中)
  • 外限=Q1-3*IQR、=Q3+3*IQR 內限以外位置都是異常值,其中在內限與外限之間的為溫和異常值(Mild outliers),外限以外的稱為極端異常值(extreme outliers)。

應用舉例

?如何成為數據分析師系列(二):可視化圖表進階?

甘特圖(Gantt chart)

?如何成為數據分析師系列(二):可視化圖表進階?

應用場景:項目管理

甘特圖對于說明項目各元素的起始與終止日期效果非常好,清楚看到需要完成的內容和截止時間對于項目的成功非常關鍵。 多數情況下,我們把甘特圖和項目管理聯系到一起,不過它其實還可以用來表現隨時間推移事物的變化(人員、機器、訂單等)。

  • 顯示項目進度。例如:說明關鍵可交付成果、所有者、截止期限。
  • 顯示隨時間推移的其他事物使用事項。例如:機器使用的持續時間、團隊成員有空與否,訂單發貨時間等。

?;鶊D(Sankey diagram)

?如何成為數據分析師系列(二):可視化圖表進階?

?;鶊D,即桑基能量分流圖,也叫桑基能量平衡圖。

起源

  • 1898年Matthew Henry Phineas Riall Sankey繪制的“蒸汽機的能源效率圖”而聞名世界,此后便以其名字命名為“桑基圖”。

應用場景

  1. 展示分類維度間的相關性,以流的形式呈現同一類別的元素數量;
  2. 表示集群的發展,比如特定人群的分布,如:杏仁活躍醫生在一段時間的活躍狀態變遷;
  3. 具有流程圖的性質,表示能量/物質流轉。

核心特征

最明顯的特征是始末端的分支寬度總各相等,即所有主支寬度的總和應與所有分出去的分支寬度的總和相等,保持能量的平衡。

圖形制作

  • 1.S型曲線-sigmoid Fuction

?如何成為數據分析師系列(二):可視化圖表進階?

該函數圖像的特點有: 1. 連續,光滑,嚴格單調; 2. 關于(0, 0.5)中心對稱; 3. 值域為(0,1).

1. 簡單?;鶊D 數據格式如下。左為Data,右為模型Model,要求制作桑基圖表示用戶ID從position 1變化為position 2的路徑。

?如何成為數據分析師系列(二):可視化圖表進階?

?如何成為數據分析師系列(二):可視化圖表進階?

  • a. 連接Excel文件,將Data與Model均拖入數據,并由Link進行inner join連接;
  • b. 創建計算字段Sigmoid Function代表S曲線函數:1/(1+EXP(1)-[t]);
  • c. 創建計算字段Curve代表曲線:[Position 1]+(([Position 2]-[Position 1])*[Sigmoid Function]);
  • d. 將t拖拽至[列],Curve拖拽至[行],并調整為連續的維度; e. 將Name、ID拖到詳細信息,Name拖拽到顏色;
  • f. 選擇標記類型為 線,一個簡單的?;鶊D就完成了,示例可參見Tableau文件。

?如何成為數據分析師系列(二):可視化圖表進階?

難點理解:曲線是如何生成的!

每一個用戶有position 1、position 2,以ID=1的用戶為例:

 

position 1=1
position 2= 100
[Position 2]-[Position 1]=99
([Position 2]-[Position 1])*[Sigmoid Function]

將上式記作A,根據S曲線特性,當t->負無窮時,函數s->0,A->0;因s函數嚴格單調,當t增大時,s增大;當t->正無窮時,s->1,A->([Position 2]-[Position 1])。所以curve=[Position 1]+(([Position 2]-[Position 1])*[Sigmoid Function])可生成一條S曲線.

難點是設置position,讓每個類別的點靠近。不僅是大類別要靠近,細分類別也要靠近

詞云

?如何成為數據分析師系列(二):可視化圖表進階?

應用場景

詞云圖是為了描述事物的主要特征,要求能夠讓人一眼看出一個事物的主要特征,越明顯的特征越要突出顯示。不要為了詞云而詞云,要關注制作詞云要表達什么信息(包括數據的關系是什么)

  1. 內容型網站對內容關鍵詞提取制作詞云作為網站導航;
  2. 人物肖像刻畫、事物肖像刻畫、小說核心主題刻畫,總之對于各種事物進行某種主題的刻畫,可以選用詞云,如果是表現層次化關系,則不建議使用詞云。(下圖就不是詞云最合適的運用場景)

?如何成為數據分析師系列(二):可視化圖表進階?

主要特征

詞云是可視化中較為藝術化的圖表。 Word直接展示對象,Word字體大小表示某種度度量。

以上就是圖表類型的介紹了。其實圖表類型還有很多很多,如基于鼠標點擊的熱力圖、基于網絡傳播的關系圖等等,但它們都不再適合用Excel或Tableau制作,需要用R/Python進行繪圖,暫時用不上,故沒有再往下寫的必要。

此外,圖表制作還有很多主意事項,比如:背景色的使用

黑色背景給人以震撼,但它的情感色調是鄭重、悲傷、緊張 白色背景比較單調,但它的情感色調是以輕松

具體的圖表如何使用,它是非常靈活的,見仁見智。這些基礎理論只是將圖形的特征介紹清楚,具體如何用仍需要結合業務場景、分析目標等。

責任編輯:未麗燕 來源: 知乎
相關推薦

2018-12-26 15:55:50

數據分析數據可視化圖表

2016-10-21 14:41:22

數據分析師大數據

2017-05-11 10:05:47

數據分析excelPython

2017-05-11 10:35:51

數據分析語言學習

2019-10-10 17:40:54

數據科學可視化繪圖

2021-10-11 08:04:22

Python數據行程

2021-04-09 10:42:03

數據可視化框架大數據

2015-05-29 10:24:32

數據分析師成為數據分析師

2017-01-12 17:28:59

數據分析數據可視化可視化

2017-08-15 18:55:57

大數據數據可視化圖表

2015-08-04 13:25:46

數據分析

2020-03-01 14:01:22

Echarts數據可視化圖表

2017-03-09 09:54:13

分析數據可視化

2018-12-03 16:50:23

數據可視化數據分析薪水

2023-10-24 20:38:15

數據分析機器學習

2014-06-19 14:00:46

數據分析師

2020-05-14 10:19:23

Python可視化分析

2017-09-15 10:23:06

可視化Bug數據分析

2015-08-20 10:04:40

可視化

2017-12-11 15:56:44

數據分析師數據倉庫數據源
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 亚洲日日| 国产精品爱久久久久久久 | 日韩超碰在线 | 国产精品成人69xxx免费视频 | 国产丝袜一区二区三区免费视频 | 亚洲在线中文字幕 | 亚洲在线一区 | 久久99视频这里只有精品 | 成人av网站在线观看 | 久久看看 | 日韩久久久久久 | 日韩成人性视频 | 9999久久 | 亚洲精品小视频在线观看 | av在线三级| 天天射影院 | 黄色大全免费看 | 久久综合久久综合久久综合 | 蜜桃在线视频 | 精品美女久久久 | 欧美精品一区二区三区一线天视频 | 久久久久久久久久久久久久国产 | 久久久久国产一级毛片高清网站 | 亚洲播放 | 成人国产免费视频 | 羞羞在线视频 | 亚洲国产一区二区三区, | 亚洲一区精品在线 | 欧美aⅴ在线观看 | 日韩精品免费看 | 亚洲成人久久久 | 国产欧美在线 | 日韩一区二区在线播放 | 欧美日韩综合一区 | 国产视频福利在线观看 | 国内自拍偷拍一区 | 婷婷久久精品一区二区 | 水蜜桃亚洲一二三四在线 | 五月天激情电影 | www.日日干 | 亚洲国产网 |