數據可視化圖表,你選對了嗎?
常聽到一句話,“能用圖描述的就不用表,能用表就不用文字”。這句話也直接的表明了:在認知上,大家對于圖形的敏感度遠比文字高。
但同時我們也面臨著這樣一些問題:
- 寫 PPT、做 demo 時,心中有萬千想法和海量數據想要去展現,但總是最后還是以文字和枯燥的圖表堆疊呈現了出來,苦于怎么把這些數據展現的直觀、性感、一看就懂。
- 這時候,在心里怎么想和手上怎么畫之間,差了一座“理解圖表內涵”的橋梁了。
常見的圖表選擇原則文章有很多,這里只做簡單總結,重點是從逆向來看常見場景選用以及按照數據關系選用,最后是使用中會遇到的一些常見問題。本文將分為以下兩部分:
- 兩個優秀的數據可視化案例
- 基礎圖形及特點
- 如何選用圖標
- 常見的問題
作為視覺動物的我們,不妨先來看看驚艷全球的一些數據可視化的例子(原文鏈接)。
兩個優秀的數據可視化案例
A. 按年齡段分布的美國人口百分比:
這個 GIF 動畫,顯示了隨著時間推移的人口統計數量的變化。這是如何以令人信服的方式呈現一種單一的數據的好榜樣。
B. 最有價值的運動隊
這是通過疊加數據來講述深層故事的一個例子。
這個交互由 ColumnFive 設計,受福布斯“2014年最具價值的運動隊50強”名單得到的啟發。但是它不僅將列表可視化,用戶還可以通過它看到每支隊伍參賽的時間以及奪得總冠軍的數量。這為各隊的歷史和成功提供了更全面的看法。
基礎圖形及特點
接下來給大家介紹下數據可視化圖表的基本類型和選用原則,選用正確的數據可視化的圖表。
① 柱形圖(Bar Chart)
優勢:柱形圖利用柱子的高度,能夠比較清晰的反映數據的差異,一般情況下用來反映分類項目之間的比較,也可以用來反映時間趨勢。
注意:柱形圖的局限在于它僅適用于中小規模的數據集,當數據較多時就不易分辨。一般而言,不要超過10個。
通常來說,柱形圖的橫軸是時間維度,用戶習慣性認為存在時間趨勢。如果遇到橫軸不是時間維度的情況,建議用顏色區分每根柱子。
衍生 - 堆疊柱狀圖:
不僅可以直觀的看出每個系列的值,還能夠反映出系列的總和,尤其是當需要看某一單位的綜合以及各系列值的比重時,比如:1-8月倫敦和柏林房產交易筆數(萬)。
② 條形圖(Bar Chart)
優勢:條形圖用來反映分類項目之間的比較,適合應用于跨類別比較數據。在我們需要比較項類的大小、高低時適合使用條形圖。
③ 折線圖(Line Chart)
優勢:折線圖用來反映隨時間變化的趨勢。當我們需要描述事物隨時間維度的變化時常常需要使用該圖形。
衍生 - 光滑折線圖(Smooth line chart):
假如關注的是數據反映的整體趨勢,光滑折線圖最適合,尤其是當數據波動較大時,采用折線圖會顯得很亂。
衍生 - 面積圖(Area chart):
折線圖下方填充陰影,構成面積圖,如果有兩個或以上折線圖,在各自折線的下方填充不同顏色的陰影,構成堆積面積圖,便于了解折線的相對占比
④ 餅圖(Pie Chart)
注意:餅圖是一種應該避免使用的圖表,因為肉眼對面積大小不敏感。是最容易被誤用的。但在具體反映某個比重的時候,配上具體數值,會有較好的效果。
在需要描述某一部分占總體的百分比時,適合使用餅圖。例如:占據公司全部資金一半的兩個渠道;某公司員工的男女比例等。
而需要比較數據時,尤其是比較兩個以上整體的成分時,請務必使用條形圖或柱形圖,切勿要求看圖人將扇形轉換成數據在餅圖間相互比較,因為人的肉眼對面積大小不敏感,會導致對數據的誤讀。
另外,為了使餅圖發揮最大作用,在使用中一般不宜超過6個部分,如需要表達6個以上的部分,也請使用條形圖,扇形邊個數過多,會導致餅圖分塊的意義解釋過于困難。不要出現下面這種餅圖。
⑤ 散點圖(Scatter Chart)
散點圖的數據為三維數據,使用兩組數據構成多個坐標點,分析坐標點的分布情況,判斷兩個變量之間的關聯或分布趨勢。
可以用顏色區分系列,也可以用散點大小定第三維度,這就衍生圖出了氣泡圖。
⑥ 氣泡圖(Bubble chart)
氣泡圖是散點圖的一種衍生,通過每個點的面積大小來衡量第三維度,適合三維數據的對比,且需要強調第三維,超過三維就搞不定。
衍生 - 力學氣泡圖(Mechanical bubble chart)
⑦ 雷達圖(radar chart)
雷達圖適用于多維數據(四維以上),且每個維度必須可以排序。數據點一般6個左右,太多的話辨別起來有困難。
如何選用圖標
在講完了每種圖表的優勢和缺點,使用禁忌外,接下來就要為大家介紹:
① 按應用場景選擇
雖然圖表種類繁多,但是基于使用場景大致可以分為以下幾種情況。
基于這個大致的應用場景,可以初步選出可用的可視化圖,但對于細微的選擇差異,在下面會進一步的闡述;對于單一的可視化圖無法滿足需要時,就需要考慮組合展示,這里暫且不過多談。
② 按數據關系選擇
根據可視化專家 Andrew Abela 對該數據關系分類方式的提煉,他提出將圖表展示的數據關系分為四類:比較、分布、構成和聯系。下面對這四種關系以及應用舉例和對應的可視化解決方案做了簡要的分析。
大部分情況下,我們根據這份選擇指南按圖索驥就可以找到,方便又輕松,在實際應用中,也存在需要展示多種數據關系的情況,那么對應的圖表類型也是每種關系對應的基本圖形的綜合運用。例如多個時間點上構成的比較等。
常見問題
最后整理了一些常見問題,供大家在實際操作中使用。
Q: 柱形圖和條形圖都可以表示分類比較,那兩者在使用上有何差異呢?
A: 當所比較項目的標簽文本比較長時,柱形圖的橫軸下的標簽會出現重疊或者傾斜,且占用空間大,影響閱讀者的目光移動。所以在表示分類時,如項目數量較少,使用柱形圖或條形圖均可,如項目_數量較多_,則建議使用_條形圖_。
Q: 柱形圖和折線圖都可以表示時間序列的趨勢,如何選擇?
A: 一般來說,建議使用折線圖反映趨勢變化。柱形圖強調各數據點值之間的差異,折線圖則強調起伏變化的趨勢;柱形圖更適于表現離散型的時間序列,_折線圖適合表現連續型的時間序列_。所以當時間序列的_數據點較少時,可以使用柱形圖_,而當數據點較多時,則建議使用折線圖。
Q: 面積圖和折線圖都可以表示時間序列的趨勢,兩者之間如何選擇?
A: 當只展示一個度量數據的趨勢時,兩者完全等價,都可以使用,通常使用折線圖更多。
但是,當在大型會議室展示數據時,即讀圖人離圖表可能較遠的情況,使用面積圖能讓后排的人看的更清楚。當比較多個度量數據的趨勢時,建議使用折線圖。如使用面積圖,則存在數據序列之間相互遮擋的情況,除了靠近橫軸的那個數據序列外,很難觀察出其他數據序列的變化趨勢。
Q: 是不是應該避免使用餅圖,能不用就不用?
A: 從精確比較數據的角度來說,條形圖的確更易于比較數據點之間的差異,但每種圖表都有它的長處和適用場景,餅圖能給我們一種整體和構成的印象,適用于表達“占比”——看到餅圖就讓想起100%,這個特點是條形圖所沒有的。
但是要盡量避免并列使用兩個及以上的餅圖,雖然這種用法很常見。例如如下圖,分布展示兩個國家在不同年份家庭花銷占比,由于讀圖人很難通過餅圖直接、準確的看出各個分類的變化趨勢和幅度,需要反復在4個餅圖之間比較和判斷,如果變化幅度不大,很容易造成誤讀。所以同樣是想表示占比,這種情況使用餅圖就不是很有效的圖表形式。
充分了解每種圖表類型的特征,針對于實際的使用場景,判定其數據關系,結合場景判定圖和圖表類型選擇指南,從而有效的傳遞數據信息,讓你的數據更加直白,make sense!