六種替代方案告別傳統可視化圖表,數據科學家必備!
數據可視化是數據科學中至關重要的一環,散點圖、條形圖、線圖、箱線圖和熱圖等常見圖表廣泛應用于數據分析和呈現。盡管它們很簡單并且幾乎每個人都知道,但它們并不是涵蓋所有可能場景的正確選擇。本文中,筆者為大家總結了這些熱門圖表的幾種替代方案:
尺寸編碼熱圖(Size-encoded heatmaps)
Size-encoded heatmaps使用圖形元素的大小表示數據的值,采用方塊或圓形等圖形元素的大小直觀展示數據的絕對數值大小,尺寸越大表示數值越高。「在傳統熱圖的數值精確映射方面存在挑戰時,尺寸編碼熱圖則是一種有效的替代方案。」 并且,由下圖可以看出,Size-encoded heatmaps使得熱圖更為清晰,許多接近零的值將立即縮小。
瀑布圖(Waterfall charts)
瀑布圖(Waterfall charts)是一種用于可視化價值隨時間變化的圖表工具。相較于線圖或條形圖,瀑布圖能更好地描述數據的滾動差異,尤其適用于展示增量變化的規模和方向。
在瀑布圖中,起始值和最終值由第一個和最后一個柱狀圖表示。通過圖表中的連續變化,可以直觀地觀察到不同階段的貢獻和變化。此外,連續的更改會自動進行顏色編碼,使它們更易于解釋。這樣的設計使得瀑布圖成為了一種直觀且清晰地呈現數據變化的工具,尤其適用于呈現價值隨時間的變化,以及各個階段對最終結果的影響。
凹凸圖(Bump charts)
凹凸圖(Bump charts)是一種用于可視化不同項目隨時間排名變化的圖表類型。當需要呈現多個類別隨時間的排名變化時,使用條形圖可能會導致圖表混亂。在這種情況下,凹凸圖能夠提供更清晰的可視化效果。
凹凸圖通過將項目的排名以線的形式呈現,每條線代表一個項目隨時間的排名變化。這種排名變化的可視化方式可以幫助觀察者更直觀地理解不同項目之間的排名變化情況。相較于條形圖,凹凸圖在凸顯排名變化方面更為清晰,減少了圖表混亂的可能性。
雨云圖(Raincloud Plots)
雨云圖(Raincloud Plots)是一種將箱線圖、帶狀圖和核密度估計(KDE)圖結合在一起的數據可視化工具。它為展示數據分布提供了一種簡潔而全面的方式,并旨在解決使用傳統箱線圖和直方圖時可能出現的誤導性問題。
使用雨云圖,可以:
- 合并多個圖以避免錯誤或誤導性結論;
- 減少混亂并提高清晰度;
- 改善組間比較;
- 通過單個繪圖捕獲數據的不同方面。
Hexbin和密度圖
Hexbin圖和密度圖是用于可視化大量數據點的替代方案,特別適用于當散點圖的數據點過于密集時難以解釋的情況。
Hexbin圖將圖表區域劃分為六邊形區域,并根據每個區域中數據點的數量為其分配一個顏色強度。這種方式能夠更清晰地展示數據點的密度和分布情況,避免了數據點過于密集時的視覺混亂。
而密度圖則通過連接相等密度的點來創建輪廓,用等高線描繪了二維空間中數據點的分布情況。這種表現方式能夠更直觀地展示數據的分布情況,幫助觀察者更好地理解數據點的密度和分布規律。
氣泡圖和點圖(Bubble charts and Dot plots)
氣泡圖和點圖是用于替代條形圖的有效可視化工具,特別適用于在大量類別情況下展示數據時避免圖表混亂的情況。
氣泡圖是一種類似于散點圖的圖表,但具有一個分類軸和一個連續軸。通過使用氣泡的大小來表示數據的值,氣泡圖可以更直觀地展示數據隨時間的變化。
點圖則是另一種替代條形圖的方法,它強調了我們主要關心表示總價值的各個端點,同時消除了幾乎沒有用處的長條。這兩種圖表都有效地解決了當條形圖包含太多條形時,觀察者難以關注到單個條形的長度的問題。