干貨 | 數據可視化中5個常見錯誤及克服方法
數據可視化的普及和影響在相對較短的時間內急劇增加。 Google趨勢顯示,自2009年以來,數據可視化的搜索頻率幾乎增長了100%,我們已經看到了大量可用的工具和軟件,幾乎任何人都可以相對輕松地創建數據可視化。
比起文本,我們本能地更熱衷于圖像,因為大腦能夠以更快的速度處理圖像。 然而,這并不意味著你可以把大量的圖像和形狀放在儀表板上,并期望你的觀眾贊嘆。 就像在我們被圖像吸引背后的認知方面,還有其他固有的東西,在某種程度上,與潛意識的行為變得相關。 其中之一就是***印象。
我們都知道這句話:***印象持續一生。 但它背后有多少真理呢? 好吧,事實證明:非常多。 類似于本能戰斗或逃跑反應,人類執行無意識思維的行為,稱為快速認知; 比我們習慣的刻意的決策風格更直觀,更快速。
快速認知是我們從一個非常短暫的經驗中深入挖掘和衡量真正重要的能力。 正如我們被告知從來不要通過一本書的封面判斷它一樣,我們每天都使用這種能力,它通過快速解析大量的信息,決定什么是最重要的,而不采取較慢,更理性的思維方式。
心理學家稱這種現象為“薄片(thin-slicing)”:在幾秒鐘內感知細節或信息需要大腦的理性部分花費幾個月或幾年的時間去評估。 Malcolm Gladwell將其描述如下:
薄片(Thin-slicing)不是一種異國情調的禮物。 它是對于人類來說意味什么的中心部分。 每當我們遇到一個新的人,或者必須快速地了解一些東西時就會發生薄片現象… …我們依靠這種能力,因為在很多情況下,仔細注意細節,即使不超過一秒鐘,都可以告訴我們非常多的信息。
好消息是,你可以改變和反駁別人對你不良的***印象,讓他們更了解你。但是在網絡上這就要困難得多,因為我們的注意力周期總是在歷史新低處。與之對應的,比以往任何時候都更難吸引你讀者的注意力,你不能讓壞的***印象進入你數據可視化的個人簡介里——尤其是當信息被埋藏的更深時容易引人探究。
為了防止這一點,我們將討論5個最常見的錯誤,以避免涉及不同可視化類型數據的錯誤形式。
1.數據過載
許多可視化數據和BI儀表盤的犧牲品數據過載——內容擁擠,其中一些可能不添加任何數據的理解。例如,盡管三維圖表看起來可能令人印象深刻,但他們往往使數據的解釋更加困難。
同樣的,BI儀表盤與5圖表和眾多的標簽可能會展示數量顯著的研究結果,但如果你的讀者無法區分他們在看什么,最終也是無用的。不必要的插圖、陰影、字體和紋飾會使數據分散,所以盡量少用。在大多數情況下,少即是多。
2.訪問軸
處理定量數據時,條形圖或折線圖是使內容可視化***的方法之一。一個常見的錯誤是圖表軸;當它看上去是有效啟動軸值越高于零時值越大,這可以將酒吧營業額和他們價值觀精確的表示。
3.不要“切太薄”
處理全部數據時,數據通常以部分到整體關系的形式出現,更為人知的是叫做餅圖。 餅圖是一種非常受歡迎的表現數據的方法,然而飽受非議的是,正如Walter Hickey所說,它是“他們表面上被設計用來做的令人難以置信的糟糕的一件事”。
沒有區段標簽,實際上很難區分餅狀圖段的大小(你能區分36%和37%之間的差異嗎?),因此確保圖表的所有區域都清楚地標記。 此外值得考慮的是所使用的類別的數量; 太多不同的段使得每個段之間難以區分。
4.交叉線
位于特定范圍內的數據通常用于展示隨時間的變化。 因此,折線圖是傳達數據之間的變化或差異的有效方式。 您可能已經開始注意到這里的趨勢,但重要的是不要在圖表中使用太多的線。 在圖表上有大量的交換線會很快變得混亂,因此我們建議不要使用超過4個系列。
5.適當的顏色
熱圖是數據可視化世界中***的圖表之一,并迅速變得流行。 使用地理空間作為基礎是***的分類數據,但有一些障礙可能會使你迷惑。 顏色和數據范圍都應在熱圖中正確使用。
一些顏色比其他顏色更突出,這可能給數據帶來不必要的權重。 相反,使用具有不同陰影的單一顏色來顯示強度水平。 對于數據本身,請選擇3-6個數字范圍,在它們之間均勻分布數據。 +/-符號可以擴展高的和低的范圍。
通過數據高效地講故事是一個必需的技能,這將有助于你在組織中的影響力。