大數(shù)據(jù)可視化的三大認(rèn)識誤區(qū)
最近,很多企業(yè)都在談數(shù)據(jù)可視化,其受關(guān)注的程度不次于大數(shù)據(jù)。數(shù)據(jù)可視化是正確理解數(shù)據(jù)信息的***方法,甚至是唯一方式。出色的可視化產(chǎn)品可以讓用戶對自己目前關(guān)注的事情一目了然,并可以快速給出建議,隨時隨地分享。在大數(shù)據(jù)時代,如果你的數(shù)據(jù)展示方法不對,可能會破壞數(shù)據(jù)可視化效果。
誤區(qū)一:顯示所有的數(shù)據(jù)
盡管我們多次被告誡,大多數(shù)人并不關(guān)心你對多少數(shù)據(jù)做了多少量化指標(biāo)的處理,他們不在乎你每天可以處理多少數(shù)據(jù),或您的Hadoop集群有多大。用戶想要的是具體的或者相關(guān)的答案,并且他們希望越早得到越好。但是有些數(shù)據(jù)可視化工具,還是會把無關(guān)的數(shù)據(jù)顯示在頁面上,目的是希望接近企業(yè)所需,但事實(shí)上造成了用戶很難找到有價(jià)值的信息。
現(xiàn)在儀表板應(yīng)用非常流行,其指導(dǎo)思想是可以“顯示所有狀態(tài)的數(shù)據(jù)。大多數(shù)性能是枯燥的數(shù)據(jù)展示,而多異化功能則被隱藏。其實(shí),好的儀表板數(shù)據(jù)展示,是把重要數(shù)據(jù)做了了趣味化的展示處理。讓用戶做一個有效排序,哪些是優(yōu)先處理,哪些需要延后處理。數(shù)據(jù)可視化可以達(dá)到儀表盤達(dá)不到的能力,可以更好地處理數(shù)據(jù)報(bào)告。
誤區(qū)二:顯示錯誤的數(shù)據(jù)
顯示錯誤的數(shù)據(jù)和顯示所有的數(shù)據(jù)同樣存在隱性危機(jī)。在數(shù)據(jù)可視化操作中,顯示的信息子集與數(shù)據(jù)是相關(guān)的關(guān)系。比如你關(guān)心銷售數(shù)據(jù),您可能也關(guān)心每個地區(qū)或者個別銷售人員的銷售數(shù)據(jù),考慮通過數(shù)據(jù)做出決策。把幾個關(guān)聯(lián)性很強(qiáng)的圖表進(jìn)行折中處理,選擇一個圖片來展示,這實(shí)際上需要一個復(fù)雜的數(shù)據(jù)可視化能力來完成,而且相關(guān)幾個圖片的數(shù)據(jù)必須做到干凈、清晰。
誤區(qū)三:美化數(shù)據(jù)展示結(jié)果
即使你采用干凈的數(shù)據(jù)繪制圖表,你仍然會弄錯。因?yàn)樘厥饣谋砀耦愋驼故竞苌僖?,絕大多數(shù)的可視化需求都是用來滿足線形圖、餅圖等基本圖形。
要想美化數(shù)據(jù)展示,在處理關(guān)鍵數(shù)據(jù)字與段之間的關(guān)系時,就應(yīng)該考慮把指定字段加在坐標(biāo)軸上。按照組別、類別、數(shù)據(jù)時間、數(shù)據(jù)量級以及重要性進(jìn)行劃分,尤其是顏色類別一定要有,并且可以自定義亮度和飽和度,確保在使用本標(biāo)簽或者其他標(biāo)簽的時候做到準(zhǔn)確無誤。
為了避免失誤,***的方法是專注于你的目標(biāo)。在可視化應(yīng)用之前就應(yīng)該考慮:我們關(guān)心什么?需要做什么?要解決什么問題?要看到怎樣的數(shù)據(jù)?以怎樣的結(jié)構(gòu)和關(guān)系來展示?要突出哪些數(shù)據(jù)?當(dāng)你能夠回答這些問題時,你就可以進(jìn)行數(shù)據(jù)可視化的設(shè)計(jì)或者應(yīng)用了。
原文鏈接:http://soft.chinabyte.com/216/12827716.shtml