大數據也要可視化!盤點六家主力初創公司
盡管可視化不是數據分析中最有技術挑戰的一部分,但無疑它是最重要的。
存儲、數據庫、查詢處理和算法都是非常重要的,但是在以數據為驅動的世界中,他們都是基礎層。如果你要從大量高度復雜的數據集中發現新東西,或者給人們提供分析即使是最簡單數據的能力,那么展現這些數據和展現這些數據如何被利用,就是很關鍵的。
以下是筆者認為從根本上改變了數據可視化方式的六家初創公司,有些在表面之下是高度復雜的,有些是并不完美的,但是他們都在通過自己的行動讓我們重新思考數據、通過圖表的方式讓我們看到事實。
Ayasdi
網絡圖表的想法并不新鮮,但是Ayasdi的方法倒是挺新鮮的。在后臺,有一個HBase數據庫,一項被成為拓撲數據分析的技術,數百臺機器學習算法以處理復雜的數據集,找到數據點之間的相似性。不過對于終端用戶來說,有一個數據集的地圖,看上去很像是網絡圖表,突出相關數據點的集群,讓分析師可能進行進一步研究。
BeyondCORE實際是在和Ayasdi相同的前提下運行的——為用戶展示重要的相關性,這樣他們就不必思考沒有覆蓋到的查詢——但那是他采用一些不同的技術去達到目的。BeyondCORE采用一個不同的可視化方法,它堅持使用標準圖表,但通過軟件發現的相關性,提供在虛擬實境中互動地呈現一個談話用戶的選項。
ClearStory
ClearStory有一款非常特別的產品——盡管他們對很多細節秘而不宣,而且在發布前所有截屏都是帶鎖的。不過,從本質上講,它試圖通過可視化展現一切細節,顯示大量數據來源,當源數據改變的時候自動更新,并且調用協作和社交理念。
Datahero

與很多初創數據公司不同的是,Datahero并沒有試圖招攬那些已經對業務智能軟件或者從Hadoop數據中心獲得見解已經厭倦了的人們。相反,Datahero讓那些有簡單的業務數據或者個人數據的人們獲得一些簡單的表格,既不用安裝Excell功能,也不用過多地擔心表格的格式對不對。在早期,Datahero的可視化仍然是相當普遍的,但它的易用性是很獨特的。
Platfora

Platfora試圖分析保存在Hadoop集群中的大量數據,像分析自己Stripe數據那樣簡單。這是基于Hadoop和大規模并行隊列處理的,但是以一種類似HTML5的方式展現,例如有拖拽、刪除、視覺切割和數據切割等操作。后者的能力,實際上在擁有比以往更多數據點的大數據世界中是很關鍵的。
Zoomdata
Zoomdata不是唯一一家支持移動設備的分析公司,但是筆者所知的少數幾家專門為移動設備而設計的公司之一。Zoomdata連接到標準業務數據源,但是利用觸摸屏和D3.js可視化來提供可視化的圖表,而且這些圖表的設計就像是藝術家的調色板一樣有趣。