讓數據重新成為數據中心的核心
譯文不知在什么時候,有人似乎想方設法將數據移到數據中心的外面。不斷發展的摩爾定律將人們的重心由數據轉向計算。
人們往往盡量減少所要處理的數據,并簡化這一任務:處理獲得某種可付諸行動的結果所需要的絕對最小子集數據。因而,可用數據完整性的價值隨之喪失。重心完全放在了如何可以針對一小批數據執行一些簡單的操作上,而且一再以某種固定的方式來加以執行。
如今,最龐大的云和Web 2.0數據中心卻在采用一種不同的方法,捕獲和分析所有的可用數據。這種方法需要由以計算為中心的數據中心向以數據為中心的數據中心轉變。
這種以數據為中心的數據中心架構讓數據重新成為數據中心的核心,但是可能更值得關注的是,這能夠實現服務器分解,從而能夠讓數據中心的每個單元(計算、內存、輸入/輸出和存儲)靈活地獨立于其他單元進行擴展,并且能夠在機架層面、而不是在服務器層面進行優化。這種架構的關鍵在于,將重心放在數據和高效網絡的需要上,這種高效網絡能夠在數據的整個有用生命周期內吸收、存儲、移動和分析數據。
數據具有大、實時和非結構化的特點
現在強調的重心不是處理非常小的一部分數據,而是回到了顯然增大的數據――所有數據,每個地方,每秒生成的數據量一直越來越多。實時數據以驚人的速度從成千上萬移動設備處加以生成,并從成千上萬用戶處加以聚合,以提供完全為每一個用戶度身定制的極其有用的信息。
谷歌的Waze移動導航應用程序就是個典型的例子。Waze可以從成千上萬個隨車內用戶一同悄然移動的手機收集實時的GPS數據。說是悄然,實際上這些手機在不斷生成大量的實時、基于位置的數據,因而提供了數百萬Waze訂戶的旅行模式和速度方面的極其寶貴的信息。
所有這些信息為每一個用戶整合起來,在結合當前位置、目的地、可行道路和實時流量模式的基礎上,將獨特的寶貴信息提供給該用戶。要是你還沒有試過Waze,就該試一下――你會驚嘆于龐大的純數據數量以及實時進行的處理,以便將你引向你之前根本不知道存在的流量最少的捷徑。
Waze的一種盡量縮短個人行駛時間的合理延伸就是,自動駕駛汽車:自動駕駛汽車不僅可以縮短行程,還能消除交通擁塞。設想一下,以每小時150多公里的時間行駛,你與前面那輛汽車相距僅幾米之遠。這一幕會在我們的有生之年出現,而數量驚人的數據以及這種數據的高速移動和處理會幫助實現這一幕。所以,數據的增長不僅會與日俱增,還會以更快的速度增加。
遺憾的是,傳統的數據中心架構當初并不是為處理這一種類和量級的龐大、快速、非結構化的數據而設計的。我會在下一篇文章中介紹新的以數據中心的數據中心模式如何讓這大規模的海量數據具有實用性。