處理海量數據:網絡規模存儲設計的好處
考慮到這種***的海量存儲需求增長的預期,大型企業正在開始部署網絡規模的架構:從而能夠實現大規模的虛擬化、計算和存儲功能。
增加存儲的靈活性
網絡規模的存儲設計的一個基本特征是消除存儲架構的瓶頸。一個單一入口點可能成為一個單點故障點,尤其是在云計算的存儲需求方面。添加冗余的、昂貴的、高性能的組件,以改善這些瓶頸問題,是目前大多數服務提供商正在努力的方向,但這會非常迅速地增加成本和系統的復雜性。另一方面,一個橫向擴展的網絡規模系統設計能夠使得在更便宜的、低能耗的硬件的所有節點之間分配數據。
因為云供應商要比企業用戶管理更多的用戶、具有更高的性能要求,因此,其解決諸如數據瓶頸這樣的性能問題的意義是相當重大的。雖然大多數企業用戶的系統均要求很高的性能,但這些系統通常僅僅只有較少的用戶,而這些用戶可以通過本地網絡直接訪問他們的文件。此外,通常企業系統用戶在訪問時,會發送和保存相對低容量的文件,如文件和電子表格等,他們所使用的存儲容量較少、也就降低了性能負載。
而那些在企業環境之外使用云計算的用戶會面臨非常不同的情景。該系統正在同時被相當數量級的用戶通過互聯網訪問,這無疑將互聯網本身變成了一個性能瓶頸。云提供商的存儲系統不僅必須擴展到每一位新增的用戶,同時還必須跨所有用戶確保總體性能。顯然,平均來說,云用戶的訪問次數要比一般的企業用戶更為頻繁,而且他們會存儲比企業用戶大得多的文件、音樂、照片和視頻。網絡規模架構的設計則能夠防止由這種傳統的舊式存儲設置所導致的瓶頸問題。
不受硬件約束
網絡規模體系架構的一個重要的區別是:其完全不依賴于硬件設備。由于硬件故障是不可避免的,而傳統的設備——存儲硬件通常內置專有軟件——包括多個昂貴的副本組件,以預測和預防故障。這些額外的硬件提取層在能源消耗方面會使用更高的成本,同時也增加了單一設備層的復雜性。因為較之商品化的服務器,每臺設備的實際成本是相當高的。當企業開始研究如何擴展他們的數據中心時,成本費用估算往往就開始扶搖直上。避免這個問題的一種方法是通過使用軟件定義的vNAS或在一個管理程序環境使用vSAN;二者均能夠提供以網絡規模速率構建服務器的方法。
分布式模型
與當前的集中式數據中心趨勢不同,構建網絡規模存儲的***方法是用一個分布式模型。這是因為現在有諸多的方法能夠在軟件層提高性能,以中和集中式數據存儲方法的性能優勢。
由于用戶是從世界各地不同地理位置訪問云計算服務,服務提供商需要提供遍布世界各地的數據中心服務,以盡量減少加載時間。不過,確保全球同步的訪問體驗也會涉及到一些挑戰。工作負載在企業所在地理區域的數據中心是活躍狀態。這種情況造成了一個問題,因為存儲在所有地點的所有數據都必須同步。從視圖的架構來看,在存儲層,而不是向上到應用程序層解決這些問題是相當重要的,否則其會變得更加困難和復雜。
此外,管理全球的可用數據意味著在發生本地災難事件的情況下,數據中心必須是彈性的。如停電事故,這會使本地服務器場脫機離線。如果一個地方的數據中心或服務器出現故障,全球數據中心必須迅速將數據傳輸到可用的服務器,以減少停機時間。雖然當然固然有很多解決這些問題的方法,但這些方法都是在應用程序層。試圖在數據中心的基礎設施的層次結構解決這些問題,而不是在存儲層解決,會帶來顯著的高成本和復雜性等缺點。直接在存儲層通過網絡規模架構解決這些問題,則提供了顯著的效率,時間和成本節約等方面的好處。
建設未來
大數據分析和移動化的到來無疑是預示著廉價的存儲需求會不斷增加的兩大趨勢。如果企業繼續在他們的數據中心依靠昂貴的、呆板的設備,他們將被迫付出大額支出,發展足夠的存儲容量,以滿足客戶的需求。
隨著市場需求的變化,網絡環境、企業的重點優先事項和預算也應隨之進行相應的調整。一個廣闊的、剛性的網絡環境鎖定外部供應商的配置會嚴重限制該企業靈活應對市場的需求,更談不上積極根據預期調整能力了。網絡規模的存儲理念使各大企業得以建立“面向未來”的數據中心。由于硬件和軟件的投資是彼此分開的,二者均可以調整到更好的,更合適的選擇方案,以***的成本滿足市場需求。
存儲的未來
較新的數據存儲技術,如超融合基礎設施和軟件定義的存儲預示了未來的需求:網絡規模的架構。他們將允許企業能夠規模化其龐大的計算環境,與虛擬化組件集成整合。網絡規模化的存儲設計,消除了硬件造成的瓶頸,提高了敏捷性和速度,也有利于全球數據的可用性,并提供更大的效率,帶來了時間和成本的節約。考慮到數據的快速擴散和隨之而來的存儲需求的增加,網絡規模的存儲設計是合乎邏輯的選擇。