分布式存儲會一統存儲市場嗎?
近年來,隨著云、大數據、AI、區塊鏈等技術的發展,分布式架構在IT市場持續火熱,在存儲領域,分布式存儲蓬勃發展。
其中在AI應用最火熱的汽車自動駕駛研發領域,每個車企都需要對數百PB數據進行采集、存儲、分析訓練、仿真。
根據預測,到2025年全球數據將增長到175ZB,其中非結構化數據占比將超過80%,分布式存儲憑借高擴展性和易管理能力,成為承載海量數據的重要選擇。同時,在政府、運營商、金融等大規模云化數據中心,各大云廠商、分布式存儲廠商都在積極推動分布式存儲更廣泛地應用,替代部分傳統存儲陣列。
種種跡象表明,分布式存儲的春天已經到來。
- 一方面在新興爆發式增長的非結構化數據場景,分布式存儲表現出優秀的擴展性和大容量能力;
- 另外一方面,在傳統存儲陣列擅長的數據庫、虛擬機場景,分布式存儲大有全面替代之勢。
下面我們就來分析一下分布式存儲要想一統天下,還需要彌補的相較于傳統存儲陣列的三大差距。
從架構設計看,分布式存儲的優勢需要在大規模數據量下才能發揮出來
傳統存儲陣列采用Scale-up架構,評價其架構設計好壞的標準是在有限的處理器、內存資源下提供更高的可靠性和性能,管理更大的存儲容量。分布式存儲采用Scale-out架構,以處理器、內存、硬盤構成一個個獨立的擴展單元,其架構設計追求的目標是更大的擴展能力。
凡事都有兩面性,傳統存儲陣列在追求高可靠、低時延的同時,犧牲了擴展能力;分布式存儲在追求擴展能力的同時,每個節點都需要用一部分處理器、內存、網絡接口來處理和其他節點的IO交互,這也將消耗更多的硬件資源,從而導致相對較高的硬件成本,以及相對較高的時延。
十年前,傳統高端存儲陣列的性能僅僅在10萬IOPS水平,典配容量在百TB級別,而分布式存儲依托成百上千節點的橫向擴展能力,幫助企業輕松應對大數據、視頻等海量數據沖擊。
十年來,隨著存儲處理器、接口的性能逐代提升,性能百倍于機械硬盤的SSD閃存盤規模應用,傳統存儲陣列的性能和容量擴展能力得到長足的進步。在業界性能權威測試SPC-1排行榜中,存儲陣列性能已經突破2000萬IOPS。在傳統存儲陣列擴展能力已經高速發展的今天,分布式存儲和傳統存儲陣列的擴展性分水嶺將由十年前的百TB級提升到現在的PB甚至10PB級。
從價格走勢看,存儲陣列和分布式存儲的成本差距正在縮小乃至反轉
傳統的SAN、NAS存儲陣列給大家的另一深刻印象是讓人望而卻步的高昂價格。分布式存儲的這一價格優勢使其在全球存儲市場高速發展。
然而,在近期Gartner剛剛發布的“存儲和數據保護技術成熟度曲線”報告中,提到分布式存儲發展的一大阻礙是日益降低的傳統存儲陣列價格。確實,傳統存儲陣列每年都會有可觀的價格下降,我們看到,雖然企業的數據量快速增長,但傳統存儲陣列的市場銷售額增長相對平緩。
Gartner同時指出,存儲的日常管理成本也需要考慮。選用分布式存儲意味著企業的IT團隊需要重新學習新的存儲技術,采用標準服務器+存儲軟件的商業模式勢必需要用戶自己規劃、設計、維護相對復雜的存儲架構。
從全球分布式存儲市場來看,歐美發達國家的分布式存儲軟件價格已經不比傳統存儲陣列低,甚至高出許多。但從中國市場來看,專業的軟件價值沒有得到應有的認可,存儲廠商陷入比拼硬件成本的惡性競爭,導致分布式存儲價格畸形,從長遠來看,這其實并不利于分布式存儲產業良性發展。
從安全穩定性看,分布式存儲相比傳統陣列還有待于市場檢驗
隨著《數據安全法》9月1日正式施行,數據安全成為企業IT建設、安全穩定運行必須要考慮的事情。存儲作為“數據保險箱”對于確保數據安全至關重要,一旦因為存儲故障出現數據丟失,將給企業帶來無法挽回的巨大損失。
從穩定性上來看,傳統存儲陣列經過數十年的發展,在網運行時間長,經受住了各種應用場景的重重考驗,安全穩定性值得信賴。存儲陣列的數據保護能力也非常強大,包括雙活、3DC容災等,通過多種技術手段進一步保證數據安全。
數據是企業核心資產,對于政府、金融、運營商等對安全合規、穩定可靠有著異常嚴格要求的用戶來說,分布式存儲適用于10PB以上的大數據/Web應用/開發測試/桌面云等場景,大多數場景依然可以采用久經考驗的存儲陣列。從全球市場來看,擁有數十PB以上數據量的用戶屈指可數,主要集中在大型互聯網廠商、公有云服務商、大型IDC、TOP用戶自建數據中心。分布式存儲要想全面替代存儲陣列,還需期待全球數據的更大范圍集中。
從市場份額看,分布式存儲雖然快速增長,但存儲陣列還是全球主流
根據Gartner對于2020年全球外置存儲市場統計來看,主存儲(存儲陣列)發貨容量30ZB、銷售額157億$,第二存儲(分布式存儲)發貨容量13ZB、銷售額33億$。不難看出,無論是在發貨容量還是銷售金額,存儲陣列都遠遠大于分布式存儲。從未來預測來看,到2024年,分布式存儲發貨容量仍然低于存儲陣列,銷售額也只有存儲陣列的1/3左右。
分布式存儲要想一統存儲市場,還有很長的路要走
隨著海量非結構化數據的爆發式增長,分布式存儲有著非常好的發展前景,但從當前技術發展和市場應用來看,并不意味著就可以全面替代存儲陣列。全球主流存儲玩家,Dell EMC、NetApp、Pure Storage、HPE、華為、浪潮等還在深耕“傳統”存儲陣列。
存儲架構的演進,最終是要以滿足用戶的場景訴求為目標。分布式存儲不會,也不應該將自己的目標定位在替代已有的成熟的存儲產品,而更多應該把目光放在新興的更為廣闊的數據海洋。