數據中心存儲必備三大件是什么?
信息技術不斷進步,全球數據量逐年遞增。據IDC公布的調查數據顯示,未來全球數據將維持50%左右的增長率,到2020年,全球數據總量將達到44ZB(十萬億億字節),中國將達到8.6ZB,占全球的21%。在數據量快速增長的背景下,容易生出一個疑問:這么多的數據,究竟都被存放在何處?今天小編想跟大家分享一下存儲這一塊的變化。
過去的存儲三大件,我歸納一下是三個東西。首先是購買一個SAN存儲做數據庫等業務;文件存儲和共享一般會選擇NAS;備份和歸檔一般會選擇帶庫。現在很多傳統的數據中心,基本還是這個存儲三大件。
那么現代數據中心存儲三大件是什么呢?我們先回過頭來看一下企業CIO面臨的挑戰是什么,接下來再來看存儲三大件。
首先,Gartner指出,現在是雙活IT的時代,“模式一”強調傳統應用穩定、可靠,“模式二”強調快速、敏捷。我們知道一個世界冠軍既是百米冠軍,又是馬拉松冠軍,現在好像還沒有,一個產品同時滿足這兩種場景也是很難的。
IDC提到了我們現在說的第三平臺。現在都是在從第二平臺像第三平臺轉型,EMC創造了一個概念——2.5平臺,這是一個轉型平臺。第二平臺相當于Gartner說的模式一,第三平臺對應的是模式二。目前,很多企業的投資都集中在第三平臺上,而第二平臺基本處于萎縮狀態,但是依舊占了很大的比例。而存儲在數據中心里面也比較重要,新的數字化轉型要求IT務部門要去思考一些新的需求。所以說,我認為數據中心三大件是服務器、網絡、存儲,而存儲應該是最重的。為什么?存儲在整個數據中心里的投資也許不是***的,但是它確實最“重”的,因為硬盤很沉。當企業數據量不是太大的時候,你也許沒有什么感覺。但是以后物聯網的發展會越來越快,數據量也會膨脹的越來越快。據分析師預測,每年數據會翻一倍。此時你會發現,更換存儲解決方案或存儲廠商非常困難。因為在數據遷移時,保證業務不中斷非常難。
第三平臺
下面我們來看一下存儲技術發展到了何種程度。IDC表示,企業存儲技術正在面臨閃存、軟件定義、融合、云計算四大變革。如果我們還繼續沿用過去的SAN、NAS、磁帶庫三大件,就不太符合現在的發展趨勢了。再看Gartner的存儲的成熟度曲線,我們看一下存儲三大件和這里面的哪些技術有關系。首先,變革性的技術有三個,正好符合三大件。***個是固態陣列,被認為是***變革的技術。第二個是數據重刪,他只是一項技術,被運用在不同的產品中。第三個是軟件定義存儲,先來看一個曲線圖,在這個Gartner的曲線圖當中,相比2015年有個很大的變化,它把軟件定義分為兩塊。一個是管理系統軟件定義,主要解決運維管理的問題,并不能真正解決“存”的問題。第二個是Infrastructure SDS,就是我常說的Server SAN,真正解決了“存”的問題。
第三個是什么呢?我們先繼續看這張曲線圖,每年的變化都會不同。2015年,這張上有個FCOE,今年消失了,那么就有兩種可能性,出局或者技術成熟,他就是前者。
2016年存儲技術成熟度曲線
剛才提到了全閃存,其實全閃存的發展比我們想象的要快很多。2016年9月的美國的閃存峰會,各個廠商都發布了全新的是硬盤。東芝要發布100TB的硬盤,其寫壽命為一個顆粒可以被寫9次,因此我判斷這個硬盤會很便宜。其量產后,裸容量也許比硬盤每GB的成本還要低,可被用于歸檔和備份等。
現在我們可以看到閃存的拐點比想象的要快。原來全閃存陣列只能用在一些性能的場景,如虛擬機、VDI、數據庫。現在全閃存的已經應用到一些通用場景,而且價格很低。備份歸檔,磁帶庫也許以后都不需要了。很多分析師都認為,2020年以后所有的生產數據都會放在閃存上。只有到了歸檔和備份階段,才會放到其他介質上。
下面我們看一下Server SAN的發展。紅色的部分是傳統存儲,趨勢也在收窄。Server SAN也分兩個方向。一個是企業用的,另外一個是互聯網用的。互聯網廠商很少購買存儲,他們基本都在使用Server SAN。現在在企業里面還比較少,但是未來會是一個方向,因為他是一個變革的技術。
Server SAN是2014年年初提出的一個概念,它集合了閃存、軟件、超大規模的優點,它代表了一個比較好的方向。很多時候我們認為使用Server SAN會很便宜,但實際應用中發現并不是這樣。但是它的彈性非常好,擴容非常簡單,響應時間快。比如業務部門對IT部門的要求是有很高的響應速度,你就需要考慮一個Server SAN的架構來滿足他們的要求。
接下來我們要想想數字化轉型的問題,數字化轉型其實很重要,當你把企業的全部業務數字化以后,那么你對可靠性的要求就高了。EMC全球數據索引顯示,11%的用戶將雙活用作數據的可用性手段。比如原來做一個備份就可以了,然而這種要求已經不能滿足目前的需求了。現在很多企業都是互聯網企業,要求業務24小時不能中斷。我個人比較推崇還是陣列的雙核。現在很多雙活是由網關來做,然而網關都比較復雜,比如用EMC的雙活,下面的高端存儲使用華為SmatriX,上面用Vplex。從管理的角度來看比較復雜,因為它是屬于兩套東西。如果是陣列雙活的話,硬件和軟件的維護都是一套東西,管理起來比較方便。目前日立率先做了雙活,華為、EMC也做了雙核,EMC還做了網關雙活和陣列雙活兩種模式。所以從高端存儲方面來看,雙活這部分我認為做得比較完善一些。
分析了這么多確實,我的觀點其實已經很清楚了,我總結的現代數據中心存儲必備的三大件是高端存儲、全閃存陣列、全融合SDS。他們幾乎完成了99%的需求。下面我為大家解釋一下為什么必須是三大件。
高端存儲到現在已經有25年歷史,從1990年EMC的SmatriX推出來到現在歷史超過25年。從Gartner報告看,高端存儲8項能力的得分,華為比較晚做高端存儲,評分也比較高。我們看到這個表里面,每個特性標桿基本上都超過4分,很少有3分,八大功能里面做得***基本都超過4分,基本是成熟的產品。
閃存陣列只有五年歷史,剛開始是2010年***代廠商,Fusion-io、tms、Violin MEMORY在做閃存陣列,但是沒有重刪和壓縮的功能。2012年,第二代全閃存陣列推出,增加了重刪和壓縮的功能,因此成本也降下來了。2014年,主流廠商紛紛推出全閃存陣列,可靠性方面也增強了,以及一些企業特性如加密、復制等功能。所以說我們看到看到Gartner對固態存儲的這個評價,相對高端存儲會有一些差距。***分只有3.9分,給了SolidFire。
所以說,對于我個人對于全閃存陣列的意見是,全閃存陣列很好,但是如果你的業務很關鍵,但是在搭建時還是使用高端存儲比較好。如果你6個9的存儲需求,建議你使用高端存儲。如果是5個9的需求,可以考慮使用全閃存陣列。當然高端存儲也可以考慮使用全閃存,其響應時間基本在1毫秒。如果采用全閃存,在重刪和壓縮全部打開的情況下,響應時間一般低于0.5毫秒。所以說時延還是不一樣的。
我們看一下一般關鍵場景(OLTP場景),我們把高端存儲和全閃存OLTP場景各個廠商的分數拿出來對比一下。高端存儲的***分是4.16分,全閃存是3.73分。也就是說在關鍵應用的場景下,閃存還是有一些差距的。
接下來我說一下軟件定義存儲,現在很多廠商都選擇開源廠商ceph,它的特點就是塊、文件、對象基本都可以支持。企業中這三個需求都會有,如果是三套管理相對比較復雜。
下面我總結一下我的觀點:
如果現代數據中心存儲只讓你選擇三大件。我認為要把關鍵的應用篩選出來,第二平臺的應用,如計費ERP還是要放到高端存儲上,可以搭配全閃存和雙活的安全應用。以及第三中心,保證它的可靠性,因為它有成熟數據服務,25年的歷史,支持傳統業務的穩定運行。但是,它的時延一般只能在1毫秒以下,而且一般不支持重刪、壓縮。所以針對第三平臺應用,使用全閃存陣列就可以滿足敏捷快速的要求。第三大件,就是統一資源池,采用SDS全融合云存儲。便于管理,支持塊、文件和對象接口,ZB級別規模,支持重刪壓縮,跨地域保護。
因此,我認為如果要建數據中心,我就會選擇這三大件,90%的以上需求都會滿足。當然如果希望做得更好,還可以選擇管理性的SDS,實現自動化的運維。