深入DellWorld2015:SC9000存儲軟硬件更新解密
軟件定義的存儲(SDS)是當前火熱的名詞,不知大家是否記得早在數年前就有傳統磁盤陣列廠商提出“存儲即軟件”的說法?
如今的軟件定義存儲,無論是像VSAN、Ceph這樣的分布式架構,還是Nexenta ZFS這種單/雙控集群架構,更多意義上強調的是軟硬件解耦。而傳統企業級集中式存儲,雖然仍是軟硬一體銷售的模式,但核心硬件組件——包括CPU等也早已趨于同質化。因此陣列的操作系統,或者說Firmware就像是它們的大腦,直接反映出不同品牌/系列的差異化,也是核心價值所在。
對于存儲陣列產品的升級,軟硬件不一定完全同步。硬件平臺升級,基本上會帶來性能、擴展性的提高;而軟件升級則可以增加/完善更多的功能、修復bug等。
這一次,戴爾SC(Compellent)陣列的SCOS 6.7操作系統升級走在了硬件前面一點,而當Dell World 2015上正式推出新一代高端產品SC9000,則給我們帶來了更大的驚喜!
Dell Storage SC9000
①控制器硬件換代,CPU由每控制器2個6核升級為2個8核,同時提高主頻;②內存增大4倍,由最大128GB提高到512GB(雙控制器);③后端驅動器接口由6Gb/s SAS升級到12Gb/s,增加支持SC400(2U 12x3.5”)和SC420(2U 24x2.5”)兩款12Gb/s SAS擴展機箱;④最大IOPS提高40%,帶寬增加110%。
如果說硬件更新是驅動性能提升的主要因素,軟件優化和新增的強大功能則離不開系統軟件的升級。下面我們就來深入解讀Storage Center 6.7的更新:
1、全新高端型號控制器(SC9000)、擴展柜支持2、針對SC8000/SC4020的更新帶有自動切換(Auto-Failover)的Live Volume增強型壓縮從PS系列精簡導入(Thin Import)針對Oracle的應用保護管理器(APM)
Live Volume讓容災切換更加自動簡單
這個是戴爾Live Volume架構示意圖。最新的Storage Center 6.7能使Compellent更好地支持雙活和兩地三中心的切換,并通過VMwrae相關認證。
同時我們也想補充提醒一下大家,支持自動切換不代表該功能就適合所有場景,許多時候還是需要人工干預。什么情況下應該切?會不會誤切?這已經不只是技術范疇,而是管理者要思考的問題了。
戴爾Live Volume已經通過VMware vMSC(vSphere Metro Storage Cluster)的認證,也就是可以接近于在本地數據中心的一套陣列上那樣進行虛擬機的HA切換、vMotion遷移等操作。
關于同步復制/雙活對網絡帶寬和延時的要求,比如有的公司宣傳其存儲雙活用于VMware集群可以支持300km距離,戴爾也一樣能實現。因為光速(光纖延時)對大家都是平等的,而實際線路質量則參差不齊,所以還有傳輸設備等其它需要關注的因素。比如我們建議同步復制的延時不超過5ms、40km以內,是為了減少對實際應用和性能帶來的影響。
獨特閃存數據縮減技術如何做到性能不下降?在Storage Center 6.5-6.6版本,戴爾已經引入了針對分層存儲的最底層不活躍數據的壓縮功能,可以有效節約“冷數據”占用的磁盤空間。
為什么戴爾宣稱這個“增強型壓縮”能夠保持最大性能呢?我們認為該技術仍然遵循著久經考驗、廣受好評的Data Progression自動分層存儲的一貫原則。
永遠寫入高性能分層遷移后數據的讀性能不因為閃存類型和RAID級別而下降1.在單層AFA上,原始數據按照RAID 10寫入,待生成Replay快照凍結數據塊之后,RAID分層將其轉換為RAID 5/6并同時完成壓縮。所有后續寫入仍然以RAID 10方式,而RAID 5/6的讀性能不低于RAID 10。
注:之前有存儲廠商的實時壓縮技術號稱“不影響讀性能”,言下之意就是寫性能還是有影響的。當然這個也與數據類型有關,不排除特殊數據樣本下(比如接近全0或者全1)壓縮后實際寫入量很少反而更快的情況。
2.在閃存分層的配置下,原始數據按照RAID 10寫入WI SSD分層,待生成Replay快照凍結數據塊之后,Data Progression將其遷移至RAID 5/6的RI SSD分層并同時完成壓縮。所有后續寫入仍然以RAID 10方式進入寫密集型SSD,而讀密集型MLC/TLC SSD的讀性能可達SLC/高耐久度eMLC水平,RAID 5/6的讀性能也不低于RAID 10。
戴爾SC陣列的增強型壓縮,通過與自動分層存儲相結合,其壓縮動作成為定期執行的后臺任務,從而有效避免了對寫入性能的影響。同時,在不額外添加專用硬件的情況下,高效壓縮算法保證了讀性能不下降。
可能有人會問單層AFA中的RAID 10部分,以及T1 WI SSD中的數據得不到壓縮怎么辦?我們應該注意到,這些數據在整套陣列中所占的比例是較小的。得益于戴爾SC系列的軟件架構設計,它們通常只需要容納一天~幾天寫入的數據量即可,所以我們不用擔心整體的壓縮效果。
如上圖示例,在SCOS 6.7版本之前,對橙色部分“凍結的不可訪問數據頁”(不包括卷最新狀態中的數據,只被歷史Replay快照引用)的壓縮回收了6GB空間;而SCOS 6.7新加入對“凍結的可訪問數據頁”(只讀Replay快照數據)壓縮回收了12GB空間;允許寫入的“活動數據頁”不適合數據壓縮。這樣整體節約的容量就是51%。
關于戴爾Data Progression自動分層存儲的原理,包括上述不同數據分層的定義及管理策略等,可以參考冬瓜哥大作《存儲極客 | 淺析固態介質在存儲系統中的應用方式》。
與PS系列軟件融合精簡導入互連互通所謂Thin Import,是指在戴爾PS(EqualLogic)陣列上的thin-provisioning精簡配置卷,能夠保持“瘦身”狀態導入(遷移)到SC系列上。只需要拷貝實際寫入過的數據塊,而不是前端主機看到的整個LUN容量。導入到SC陣列之后的卷仍然保持精簡格式。
這種精簡導入,建立在戴爾自主知識產權的產品系列間部分代碼復用的基礎上。戴爾在SC、PS等自己的品牌系列不僅擁有完整的自主知識產權,而且還有著自主研發的能力實現產品系列的數據整合。
快照管理器為Oracle數據庫保駕護航在Storage Center 6.7之前,戴爾SC系列的Replay快照已經能夠與Windows平臺下的SQL Server、Exchange Server、Hyper-V以及VMware Hypervisor配合,實現具備應用數據一致性的快照,有效改善了恢復效果。針對Oracle,可以通過編寫腳本在快照創建之前通知數據庫將內存中的“臟數據”寫盤,并且有過一些成功實施的項目。
那么我們來看一下新版軟件的變化:APM for Oracle允許Oracle管理員在沒有存儲或者數據庫管理員幫助的情況下,保護和恢復他們的數據;APM包含在Enterprise Manager 2015R2管理軟件中;提供Windows客戶端和Linux代理。
這方面也有點類似于Live Volume的自動切換,都是把自動化功能集成到圖形管理界面,讓存儲生成Oracle數據庫一致性快照的配置操作更加簡單易用。而這些也正是商業存儲與開源軟件定義存儲的差別體現,只有真正成熟、穩定的才能稱之為產品,而不是在部署和運維上需要大量踩坑的項目。
展望未來值得期待據了解,在戴爾存儲未來的Roadmap上已經規劃了SC家族的一系列軟硬件更新。我們相信,本次發布的SC9000有實力延續Compellent的輝煌!