數據推動變革 PMC創新存儲方案應對挑戰
原創隨著社會數據化發展,極大的數據量和非線性數據的增加,使得數據中心也處在不斷更迭的發展變化中,特別是超大型的互聯網數據中心,它需要能滿足多種商業模式(SaaS,PaaS或IaaS)以及應用的存儲架構,而國內的互聯網巨頭正通過采用創新方案引領發展潮流。
兩種部署模式:節點與整機架
在技術不斷演進的今天,數據中心的存儲硬件架構有兩種主流的部署模式:單節點部署模式與整機架的部署模式,這兩種模式派生出的體系結構具有顯著的不同。
首先,單節點部署模式的節點單位資源不共享,整個設計理念是基于簡潔的設計,通過增加節點數目來實現幾乎是無限的可擴展性;而整機架模式則是把整個機架當成一個部署設備,以實現機架級的資源池化。
其次,對于節點模式而言,數據中心用戶會非常關心這一臺服務器的性能是否最高,功耗是否最低,成本是否最低等等。而在整機架部署的模式,數據中心用戶除了關注這個節點每一個服務器本身之外,還要考慮整個資源池的配置靈活度,怎么樣去實現這樣的靈活度,以及如何提供足夠的互聯帶寬來支撐這種解耦合。通常來說,對于業務模式相對單一的互聯網公司例如優酷這樣的視頻網站來說,他們會更關注單節點部署的模式,而對于像騰訊、阿里巴巴這種業務模式多樣化的公司而言,傾向于通過資源池化進行整機架部署。
然而這些不同,最終具體體現在組成服務器或整機架的芯片、器件和板卡差異化需求。 針對節點模式,為了覆蓋各種不同的應用,就會出現有多種種類的服務器節點,包括:有的是計算很強,可能需要SSD,但是數量存儲容量不一定很大;或者是存儲容量非常多,計算的性能并不是那么高等。針對整機架模式,因為存儲資源和計算資源已經解耦合了,這極大減少了服務器的類型,僅有的類型差異也僅限于計算性能或者內存這些因素不同,而存儲作為一個變量就從服務器設計中剔除了。但是,整機架部署涉及到更復雜的系統級的體系結構,也就是說整機架部署的復雜度要遠高于節點模式,有賴于數據中心用戶、ODM\OEM以及PMC這樣的方案提供商之間的協同合作。
◆單節點模式部署
在目前主流的單節點部署中,由于服務器的應用場景多樣化,導致服務器的多樣性,各種不同類型、型號、盤片數量等。為了應對這樣的多變,PMC推出了高端口數的IO控制器以及擴展器,以覆蓋數據中心、OEM/ODM所需密度。另外,為了幫助數據中心用戶實現降低功耗,降低成本,PMC將芯片、擴展器件做到最低的成本,最低的功耗,最高的端口密度。更重要的是,通用的硬件和軟件設計,幫助OEM/ODM實現各種各樣的產品種類。
因為如果每一個不同類型的服務器都要不同的硬件設計方案,不同的驅動,不同系統去測試,對于OEM\ODM的研發周期以及相應投入的成本都非常高,而PMC作為方案供應商,根據多年與OEM和ODM的合作經驗,也非常關注這個問題,并通過保證SAS/SATA高端口數、智能化HBA、簡化IOC,支持多種RAID以及更多創新設計等,將產品系列作為一個組合,而具備通用的硬件和軟件設計,為OEM/ODM提供設計上的便利。
此外,PMC也會與數據中心客戶直接合作,這也是因為數據中心用戶經常會面對很多應用場景,由于時間所限,其定制周期非常短,這就需要板卡級的產品,而PMC也可以為這方面提供很多選擇。
◆整機架模式部署
為單節點部署提供通用平臺方案的同時,PMC也看到了整機架部署的發展趨勢。早在兩年前,PMC就提出并推動了FDIO的概念,也就是目前業界基本上都認為的一個共同的發展方向——機架級解耦合。
在機架級進行解耦合后,就實現了計算、內存、存儲的資源池化。那么在配置的時候,數據中心用戶只要考慮CPU、硬盤/SSD數量,然后通過軟件策略來實現資源配置,重新組合計算、存儲,以匹配應用需求。當然,PMC認為第一步是從靜態的解耦合開始,主要是為了減少服務器的類型,這樣數據中心用戶至少在機架設計的時候,只是關心CPU和內存,以及在組裝這個機架的時候,可以擺放多少個盤進去,以實現CPU和盤之間,這種物理資源的任意配比。然后,第二步通過在云平臺或者云操作系統和資源管理層進行整合之后,數據中心用戶可以動態地進行物理資源的綁定,也就是說這個不再是一個簡單的一對一的關系,而是根據業務以及這個節點的故障情況動態地調度這個業務,實現最優的TCO。
較之于vSAN等軟件實現手段,PMC提出的解耦合著力在硬件層面的實現,這就導致了性能有較大差異。目前SAS每個連接都是12G一個HBA出口就是8個端口即96G的帶寬,但是如果是軟件形式放在以太網上,就是算是部署萬兆網卡,也有10倍的差別,更不要說這些協議對CPU的額外開銷。
當然,解耦合也帶來一系列其他的好處,比如說當盤從服務器里頭挪掉之后,機械設計可以得到優化,服務器本身就做得更小。針對于空間有限的數據中心用戶而言,就可以在同樣的空間里擺放更多的服務器。同時,這樣也極大地減少了不同業務類型所需要不同的服務器種類,在做整體數據中心的硬件資源管理時就會比較簡便。此外,還可以實現共享啟動盤等復雜的數據保護,不會因為啟動盤損耗,導致節點丟失,而且當操作系統集中化后,也給管理和升級帶來了便利性。另外,這樣也可以實現工作負載的任意遷移等,這些模式都可以帶來一系列TCO的改善。
這樣的設計其實從兩年前PMC剛提出來時,發展到今天已經可以實現了。PMC認為利用今天非常成熟的SAS技術,至少在機架內,任意資源任意規模的解耦合其實已經可以實現。大體設計為,多個服務器節點,而這些服務器其實已經沒有硬盤了,它們之間通過SAS HBA連到一個SAS Switch上面去,再連到一系列提供盤資源的高密度JBOD,這個構架非常簡單,利用了基于工業標準的SAS分區技術,可以實現以盤為單位的資源動態分配,在系統設計上實現每一種資源類型的性能和密度優化。采用SAS主要是因為各個部件都非常成熟,目前所有服務內都采用了這種技術,而且這些器件都是久經考驗的,PMC只是在控制平面和系統設計上做了不同的實現。
目前,PMC正在和產業鏈的合作伙伴一起在推動這個構架的實現,包括和天蝎計劃的主要廠商一起合作。但PMC的終極理想并不在于此,更遠景的來看,這樣的SAS的Fabric是否能演進成PCIe的Fabric,現在PMC也是在做研發工作,希望不遠將來可以將這些更終極的方案介紹給大家。