超融合基礎架構產生運維挑戰
將超融合平臺帶入企業數據中心會面臨一系列問題,因為之前網絡、虛擬化與存儲團隊是各自獨立的。
超融合基礎架構在虛擬化平臺當道的環境下挑戰很大。像所有結構性的演變一樣,對該環境如何運行產生影響。融合存儲與計算意味著雙方相互影響。在部署一個新的架構之前,明白運維成本很很重要。有些任務看起來很容易,其他的則很復雜或新簡直就是全新的。
在傳統的虛擬化架構中,虛擬機存儲在陣列中,這個平臺就只用于存儲,其他不管。該陣列應該隨時可用。陣列及其存儲網絡通常由自己的團隊管理,一般是存儲團隊。運行在hypervisor主機上的虛擬機共享到存儲陣列的訪問,一般經由一個專門的存儲網絡。該hypervisor與虛擬機由虛擬化團隊照看管理。保持存儲與計算的獨立能在一方發生問題時不牽連另一方。常見的操作挑戰源自于兩個獨立的團隊,大家相互不清楚對方的領域。理想中,兩個團隊該緊密合作,但在多數企業中這些團隊有沖突。在兩個團隊之間溝通配置請求與性能檢修復雜又緩慢。
在超融合基礎架構中,存儲與計算集成了。每個hypervisor主機有本地存儲,形成集群并擁有冗余的共享存儲。存儲集群是運行每個hypervisor主機上的軟件,要么是在hypervisor自身中,要么是在主機上的虛擬機中。這提供冗余,并讓數據跨集群分布以提升性能。數據塊跨多個hypervisor主機擴散,確保單個主機不可用時的數據可用性。多數超融合系統默認下對數據保存兩個副本。這種冗余存儲意味著集群的有效庫容是購買容量的一半。
管理在合并
超融合的另一個益處在于管理的整合。虛擬化團隊將管理計算與超融合存儲。一般地,這對于曾經虛擬化與存儲團隊各顧各來說有著積極意義。虛擬化團隊可以在需要的時候立即配置存儲,訪問他們所需的性能數據。挑戰在于虛擬化團隊必須學習存儲知識。多數超融合產品通過使用大量SSD提升性能,從而簡化了存儲管理。
移除主機
在傳統架構下,通過將虛擬機遷移到其他主機可以停止使用hypervisor主機。這需要花費幾分鐘時間,還有虛擬機的RAM必須通過網絡復制。
在超融合架構下,hypervisor主機也是存儲陣列的一部分。存儲在主機上的數據必須復制一份到主機,還有RAM內容也要復制。由于虛擬機磁盤通常是虛擬機RAM的數倍,該復制要幾小時,尤其是磁盤比RAM慢得多。
要將超融合主機移出集群,,又不損害數據保護,這比傳統主機花費的時間與精力要多。一種方式是將數據再復制一份。在維護時,數據部用心復制就能實現冗余存儲。當然,存儲數據的三個副本意味著只有全部容量的三分之一能用于存儲虛擬機。這就可能需要購買更多磁盤容量以實現快速維護。
超融合架構使用存儲集群的分布式特性交付性能。通常每個hypervisor可以請求整個存儲集群來交付性能。一臺不運行的hypervisor主機不再交付性能。存儲集群不在維護期間交付峰值性能。希望虛擬機工作負載不會在正常運行中將存儲集群推向極限。有時當存儲性能處于臨界點,可能無法承擔主機維護。
給主機打補丁
一個常見運營活動是給hypervisor打補丁。如任何軟件塊一樣,可以發現錯誤,需要部署補丁保護安全、性能與可用性。每臺主機必須停止使用,打上補丁并重啟后才能運行。在傳統架構中,有八臺主機的集群打補丁需要幾小時,每臺主機得15分鐘。有了超融合架構,每臺主機所需時間得幾小時,意味著八臺主機的集群需要一天時間打補丁。