數據丟失杯具 虛擬化的得與失
多數情況下,虛擬化問題將會引起部分數據丟失。這些數據很可能只是一些交易信息,但即使是很小的虛擬化問題也可能轉變為緊急的問題。
金融機構First Flight Federal Credit Union的COOTodd Erickson,回憶起了痛苦經歷,是涉及110TB數據的EMC Symmetrix存儲。
“時間是下午3:30分,當時有些日常維護工作在運行,此時約有500臺服務器與其連接的存儲發送了中斷,此過程大約持續了30秒,”他說,“這簡直就是杯具。”
如何防止數據丟失
為了避免有潛在的嚴重性事故發生,***的辦法就是用盡所能來解決虛擬化問題,在***時間就可以避免數據丟失和停機時間。在生產環境實施部署和修改配置之前,應對每一個應用進行長時間的模擬與驗證性測試。
將每個應用在近似于生產的環境下進行測試,以測量出它對各種資源的消耗。之后規劃它可以被分配到哪臺物理主機上,并提前預知此虛擬機將有可能被遷移和重啟在哪臺物理主機上。
“擁有一個[質量保證]環境是相當必要的,即便你無法在系統后端實現多路虛擬SAN,” I-Business網絡有限責任公司的技術服務總監Ty Hacker說。
像虛擬化供應商及其他已成功利用虛擬化技術的人員,就能夠利用各種技巧和***實踐方法來避免在生產環境部署過程中出現數據丟失,停機時間和其他由于虛擬化而帶來的問題。另外一種方式是對關鍵生產應用可采用虛擬化的高可用性(HA)技術來阻止其發生故障。
#p#
利用HA高可用技術以防止數據丟失和停機時間
這個技術應該包括服務器虛擬化技術,即虛擬機需要兩個以上的物理服務器來實現冗余,同時采用特殊的同步軟件來保證各實例的一致性,這樣其中一臺物理服務器發生故障,其他服務器也可以替代它。對于應用不太重要的工作負載,使用此技術可將發生故障的應用轉移到指定的服務器,或者可以在存儲間轉移故障應用。
系統管理員應定期測試他們的HA高可用環境,確定可以按期望的那樣運行,特別是當數據中心發生了任何變化時。例如,對于一個非常關鍵的應用,它由三臺服務器組成集群來提供足夠的性能開銷。測試這樣的場景,以確保當其中一臺服務器宕機后,其余兩臺服務器也可以提供必要的性能開銷。這可能意味著拔出網線或按一下電源按鈕都可以引發這樣嚴重的事故。
SAN冗余鏈路接入應該是任何虛擬數據中心的一個組成部分,而且它能夠對快照和復制技術產生積極的作用。但是也不要忽略服務器上本地存儲的重要性。
“我知道,虛擬化[部署]文章介紹了將會從SAN直接啟動,這里是不會出現問題的——事實上它也是,”埃里克森說。
具備可用的本地磁盤容量或者本地磁盤有實時鏡像都是很有用的,他補充說。
#p#
虛擬化:可行之路
由于還沒有找到切實可行的方式來在短時間之內恢復到虛擬化之前的備份狀態,所以大多企業為了避免問題的擴散,而先在非關鍵應用系統中實施虛擬化,獲得實施經驗,然后再按照步驟在更重要的一些應用系統中實施虛擬化。
最終,絕大多數的企業將完全走上虛擬化之路。
“在我的工作環境和另外兩個我工作的地方,在任何情況下,我們都不曾考慮以取消虛擬化來解決問題,”埃里克森說。
與其當虛擬化出現問題時進行分析,還不如先使用能夠提供深入觀察和控制的管理工具來制定出有效的排錯方法,只有這才能滿足IT的運維要求。
“需要非常熟悉相關命令,” Hacker說,“通過基于WEB方式或者客戶端管理工具都可以讓你直接連上主機。”
他補充說,在基于Citrix或者VMware環境平臺上,通過精簡的圖形界面管理端(GUI)是無法獲得主機大部分必要功能的信息。
盡管供應商可以提供資源來解決虛擬化問題,但是專家們警告不要過分依賴于它們。
“你的技術團隊中的相關人員確實需要了解虛擬化的內部運行原理,”埃里克森說。 “虛擬化供應商不會像你也一樣來關心你的業務和數據。”
對于任何虛擬化故障,IT人員應該是“***責任人”,因為它們可以迅速地解決相對簡單的問題。同時,他們也可以快速地與供應商溝通更加實質性的問題,這要比單純等待外來顧問到場解決問題更加有效。
在某些情況下,有第三方服務商或VAR來支持可能要比直接與供應商聯系更佳有效,特別是如果在你當初實施虛擬化時有VAR加入。如果有需要,VAR也總是會與供應商保持聯系。
【編輯推薦】