VCenter監控可實現精細故障排除
如果VMware環境中出現問題,管理員可使用vCenter監控功能來收集數據,這些數據比傳統操作系統的數據更詳細。
通常情況下,IT管理員和經理會認為應用程序崩潰是由于VMware或者在虛擬化前從未發生的特定問題。然而,VMware的vCenter及其相關虛擬化產品給數據中心帶來革命性變化。
硬件是可以看到且可讓人觸摸到的東西,硬件令人放心。雖然很多企業已經擁抱虛擬化,但仍然有些人持懷疑態度。而通過利用vCenter監控和日志記錄功能,可讓虛擬管理員消除這種顧慮并解決問題。
VMware vCenter與傳統監控工具的運作方式不同。vCenter監控數據來自訪客操作系統下的網絡層,而vCenter和基于vCenter的監控工具(包括提取這些數據的第三方工具)直接在虛擬硬件級別直接查看操作系統層下面的情況。
傳統基于Windows的監控工具無法達到這種水平。Windows是從軟件驅動程序和API獲取數據,但這些數據依靠Windows對所見的解釋。這意味著,如果每個人都是用Windows工具而不是vCenter工具,那么可能會導致嚴重的混淆,因為不同的人會看到不同的數據。
這里明顯的例子是Windows內的內存使用情況。例如,分配有10GB內存的應用程序通常會在Windows工具(例如任務管理器和資源管理器)中顯示此信息。然而,分配的內存不同于使用的內存,并且,如果不使用VMware工具的Perfmon插件,幾乎不可能從Windows內確定這一點。
而vCenter監控使這項工作變得很簡單,因為虛擬機使用的內存不是真實的—而是基于軟件。這樣vCenter可區分已分配和正在使用的內存。盡管可能分配了10GB RAM,但可能只使用幾GB。如果應用程序所有者僅看到Windows數值,他們可能會認為虛擬機資源有限,而vCenter顯示的情況并非如此。
當工作負載被虛擬化,訪客方面通常會發生改變,但這通常是一種改進。這里的挑戰會從資源缺乏轉移到資源分配。
通過vCenter監控加強故障診斷
虛擬化故障診斷的關鍵是確保工作負載沒有在等待資源。當服務器專用于每個硬件平臺的一個應用程序時,那么,除升級外并沒有太多選擇。
在虛擬化環境中,規則是不同的。我們可以查看存儲中隊列深度等信息以查找I/O延遲的原因;檢查CPU就緒時間來查看虛擬機等待CPU訪問的時間以及它們是否受CPU限制;以及對比內存分配與正在使用的數值,以查看可能是什么在交換或緩存RAM。
所有這些vCenter監控設置都支持深度檢查,并可通過共享和資源池幫助調整資源分配。通常情況下,一個工作負載的變更可能會對另一個負載產生負面影響,畢竟,這是共享環境。
同時,性能指標可幫助解答有關日志和其他事件的問題。例如,虛擬機出現問題時,vMotion是否也同時發生問題?vCenter日志數據可以解釋當時發生的事件,但vCenter中的性能數據將顯示事件是否真正導致問題。這意味著我們可利用這兩者來全面了解正在發生的事情。
另外,請不要完全遺漏操作系統日志和事件。它們可幫助填補任何空白,但要注意硬件和性能方面,因為操作系統對這些方面沒有深入了解。
虛擬機管理程序給應用程序故障排查增添了另一層復雜性。但是,這個額外層可在應用程序和操作系統堆棧創建傳統硬件沒有的窗口。這里的挑戰是在這個層面整合數據以及進行適當調整。
總的來說,一個小錯誤可能會擾亂整個虛擬環境,因此,我們始終應該從小調整開始,而不是部署大規模變更。