不要讓系統管理軟件問題成為障礙
系統管理軟件通常收集虛擬服務器硬件的關鍵性能數據,包括處理器數量、處理器使用率、內存大小以及其他參數。多數情況下,被收集參數的系統來自本地以及遠程數據中心,數據經過處理并制作成報表,這樣IT管理員就能夠了解當前的計算狀態以及錯誤趨勢。但有些情況工具無法收集系統的某些或者所有硬件性能數據,IT管理員必須解決這些配置或者兼容性問題。本文重點強調可能導致問題的三個主要方面:軟件支持、硬件支持以及網絡連通性。
軟件支持問題
盡管很多系統管理工具都能夠獲取眾多硬件的性能指標,但是系統處理以及硬件識別并非總是自動的,尤其是在異構數據中心更是如此。某些系統管理工具(比如IBM的Systems Director)為了發現可用的系統以及相關的組件必須先執行正式的硬件存盤操作,而管理員在安裝完新系統后可能會忽略該操作。
系統管理工具在更新方面存在重大差異,因此應該經常參考管理軟件的文檔以了解有關硬件存盤程序及注意事項的相關指南。在收集性能指標之前可能需要花幾分鐘的時間來完成存盤并更新系統管理工具的數據庫。
在其他情況下,在系統管理軟件、hypervisor以及數據中心之間可能存在更為嚴重的兼容性問題。硬件平臺的設計不同而且提供了不同的性能套件,因此單個軟件工具獲取所有系統并報告相同的性能指標幾乎是不可能的。需要了解管理軟件廠商并對當前軟件工具的硬件兼容性進行驗證。
在另一種情況下,hypervisor可能存在兼容性問題,而非服務器硬件。例如,無法感知虛擬化的較舊的系統管理工具可能無法獲取被虛擬服務器的硬件性能指標。在其他情況下問題可能出在特定hypervisor或者hypervisor版本兼容性方面。例如,支持VMware ESXi的系統管理工具可能并不支持Citrix XenServer。
無論是硬件還是hypervisor存在兼容性問題,解決方法都一樣——尋求升級系統管理廠商提供的軟件來解決該問題。
硬件兼容性問題
如果系統管理工具無法獲取特定服務器型號的性能指標,問題可能出在軟件工具沒有與異構數據中心全面兼容。管理工具首次部署或者硬件更換之后通常會出現這類問題。
問題在于單個軟件可能無法為任意規格的服務器提供相同粒度的性能指標——這為管理異構數據中心帶來了某些挑戰。該問題通常不會在同構數據中心內出現因為系統管理工具只需要應對一種或者少數硬件平臺。
如果問題是在部署完軟件工具后才出現的,那么企業不可能收回在管理軟件上的投資也不可能花更多的錢取代存在問題的硬件,因此這時唯一可行的解決方法就是尋求其他的部署方式。例如,在有問題的系統上部署代理而不是依賴于裸金屬安裝以及硬件自動識別。和軟件廠商進行協商來解決該問題,采取變通的方法,也可以要求廠商在今后進行軟件升級來解決該問題。
你可以提前使用代表部分生產系統示例的測試環境對系統管理工具進行測試來避免該問題。
網絡連通故障
如果硬件或者hypervisor兼容性不存在問題,那么網絡連通問題或者配置不正確可能導致性能報表數據存在問題。工具初次部署,在系統故障恢復后對服務器進行刷新時可能會出現這類問題。
例如,系統管理通信的網絡配置通常是通過代理進行的——如果代理配置的不正確(例如系統管理服務器的IP地址配置錯誤),那么服務器將無法獲取性能數據。在獲取遠程系統的性能數據時需要引起注意。你可能需要顯示地啟用系統管理軟件來收集遠程系統的性能數據。在其他情況下,需要查閱系統管理軟件的文檔并按照廠商的建議對系統進行配置。
最后,一定要檢查系統管理服務器的安全連通性。例如,管理服務器可能使用Secure Shell對通信管理進行加密,但是這首先需要在管理服務器上啟用SSH服務。如果SSH服務啟動失敗,那么工具可能無法收集任何性能數據。
虛擬服務器的綜合管理涉及收集,處理并報告表明系統健康狀況及資源利用率的關鍵性能指標。但是部署一款在所有的系統上提供相同的性能指標的管理軟件可能面臨著嚴峻的挑戰。了解了引發數據收集問題的常見原因,IT專業人員就能夠更好地排除故障了。