從支付寶故障看服務器擴容三:事后評估篇
原創【51CTO獨家特稿】我們在上一篇文章中介紹了服務器擴容的事中實施,詳細介紹了服務器擴容的過程。不過服務器擴容完畢,事情結束了嗎?NO,擴容的結果只是證明我們目標達成了,至于這個服務器擴容是否真正的完美無瑕,我們還需要做一系列的評估與驗證。
服務器擴容事后評估篇A、數據驗證
關鍵的一步!服務器擴容是為了滿足當前日益增長的信息與數據要求,而如果因為服務器擴容而造成數據的流失這還不如不進行擴容改造!所以我們在擴容完畢后首先要驗證數據的完整性和正確性,一個數據也不能丟失,這是唯一的要求,也是必須的要求。
服務器擴容事后評估篇B、服務驗證
假如我們這次擴容增加了5塊SAS硬盤,前期工作我們已經驗證了這次增加的有效性和可行性,但是這并不意味著此次增加就完全高枕無憂,我們還需要在擴容完畢后在功率上、使用效率上、整體性能上作出綜合的評價,擴容是否給我們帶來實質性的提高?需求我們是不是得以滿足?都需要驗證。
服務器擴容事后評估篇C、數據中心整體評估
這是一個全面考量的過程,如果增加了10片刀片,數據中心所需要的電力消耗必然會大幅提升,成本是一個方面,我們需要關注,但是我們更關注的是UPS的動力、支撐能力,一旦出現UPS負載過高的情形,增加UPS將是必不可少的,整個增加過程自然是前期工作,但是也需要我們后期驗證作保證。
另外,我們還需要借助無線紅外熱感系統來監控整個數據中心的溫度變化,一旦出現居于溫度過高的現象恐要危及到其他的服務器,這也是我們在擴容完畢后需要監測與改造的。
服務器擴容結語:
服務器擴容不僅僅是考查IT運維團隊的技術水平,也在驗證這個團隊的細致程度。在這個過程中,我們一定要在前期做足功課,在部署過程中膽大心細,不要擔心問題的發生,遇到問題解決問題,當所有的case都完成后,做出近乎苛刻的測試,在用戶發現問題前搞定它,呈現給最終用戶的必須是最好的。
如果能注意到這些服務器擴容的問題將不再是問題。
【編輯推薦】