NEC ExpressCluster化解中國電信IT之憂
越是跟生活息息相關的業務,人民對客戶體驗的要求越高,對出現故障的容忍度越低。在某種程度上說,未來電信運營商取勝的法則不再是電信資源,而是服務和客戶忠誠度,隨著企業規模的擴大,業務類型日趨復雜,其運營過程對信息化依賴程度也日漸加深。電信網絡不容許存在任何單點故障的隱患。
客戶忠誠度取決于什么?產品和商業模式雖然是最基礎的需求,但是未來的服務和客戶體驗,絕對是超越產品本身的決定性因素。三大通信巨頭的中國電信,就首當其沖的面臨著這一重大問題。
隨著企業規模的擴大,業務類型日趨復雜,中國電信的運營過程對信息化依賴程度也日漸加深。這個中國的大型國有通信公司,每次IT系統的升級改造都是天價的投入,只為了系統再穩定一點點,業務反應再迅捷一點點。系統穩定和信息安全重如泰山,不論是主機內存、硬盤、CPU還是系統和應用的一絲一毫隱患,都會對電信業造成致命危機。
電信轉型之困 ——如何建立穩定連續的IT架構
電信網絡不容許存在任何單點故障的隱患,而就中國電信本身的發展而言,目前阻礙通信網絡中的網絡系統的幾大障礙,包括有主機內存的損壞,主機硬盤的損壞,主機CPU的損壞以及主機系統受病毒影響而導致宕機。從這四點來看,中國電信,為了維持系統穩定性,減少業務中斷風險,打造雙機互備的共享型集群架構的高可用性方案勢在必行。
從2008年開始,中國電信在不同的部門中和不同的產品線上前前后后對這類雙機互備解決方案做了近2年多嚴格測試,基于兩年來的通力配合效果顯著,在2010年下半年,中國電信與NEC達成了合作,決定采用ExpressCluster解決方案來保護核心網的網管系統,這是在系統連續性上取得的一個重要突破,有別于傳統的雙機或多機熱備方案必須通過磁盤整列共享數據的傳統模式。IT系統從原先高成本的人工運營方式向自動化、穩定性更高的容災運維模式發展。
ExpressCluster X的以下特點受到中國電信的青睞:
1. 支持最多32個節點的集群,這樣可以充分利用服務器資源。
2. 基于Web的遠程監視能力,能夠方便地對服務器集群進行管理。
3. 能夠在兩臺服務器之間做數據鏡像,實時保護網管和oracle應用,搭建成Active-Standby的熱備結構,通過高可用集群軟件ExpressCluster X實時監控服務器運行環境。
4. 一旦發生故障,數據庫可以在ExpressCluster X的控制下自動切換到備機運行,避免故障引起的系統停機。
5. 在發生下列故障時可以自動切換服務器:服務器關機/掉電、OS死機/掛起、存儲I/O異常、應用程序或oracle服務停止、網卡異?;蚓W絡中斷 、ExpressCluster X自身進程異常、特定故障(用戶自定義監控程序)。

通過磁盤鏡像技術,中國電信核心業務系統的高可用性級別達到99.99+%;保證雙機或多機系統中的所有節點數據完全同步,避免了宕機之后的巨額損失;這種數據共享的模式在減少磁盤整列采購成本的同時,降低了中國電信整個系統的用電功耗,節省了機房占地面積,大大提高系統集成度,非常符合當前運營商“綠色運維”的環保理念。