S12500全面打造數(shù)據(jù)中心級的可靠性
【51CTO.com 綜合報道】對數(shù)據(jù)中心使用的交換機而言,高可靠性毋庸置疑是一項基本需求,設備中所有功能和特性都是建立于可靠性基礎之上的,脫離高可靠性而談其他特性,就像建在沙子上面高樓,好看不實用。一個缺乏高可靠性設計的網(wǎng)絡系統(tǒng),輕則使得維護工作量增加,重則帶來巨大的經濟損失和政治影響。
尤其在當今,互聯(lián)網(wǎng)已滲透到社會中各個領域的時代中,網(wǎng)絡是否穩(wěn)定可用,決定著生產業(yè)務是否可以有序的進行,特別是IT系統(tǒng)的核心位置--數(shù)據(jù)中心的網(wǎng)絡設備,高可靠性更是必須重點考慮的特性。
那么面對數(shù)據(jù)量飛漲和服務質量要求不斷提升的現(xiàn)狀,數(shù)據(jù)中心級的設備究竟應該具備怎樣的高可靠性?在這一點上,H3C于今年發(fā)布的國內首款基于100G平臺的數(shù)據(jù)中心級核心交換機S12500,全力打造數(shù)據(jù)中心的高可靠性,給我們提供了有力的參考依據(jù)。
不丟包——可靠性“最高境界”
要弄清楚網(wǎng)絡設備應該具備怎樣的高可靠性,我們首先要明確網(wǎng)絡的可靠性應該如何衡量。H3C網(wǎng)絡產品線副總裁孫德和介紹,一個令人放心的網(wǎng)絡首先不能頻繁出現(xiàn)故障,IP承載網(wǎng)即使只出現(xiàn)很短時間的中斷,都會影響業(yè)務運營,特別是時性強、對丟包和時延敏感的業(yè)務,如語音、視頻和在線游戲等。其次,高可靠性的網(wǎng)絡即使出現(xiàn)故障,也應該能很快恢復。如果一個網(wǎng)絡一年僅出一次故障,但這次故障需要幾個小時,甚至幾天才能恢復,那么這個網(wǎng)絡也算不上一個高可靠的網(wǎng)絡。
因此,故障次數(shù)少、恢復時間短兩個特征是高可靠性網(wǎng)絡的重要特點,我們一般用平均無故障時間(MTBF:Mean Time Between Failures)和平均修復時間(MTTR:Mean Time To Repair)這兩個概念來對其分別加以對應。也就是說,如果要提高網(wǎng)絡的可靠性,一方面要提高網(wǎng)絡設備硬件和軟件本身的質量,另一方面,以最快的速度發(fā)現(xiàn)故障,并快速從故障狀態(tài)中恢復出來,從而減小MTTR來實現(xiàn)網(wǎng)絡高可靠性。
但孫德和強調,無論是提高MTBF或者降低MTTR,都無法完全保證網(wǎng)絡不出現(xiàn)任何故障,對于網(wǎng)絡可靠性的“終極目標”來說,要讓用戶對網(wǎng)絡系統(tǒng)徹底放心,只有實現(xiàn)數(shù)據(jù)轉發(fā)的丟包率實現(xiàn)“0”,才能讓系統(tǒng)能夠始終保持穩(wěn)定,保證業(yè)務的連續(xù)性。這是網(wǎng)絡可靠性的“最高境界”,也是所有網(wǎng)絡設備力求達到的目標。
提高可靠性“三條大道”
明確了網(wǎng)絡可靠性衡量標準,那么具體到網(wǎng)絡設備而言,究竟要朝哪些方向努力,才能盡可能得到更高的可靠性衡量值呢?作為IP網(wǎng)絡領軍者的H3C在這個問題上,有著十分明確而嚴格的答案。H3C網(wǎng)絡產品線副總裁孫德和表示,要想提高網(wǎng)絡設備的高可靠性,主要需要圍繞著以下四個方面來展開。
首先是網(wǎng)絡架構的高可靠性,一個普通的二、三層網(wǎng)絡和一個虛擬化網(wǎng)絡架構相比,其整體的可靠性、可用性是有天壤之別的。S12500作為網(wǎng)絡核心,其組網(wǎng)形式決定了整個網(wǎng)絡的基礎架構。目前包括S12500在內的H3C全系列交換機都支持IRF2虛擬化特性,通過IRF2架構一個全新的虛擬化網(wǎng)絡,不僅擴展了設備的端口數(shù)量和交換能力,提高了的可擴展性和可管理性,更是大大增強了整個網(wǎng)絡的可靠性、可用性。
其次是單設備的高可靠性,主要是指網(wǎng)絡設備在系統(tǒng)設計和硬件架構上具備整體的高可靠能力,具備硬件的物理可靠性和系統(tǒng)部件的冗余能力,面對復雜環(huán)境能保持“不壞金身”,S12500產品在設計之初就旨在給客戶提供數(shù)據(jù)中心級的高可靠保證,各個關鍵部件都支持1+1,甚至N+M的冗余。。另一方面,S12500系列交換機采用創(chuàng)新的交換矩陣與路由引擎相分離的多級交換架構,路由引擎1+1冗余,專用于系統(tǒng)控制和協(xié)議計算,交換矩陣N+1冗余,專用于數(shù)據(jù)轉發(fā)。把交換機最重要的兩個關鍵部分硬件分離,各司其職,避免相互影響,整個系統(tǒng)可靠性極高。
第三是設備的軟件可靠特性,S12500通過BFD高可靠檢測技術可以和VRRP/RIP/OSPF/ISIS/BGP等網(wǎng)絡協(xié)議聯(lián)動,支持IP FRR、MPLS TE FRR,均實現(xiàn)50ms的快速收斂;同時S12500還支持NSF技術、GR技術以及物理層和鏈路層高可靠性技術,使得S12500能為各種復雜業(yè)務提供保障。
最后是軟件維護的高可靠性,主要是指設備在軟件bug修復或者版本升級過程中,不會影響到設備的正常運行,在保證軟件正常升級的同時,確保設備運行的穩(wěn)定性,提高軟件維護的易用性。在S12500的可靠性特性中,就是通過在線熱補丁技術來提升軟件維護的可靠程度,避免可靠性“短板”的出現(xiàn)。
H3C孫德和表示,一直以來,H3C對設備的可靠性都十分重視,并配備了專門的研發(fā)團隊對產品的可靠性設計進行“攻關”,并取得了十分顯著的成績。例如在歷次的思博倫測試中,H3C的各種網(wǎng)絡設備在可靠性方面均有著突出的表現(xiàn),就充分證明了這一點。
S12500:高可靠性的標桿
在上面我們從理論上討論了提高網(wǎng)絡設備可靠性的方法,而最能證明這些理論的,就是高端網(wǎng)絡設備的實際表現(xiàn)。我們可以以主要針對數(shù)據(jù)中心核心應用的交換設備S12500為例,來實際感受一下網(wǎng)絡的可靠性可以達到何種程度。
“100%吞吐量和零丟包,這是S12500在高可靠性方面最突出的表現(xiàn)。”H3C網(wǎng)絡產品線副總裁孫德和介紹,在2009年6月H3C基于業(yè)內權威的思博倫平臺對S12500進行的性能測試中,S12500極高的可靠性令所有人驚嘆。“測試結果證明,S12500在二層單播、三層IPv4單播、三層IPv6單播、三層MPLS轉發(fā)等多種情況下,均能實現(xiàn)100%吞吐量和零丟包,一舉創(chuàng)造了業(yè)界核心交換機MPLS整機全線速轉發(fā)的測試記錄!”
我們知道,在數(shù)據(jù)中心等核心網(wǎng)絡應用中,網(wǎng)絡設備面臨的數(shù)據(jù)壓力非常之大,在這種工作狀態(tài)下設備是否能夠“頂住壓力”,是維持網(wǎng)絡正常狀態(tài)的關鍵因素。S12500的高可靠性正是應對了這一需求。
值得一提的是,H3C在保障網(wǎng)絡高可靠性的一個重要“殺手锏”——第二代智能彈性架構技術IRF2。這是是H3C在第一代智能彈性架構技術基礎上持續(xù)優(yōu)化和開發(fā)所推出的新一代技術。它可以通過虛擬化將多臺互聯(lián)的物理設備視為一臺邏輯設備,為用戶帶來簡化管理,簡化網(wǎng)絡業(yè)務、彈性擴展、1:N可靠、性能加倍提升和增值業(yè)務擴展等諸多好處。
除了在性能上帶來的提升之外,IRF2的一項重要意義就在于網(wǎng)絡可靠性的進一步提高。由于實現(xiàn)了1:N的冗余備份,IRF2可以在一臺設備出現(xiàn)故障的時候,其它設備可以照常運行并迅速接管故障設備的功能。此時,域內路由協(xié)議不會隨之出現(xiàn)中斷;通過跨越設備的聚合,通信鏈路也得到了完善的保護;轉發(fā)流量和大部分業(yè)務都不會出現(xiàn)中斷。在流量中斷丟包時長測試結果表明:當模擬一條鏈路中斷時,采用了IRF2技術后,原來由路由收斂的鏈路變成了簡單的聚合鏈路收斂,丟包時間從未采用IRF2技術時的十幾秒乃至數(shù)十秒以上,縮短到了亞毫秒級,在實際應用中,即便是在進行對網(wǎng)絡要求較高的視頻流量傳輸時,也不會產生出過大的影響。
通過測試結果可以看出,S12500在提高網(wǎng)絡設備平均無故障時間,和縮短平均修復時間兩個方面,與其他同類型產品相比均略勝一籌。
H3C網(wǎng)絡產品線副總裁孫德和表示,由于許多行業(yè)的數(shù)據(jù)中心提供的都是1年365天每天24小時的不間斷服務,應該盡量消除設備與服務的臨時中斷,因此,對于網(wǎng)絡設備的可靠性也必然有著更高要求,S12500的設計也正是瞄準了這一目標來完成的。事實上,S12500在可靠性方面的突出表現(xiàn),也給整個網(wǎng)絡設備領域樹立了一個標桿,未來的網(wǎng)絡設備可靠性參數(shù)勢必將朝這一方向繼續(xù)靠攏。
結束語
高可靠性并不僅僅是一個概念,它能夠給用戶帶來實實在在的商業(yè)價值。對于用戶來說,網(wǎng)絡的穩(wěn)定可用可以節(jié)省維護費用,提高企業(yè)的工作效率,節(jié)省企業(yè)的生產成本,增強企業(yè)競爭力,對用戶在快速變化的環(huán)境中取得成功來說都非常關鍵。
隨著H3C S12500的推出,網(wǎng)絡設備的可靠性也上到了一個新的臺階。在萬兆乃至100G網(wǎng)絡正逐漸成為核心網(wǎng)絡主流配置的趨勢下,進一步提升網(wǎng)絡的可靠性已是刻不容緩之事。相信在包括H3C在內的各方共同努力之下,網(wǎng)絡的可靠性也將“水漲船高”,邁入一個新的層次。