網絡冗余設計中需要考慮的七個因素
譯文【51CTO.com快譯】當網絡出現故障時,很多企業的業務就會中止。對于某些人來說,幾分鐘的停機時間無關緊要。對于那些業務面向客戶的企業來說,幾分鐘的停機時間意味著損失大量收入,甚至可能會失去客戶。對于這些企業來說,設計一個即使出現組件故障也能保持正常運行的網絡至關重要。
對于即使出現短暫的停機也會產生重大影響的企業來說,必須添加冗余設備,并簽訂冗余服務合同。但是添加網絡冗余設備將會增加成本和復雜性,因此必須對停機成本與添加設備和服務的成本進行權衡。
以下是企業的網絡團隊在網絡冗余設計時需要考慮的七個因素:
1.交換機和路由器
交換機和路由器通常非常可靠,但它們有時會出現故障。一些企業會在機架上保留一臺額外的交換機或路由器,這樣他們就可以快速更換出現故障的設備。而具有更關鍵需求的企業必須在網絡中啟動并運行冗余設備。
2.網絡協議
網絡標準機構開發了網絡協議,可以在發生故障時快速切換到備份的設備。在第二層添加冗余時需要IT團隊將多個交換機連接到每個子網段。
但這些冗余的交換機如在網絡中創建了多條路徑,可能導致網絡泛濫,每個數據包并產生多個副本。生成樹算法提供了一種確定通過網絡單條路徑的方法。不幸的是,生成樹可能需要將近一分鐘的時間才能確定一條新路徑。雖然此這一段時間對于某些網絡來說可能是可以接受的,但其他網絡需要更快速的恢復。
如今,已經開發出多系統鏈路聚合(MLAG)、多鏈路透明互連(TRILL)和最短路徑橋接(SPB) 的新協議以支持更快的恢復。設計網絡冗余并需要更快恢復的網絡團隊必須確定哪種選項更適合他們的網絡。
在網絡設計中添加冗余時不要忘記的七個因素
3.子網連接
添加冗余的下一步是子網連接。同樣,企業有必要在子網之間提供多條路徑。路由器將網絡內的子網連接到外部目的地。每個子網必須連接到多個路由器以提供冗余。開放最短路徑優先(OSPF)和增強型內部網關路由協議(EIGRP)等協議定義了路由器如何相互通知到每個目的地的當前最佳路徑。
路由器在幾秒鐘內未收到來自該路由器的更新時,可以確定相鄰路由器已關閉。但是,開放最短路徑優先(OSPF)和增強型內部網關路由協議(EIGRP)都需要比某些網絡可以接受的更多時間來恢復。熱備用路由器協議(HSRP)和虛擬路由器冗余協議(VRRP)可用于減少從路由器故障中恢復所需的時間。
網絡連接斷開的原因有很多——例如,有人拔錯了線纜,或添加新線纜時連接松動,或者在移動設備時不小心碰到線纜。IEEE802.3ad鏈路聚合定義了如何將兩條網線用于單個連接。只要都已經連接,就可以在兩條網線之間共享流量,但當一條網線斷開連接時,其流量并不會中斷。
4.備份
導致數據丟失的磁盤故障會使企業的業務癱瘓。對于某些企業來說,每天備份一次就足夠了,而其他企業則無法接受一天的數據丟失和恢復所需的時間。
獨立磁盤冗余陣列(RAID)可防止一塊磁盤出現故障,并提供多種級別的保護。每一項數據都可以寫入兩塊不同的磁盤。更高的保護級別定義了添加額外磁盤和奇偶校驗信息的方法,這使IT團隊能夠在應該包含相同數據的兩個磁盤在不同的情況下恢復正確的數據。
連續云備份優于最高的RAID級別,因為將每個數據更新發送到云中意味著不會丟失任何數據。單個RAID磁盤安裝在一臺機柜中,這意味著如果機柜受損可能會導致里面的磁盤損壞。與此同時,用戶仍然需要定期備份陣列,但最近一次備份后積累的數據可能會丟失。
5.處理器
處理器也會像其他組件一樣出現故障,因此在網絡冗余設計中也要考慮出現故障的可能性,處理器還必須為最新的系統軟件版本定期更新。企業需要有足夠的額外處理器資源來保證網絡的連續運行。
將所有處理和存儲工作移至公共云可以簡化冗余設計任務。云平臺中有很多處理器和存儲單元,如果應用程序發生故障可以快速移動到另一個處理器進行處理,并且可以配置冗余存儲。如果發生某個事件導致整個設施關閉,則處理過程可能會轉移到其他的云計算基礎設施。
6.電源
顯然,IT設備沒有電源就無法工作,由于暴風雨、電線桿被汽車撞倒或其他突生事件,數據中心的電力可能會中斷。發生故障時,數據中心的備用電源可以快速接管,對于大型數據中心設施來說,需要配備適當的UPS電源。
由于切換到柴油發電機需要一些時間,但如果停電的持續時間超過UPS電源的電池容量,可以啟動備用柴油發電機為負載提供電力。在某些情況下,數據中心還可以連接兩條不同的電力線路,以防止其中一條電力線路損壞而斷電。
7.廣域網和SD-WAN
WAN連接一直很重要,但云計算的增長和遠程用戶的重要性使得WAN的可靠性變得越來越重要。企業的一種選擇是獲得與兩家不同網絡服務提供商的連接。雖然這會增加運營費用,但它可以防止連接到網絡服務提供商的鏈路發生故障以及提供商網絡內的故障。
軟件定義WAN(SD-WAN)提供了一種額外的方式來添加網絡冗余。多協議標簽交換(MPLS)線路非常可靠,可以保證指定的服務質量(QoS)水平,但它們也可能出現故障。SD-WAN控制器可以在發生故障時將流量切換到公共互聯網。公共互聯網并不提供相同級別的可靠性或服務質量(QoS)保證,但它提供了一種將數據傳送到目的地的方法。SD-WAN的另一個優勢是它可以在負載峰值期間將不太重要的流量轉移到公共互聯網,而不是促使IT團隊訂購最高的MPLS帶寬水平。
添加冗余設備將會增加費用和復雜性,網絡設計人員不應設計超過必要的網絡冗余,但也不能設計低于要求的網絡冗余,因為即使是短暫的中斷也可能決定業務的成敗。
原文標題:7 factors to consider in network redundancy design,作者:David Jacobs
【51CTO譯稿,合作站點轉載請注明原文譯者和出處為51CTO.com】