基于多租戶的云計算Overlay網(wǎng)絡(luò)
云計算已經(jīng)成為當(dāng)前企業(yè)IT建設(shè)的常規(guī)形態(tài),而在云計算中大量采用和部署的虛擬化幾乎成為一個基本的技術(shù)模式。
服務(wù)器虛擬化技術(shù)的廣泛部署,極大增加了數(shù)據(jù)中心的計算密度,而且,因為虛擬機本身不受物理計算環(huán)境的約束,基于業(yè)務(wù)的靈活性變更要求,需要在網(wǎng)絡(luò)中無限制地遷移到目的物理位置,(如圖1所示)虛機增長的快速性以及虛機遷移成為一個常態(tài)性業(yè)務(wù)。

圖1 虛擬化的快速增長及帶來的密集遷移效應(yīng)
1 云計算虛擬化網(wǎng)絡(luò)的挑戰(zhàn)與革新
在云中,虛擬計算負載的高密度增長及靈活性遷移在一定程度上對網(wǎng)絡(luò)產(chǎn)生了壓力,然而當(dāng)前虛擬機的規(guī)模與可遷移性受物理網(wǎng)絡(luò)能力約束,云中的業(yè)務(wù)負載不能與物理網(wǎng)絡(luò)脫離。
虛擬機遷移范圍受到網(wǎng)絡(luò)架構(gòu)限制
由于虛擬機遷移的網(wǎng)絡(luò)屬性要求,其從一個物理機上遷移到另一個物理機上,要求虛擬機不間斷業(yè)務(wù),則需要其IP地址、MAC地址等參數(shù)維保持不變,如此則要求業(yè)務(wù)網(wǎng)絡(luò)是一個二層網(wǎng)絡(luò),且要求網(wǎng)絡(luò)本身具備多路徑多鏈路的冗余和可靠性。傳統(tǒng)的網(wǎng)絡(luò)生成樹(STPSpaning Tree Protocol)技術(shù)不僅部署繁瑣榮,且協(xié)議復(fù)雜,網(wǎng)絡(luò)規(guī)模不宜過大,限制了虛擬化的網(wǎng)絡(luò)擴展性。基于各廠家私有的的IRF/vPC等設(shè)備級的(網(wǎng)絡(luò)N:1)虛擬化技術(shù),雖然可以簡化拓撲簡化、具備高可靠性的能力,但是對于網(wǎng)絡(luò)有強制的拓撲形狀限制,在網(wǎng)絡(luò)的規(guī)模和靈活性上有所欠缺,只適合小規(guī)模網(wǎng)絡(luò)構(gòu)建,且一般適用于數(shù)據(jù)中心內(nèi)部網(wǎng)絡(luò)。而為了大規(guī)模網(wǎng)絡(luò)擴展的TRILL/SPB/FabricPath/VPLS等技術(shù),雖然解決了上述技術(shù)的不足,但對網(wǎng)絡(luò)有特殊要求,即網(wǎng)絡(luò)中的設(shè)備均要軟硬件升級而支持此類新技術(shù),帶來部署成本的上升。
虛擬機規(guī)模受網(wǎng)絡(luò)規(guī)格限制
在大二層網(wǎng)絡(luò)環(huán)境下,數(shù)據(jù)流均需要通過明確的網(wǎng)絡(luò)尋址以保證準(zhǔn)確到達目的地,因此網(wǎng)絡(luò)設(shè)備的二層地址表項大小(即MAC地址表),成為決定了云計算環(huán)境下虛擬機的規(guī)模的上限,并且因為表項并非百分之百的有效性,使得可用的虛機數(shù)量進一步降低,特別是對于低成本的接入設(shè)備而言,因其表項一般規(guī)格較小,限制了整個云計算數(shù)據(jù)中心的虛擬機數(shù)量,但如果其地址表項設(shè)計為與核心或網(wǎng)關(guān)設(shè)備在同一檔次,則會提升網(wǎng)絡(luò)建設(shè)成本。雖然核心或網(wǎng)關(guān)設(shè)備的MAC與ARP規(guī)格會隨著虛擬機增長也面臨挑戰(zhàn),但對于此層次設(shè)備能力而言,大規(guī)格是不可避免的業(yè)務(wù)支撐要求。減小接入設(shè)備規(guī)格壓力的做法可以是分離網(wǎng)關(guān)能力,如采用多個網(wǎng)關(guān)來分擔(dān)虛機的終結(jié)和承載,但如此也會帶來成本的上升。
網(wǎng)絡(luò)隔離/分離能力限制
當(dāng)前的主流網(wǎng)絡(luò)隔離技術(shù)為VLAN(或VPN),在大規(guī)模虛擬化環(huán)境部署會有兩大限制:一是VLAN數(shù)量在標(biāo)準(zhǔn)定義中只有12個比特單位,即可用的數(shù)量為4000個左右,這樣的數(shù)量級對于公有云或大型虛擬化云計算應(yīng)用而言微不足道,其網(wǎng)絡(luò)隔離與分離要求輕而易舉會突破4000;二是VLAN技術(shù)當(dāng)前為靜態(tài)配置型技術(shù)(只有EVB/VEPA的802.1Qbg技術(shù)可以在接入層動態(tài)部署VLAN,但也主要是在交換機接主機的端口為常規(guī)部署,上行口依然為所有VLAN配置通過),這樣使得整個數(shù)據(jù)中心的網(wǎng)絡(luò)幾乎為所有VLAN被允許通過(核心設(shè)備更是如此),導(dǎo)致任何一個VLAN的未知目的廣播數(shù)據(jù)會在整網(wǎng)泛濫,無節(jié)制消耗網(wǎng)絡(luò)交換能力與帶寬。
對于小規(guī)模的云計算虛擬化環(huán)境,現(xiàn)有的網(wǎng)絡(luò)技術(shù)如虛擬機接入感知(VEPA/802.1Qbg)、數(shù)據(jù)中心二層網(wǎng)絡(luò)擴展(IRF/vPC/TRILL/FabricPath)、數(shù)據(jù)中心間二層技術(shù)(OTV/EVI/TRILL)等可以很好的滿足業(yè)務(wù)需求,上述限制不成為瓶頸。然而,完全依賴于物理網(wǎng)絡(luò)設(shè)備本身的技術(shù)改良,目前看來并不能完全解決大規(guī)模云計算環(huán)境下的問題,一定程度上還需要更大范圍的技術(shù)革新來消除這些限制,以滿足云計算虛擬化的網(wǎng)絡(luò)能力需求。在此驅(qū)動力基礎(chǔ)上,逐步演化出Overlay的虛擬化網(wǎng)絡(luò)技術(shù)趨勢。
#p#
2 Overlay虛擬化網(wǎng)絡(luò)的技術(shù)標(biāo)準(zhǔn)及比較
2.1 Overlay技術(shù)形態(tài)
Overlay在網(wǎng)絡(luò)技術(shù)領(lǐng)域,指的是一種網(wǎng)絡(luò)架構(gòu)上疊加的虛擬化技術(shù)模式,其大體框架是對基礎(chǔ)網(wǎng)絡(luò)不進行大規(guī)模修改的條件下,實現(xiàn)應(yīng)用在網(wǎng)絡(luò)上的承載,并能與其它網(wǎng)絡(luò)業(yè)務(wù)分離,并且以基于IP的基礎(chǔ)網(wǎng)絡(luò)技術(shù)為主(如圖2所示)。其實這種模式是以對傳統(tǒng)技術(shù)的優(yōu)化而形成的。早期的就有標(biāo)準(zhǔn)支持了二層Overlay技術(shù),如RFC3378(Ethernet in IP),就是早期的在IP上的二層Overlay技術(shù)。并且基于Ethernet over GRE的技術(shù),H3C與Cisco都在物理網(wǎng)絡(luò)基礎(chǔ)上發(fā)展了各自的私有二層Overlay技術(shù)——EVI(Ethernet Virtual Interconnection)與OTV(Overlay Transport Virtualization)。EVI與OTV都主要用于解決數(shù)據(jù)中心之間的二層互聯(lián)與業(yè)務(wù)擴展問題,并且對于承載網(wǎng)絡(luò)的基本要求是IP可達,部署上簡單且擴展方便。

圖2 Overlay網(wǎng)絡(luò)模型
隨著云計算虛擬化的驅(qū)動,基于主機虛擬化的Overlay技術(shù)出現(xiàn),在服務(wù)器的Hypervisor內(nèi)vSwitch上支持了基于IP的二層Overlay技術(shù),從更靠近應(yīng)用的邊緣來提供網(wǎng)絡(luò)虛擬化服務(wù),其目的是使虛擬機的部署與業(yè)務(wù)活動脫離物理網(wǎng)絡(luò)及其限制,使得云計算的網(wǎng)絡(luò)形態(tài)不斷完善。(如圖3所示)主機的vSwitch支持基于IP的Overlay之后,虛機的二層訪問直接構(gòu)建在Overlay之上,物理網(wǎng)不再感知虛機的諸多特性,由此,Overlay可以構(gòu)建在數(shù)據(jù)中心內(nèi),也可以跨越數(shù)據(jù)中心之間。

圖3 hypervisor支持的二層Overlay
2.2 Overlay如何解決當(dāng)前的主要問題
針對前文提出的三大技術(shù)挑戰(zhàn),Overlay在很大程度上提供了全新的解決方式。
針對虛機遷移范圍受到網(wǎng)絡(luò)架構(gòu)限制的解決方式
Overlay是一種封裝在IP報文之上的新的數(shù)據(jù)格式,因此,這種數(shù)據(jù)可以通過路由的方式在網(wǎng)絡(luò)中分發(fā),而路由網(wǎng)絡(luò)本身并無特殊網(wǎng)絡(luò)結(jié)構(gòu)限制,具備良性大規(guī)模擴展能力,并且對設(shè)備本身無特殊要求,以高性能路由轉(zhuǎn)發(fā)為佳,且路由網(wǎng)絡(luò)本身具備很強的的故障自愈能力、負載均衡能力。采用Overlay技術(shù)后,企業(yè)部署的現(xiàn)有網(wǎng)絡(luò)便可用于支撐新的云計算業(yè)務(wù),改造難度極低(除性能可能是考量因素外,技術(shù)上對于承載網(wǎng)絡(luò)并無新的要求)。
針對虛機規(guī)模受網(wǎng)絡(luò)規(guī)格限制的解決方式
虛擬機數(shù)據(jù)封裝在IP數(shù)據(jù)包中后,對網(wǎng)絡(luò)只表現(xiàn)為封裝后的的網(wǎng)絡(luò)參數(shù),即隧道端點的地址,因此,對于承載網(wǎng)絡(luò)(特別是接入交換機),MAC地址規(guī)格需求極大降低,最低規(guī)格也就是幾十個(每個端口一臺物理服務(wù)器的隧道端點MAC)。當(dāng)然,對于核心/網(wǎng)關(guān)處的設(shè)備表項(MAC/ARP)要求依然極高,當(dāng)前的解決方案仍然是采用分散方式,通過多個核心/網(wǎng)關(guān)設(shè)備來分散表項的處理壓力。(另一種更分散的方式便是虛擬網(wǎng)絡(luò)路由服務(wù)方式,詳見后文描述)。
針對網(wǎng)絡(luò)隔離/分離能力限制的解決方式
針對VLAN數(shù)量4000以內(nèi)的限制,在Overlay技術(shù)中引入了類似12比特VLAN ID的用戶標(biāo)識,支持千萬級以上的用戶標(biāo)識,并且在Overlay中沿襲了云計算“租戶”的概念,稱之為Tenant ID(租戶標(biāo)識),用24或64比特表示。針對VLAN技術(shù)下網(wǎng)絡(luò)的TRUANK ALL(VLAN穿透所有設(shè)備)的問題,Overlay對網(wǎng)絡(luò)的VLAN配置無要求,可以避免網(wǎng)絡(luò)本身的無效流量帶寬浪費,同時Overlay的二層連通基于虛機業(yè)務(wù)需求創(chuàng)建,在云的環(huán)境中全局可控。
2.3 Overlay主要技術(shù)標(biāo)準(zhǔn)及比較
目前,IETF在Overlay技術(shù)領(lǐng)域有如下三大技術(shù)路線正在討論,為簡單起見,本文只討論基于IPv4的Overlay相關(guān)內(nèi)容(如圖4所示)。
VXLAN。VXLAN是將以太網(wǎng)報文封裝在UDP傳輸層上的一種隧道轉(zhuǎn)發(fā)模式,目的UDP端口號為4798;為了使VXLAN充分利用承載網(wǎng)絡(luò)路由的均衡性,VXLAN通過將原始以太網(wǎng)數(shù)據(jù)頭(MAC、IP、四層端口號等)的HASH值作為UDP的號;采用24比特標(biāo)識二層網(wǎng)絡(luò)分段,稱為VNI(VXLAN Network Identifier),類似于VLAN ID作用;未知目的、廣播、組播等網(wǎng)絡(luò)流量均被封裝為組播轉(zhuǎn)發(fā),物理網(wǎng)絡(luò)要求支持任意源組播(ASM)。
NVGRE。NVGRE是將以太網(wǎng)報文封裝在GRE內(nèi)的一種隧道轉(zhuǎn)發(fā)模式;采用24比特標(biāo)識二層網(wǎng)絡(luò)分段,稱為VSI(Virtual Subnet Identifier),類似于VLAN ID作用;為了使NVGRE利用承載網(wǎng)絡(luò)路由的均衡性,NVGRE在GRE擴展字段flow ID,這就要求物理網(wǎng)絡(luò)能夠識別到GRE隧道的擴展信息,并以flow ID進行流量分擔(dān);未知目的、廣播、組播等網(wǎng)絡(luò)流量均被封裝為組播轉(zhuǎn)發(fā)。
STT。STT利用了TCP的數(shù)據(jù)封裝形式,但改造了TCP的傳輸機制,數(shù)據(jù)傳輸不遵循TCP狀態(tài)機,而是全新定義的無狀態(tài)機制,將TCP各字段意義重新定義,無需三次握手建立TCP連接,因此稱為無狀態(tài)TCP;以太網(wǎng)數(shù)據(jù)封裝在無狀態(tài)TCP;采用64比特Context ID標(biāo)識二層網(wǎng)絡(luò)分段;為了使STT充分利用承載網(wǎng)絡(luò)路由的均衡性,通過將原始以太網(wǎng)數(shù)據(jù)頭(MAC、IP、四層端口號等)的HASH值作為無狀態(tài)TCP的源端口號;未知目的、廣播、組播等網(wǎng)絡(luò)流量均被封裝為組播轉(zhuǎn)發(fā)。



VXLAN NVGRE SST
圖4 三種數(shù)據(jù)詳細封裝
這三種二層Overlay技術(shù),大體思路均是將以太網(wǎng)報文承載到某種隧道層面,差異性在于選擇和構(gòu)造隧道的不同,而底層均是IP轉(zhuǎn)發(fā)。如表1所示為這三種技術(shù)關(guān)鍵特性的比較:VXLAN和STT對于現(xiàn)網(wǎng)設(shè)備對流量均衡要求較低,即負載鏈路負載分擔(dān)適應(yīng)性好,一般的網(wǎng)絡(luò)設(shè)備都能對L2-L4的數(shù)據(jù)內(nèi)容參數(shù)進行鏈路聚合或等價路由的流量均衡,而NVGRE則需要網(wǎng)絡(luò)設(shè)備對GRE擴展頭感知并對flow ID進行HASH,需要硬件升級;STT對于TCP有較大修改,隧道模式接近UDP性質(zhì),隧道構(gòu)造技術(shù)屬于革新性,且復(fù)雜度較高,而VXLAN利用了現(xiàn)有通用的UDP傳輸,成熟性極高。總體比較,VLXAN技術(shù)相對具有優(yōu)勢。

表1 IETF三種Overlay技術(shù)的總體比較
IETF討論的Overlay技術(shù),主要聚焦在數(shù)據(jù)轉(zhuǎn)發(fā)層面的實現(xiàn)上,控制層面并無涉及,因此在基本實現(xiàn)上依賴于不同廠家的控制層面設(shè)計,IETF討論稿《draft-pfaff-ovsdb-proto-02.pdf》則針對Open vSwitch提供了一種控制管理模型的建議(如圖5所示),但在細節(jié)實現(xiàn)上仍不是很明確。

圖5 IETF draft討論的OVS管理方式
#p#
3 多租戶的Overlay網(wǎng)絡(luò)架構(gòu)
3.1 數(shù)據(jù)中心虛擬化網(wǎng)絡(luò)的發(fā)展階段
隨著虛擬化技術(shù)在數(shù)據(jù)中心、云計算中的不斷深入應(yīng)用,伴隨著網(wǎng)絡(luò)技術(shù)的發(fā)展,數(shù)據(jù)中心的二層組網(wǎng)結(jié)構(gòu)出現(xiàn)了階段性的架構(gòu)變化(如圖6所示)。

圖6 階段性網(wǎng)絡(luò)與虛擬化的匹配
分層結(jié)構(gòu)化網(wǎng)絡(luò)
早期的數(shù)據(jù)中心網(wǎng)絡(luò),虛擬化需求非常少,并沒有強烈的大二層技術(shù)要求,多是面向一定的業(yè)務(wù)應(yīng)用系統(tǒng)構(gòu)建網(wǎng)絡(luò)模塊,并且規(guī)模一般不大,性能要求也不高。數(shù)據(jù)中心使用多層架構(gòu),網(wǎng)關(guān)層面比較低,業(yè)務(wù)的二層訪問基本可以在網(wǎng)絡(luò)模塊內(nèi)解決,只需要通過基礎(chǔ)的生成樹技術(shù)來支撐模塊內(nèi)的二層網(wǎng)路可靠性運行即可。
扁平化網(wǎng)絡(luò)
隨著虛擬化在X86架構(gòu)服務(wù)器上的流行及廣泛部署,模塊化的數(shù)據(jù)中心網(wǎng)絡(luò)結(jié)構(gòu)已經(jīng)不能滿足虛擬機大范圍遷移要求,而生成樹協(xié)議的復(fù)雜性也嚴重影響大規(guī)模網(wǎng)絡(luò)的穩(wěn)定運行。由此網(wǎng)絡(luò)本身技術(shù)出現(xiàn)適應(yīng)虛擬化的變革,包含TRILL/FabricPath/VSS/vPC/IRF等新的技術(shù)出現(xiàn)并大量部署,同時為了使得網(wǎng)絡(luò)進一步感知虛讓你因為機的業(yè)務(wù)生命周期,IEEE還制訂了802.1Qbg(即VEPA技術(shù))與802.1BR來配合二層網(wǎng)絡(luò)技術(shù)增強對虛擬機的感知能力。為了保證網(wǎng)絡(luò)的高性能業(yè)務(wù)要求,出現(xiàn)了應(yīng)對高密虛擬化云計算環(huán)境的CLOS網(wǎng)絡(luò)架構(gòu)。
Overlay網(wǎng)絡(luò)虛擬化
當(dāng)進入云計算時代,云的業(yè)務(wù)需求與網(wǎng)絡(luò)之間出現(xiàn)了前文提到的挑戰(zhàn),網(wǎng)絡(luò)技術(shù)再次發(fā)生變革,以O(shè)verlay的虛擬化方式來支撐云與虛擬化的建設(shè)要求,并實現(xiàn)大規(guī)模的多租戶能力,網(wǎng)絡(luò)進入Overlay虛擬化架構(gòu)階段。
3.2 Overlay網(wǎng)絡(luò)的組成模式
Overlay的本質(zhì)是L2 Over IP的隧道技術(shù),在服務(wù)器的vSwitch、物理網(wǎng)絡(luò)上技術(shù)框架已經(jīng)就緒,并且從當(dāng)前的技術(shù)選擇來看,雖然有多種隧道同時實現(xiàn),但是以L2 over UDP模式實現(xiàn)的VXLAN技術(shù)具備較大優(yōu)勢,并且在ESXi和Open vSwitch、當(dāng)前網(wǎng)絡(luò)的主流芯片已經(jīng)實現(xiàn),預(yù)計會成為主流的Overlay技術(shù)選擇,因此后文的Overlay網(wǎng)絡(luò)均參考VXLAN相關(guān)的技術(shù)組成描述,其它NVGRE、STT等均類似。
Overlay網(wǎng)絡(luò)架構(gòu)有多種實現(xiàn),就純大二層的實現(xiàn),可分為主機實現(xiàn)方式和網(wǎng)絡(luò)實現(xiàn)方式;而在最終實現(xiàn)Overlay與網(wǎng)絡(luò)外部數(shù)據(jù)連通的連接方式上,則更有多種實現(xiàn)模式,并且對于關(guān)鍵網(wǎng)絡(luò)部件將有不同的技術(shù)要求。
3.2.1 基于主機的Overlay虛擬化網(wǎng)絡(luò)
(如圖7所示)目前的虛擬化主機軟件在vSwitch內(nèi)支持VXLAN,使用VTEP(VXLAN Tunnel End Point)封裝和終結(jié)VXLAN的隧道。

圖7 基于主機的Overlay虛擬化網(wǎng)絡(luò)
VXLAN運行在UDP上,物理網(wǎng)絡(luò)只要支持IP轉(zhuǎn)發(fā),則所有IP可達的主機即可構(gòu)建一個大范圍二層網(wǎng)絡(luò)。這種vSwitch的實現(xiàn),屏蔽了物理網(wǎng)絡(luò)的模型與拓撲差異,將物理網(wǎng)絡(luò)的技術(shù)實現(xiàn)與計算虛擬化的關(guān)鍵要求分離開來,幾乎可以支持以太網(wǎng)在任意網(wǎng)絡(luò)上的透傳,使得云的計算資源調(diào)度范圍空前擴大。
特別的,為了使得VXLAN Overlay網(wǎng)絡(luò)更加簡化運行管理,便于云的服務(wù)提供,各廠家使用集中控制的模型,將分散在多個物理服務(wù)器上的vSwitch構(gòu)成一個大型的、虛擬化的分布式Overlay vSwitch(如圖8所示),只要在分布式vSwitch范圍內(nèi),虛擬機在不同物理服務(wù)器上的遷移,便被視為在一個虛擬的設(shè)備上遷移,如此大大降低了云中資源的調(diào)度難度和復(fù)雜度。

圖8 分布式Overlay vSwitch
基于主機的Overlay網(wǎng)絡(luò)數(shù)據(jù)流量出入物理網(wǎng)絡(luò),需要實現(xiàn)VXLAN的Overlay流量與傳統(tǒng)的以太網(wǎng)數(shù)據(jù)流量之間的封裝與解封裝過程,而執(zhí)行這個過程操作的功能點,被稱為Overlay/VXLAN Gateway(如圖9所示)。因為VXLAN網(wǎng)絡(luò)的VTEP功能點本身就是VXLAN的封裝與解封裝隧道點,因此VXLAN Gateway首先需要具備VTEP功能,形態(tài)可以是vSwitch、物理交換機等,只是對于網(wǎng)絡(luò)中的虛機或其它設(shè)備地址表項的處理有所差異。

圖9 Overlay Gateway(VXLAN)
VXLAN Ovelay網(wǎng)絡(luò)與物理網(wǎng)絡(luò)連通有以下三種組網(wǎng)方案(如圖10所示)。
方案一:Overlay虛擬化網(wǎng)絡(luò)+vSwitch GW+vRouter
Overlay的vSwitch本身具備隧道的封裝與解封裝能力,因此,H3C提供一種虛擬路由器來配合這種基本方式。將在硬件路由器中運行的軟件vSR(基于H3C Comware平臺的路由軟件包)作為虛擬機運行在主機中,提供Overlay網(wǎng)絡(luò)的虛擬路由功能(即vRouter能力),vRouter的接口同時連接到VXLAN的網(wǎng)絡(luò)和VLAN基本功能的物理網(wǎng)絡(luò)。從vSwitch接收到的VXLAN數(shù)據(jù)包被解除封裝后,進入vRouter路由接口,可以被路由到外部網(wǎng)絡(luò);反之,vRouter接收到外部網(wǎng)絡(luò)的數(shù)據(jù)可以進入VXLAN網(wǎng)絡(luò)。
該方案的好處是:涉及Overlay的功能均在主機虛擬化環(huán)境vSwitch實現(xiàn),并且虛擬路由功能使得Overlay網(wǎng)絡(luò)部署更加靈活,極大降低外部物理網(wǎng)絡(luò)要求。
方案二:Overlay虛擬化網(wǎng)絡(luò)+vSwitch GW+pRouter
本方案使用服務(wù)器中的vSwitch專門用作VXLAN的Gateway功能,而數(shù)據(jù)的路由功能,則由外部網(wǎng)絡(luò)物理路由器承擔(dān)。該方案除了不具備虛擬路由能力,Overlay的功能也都在主機虛擬化環(huán)境vSwitch實現(xiàn),同時可以支持虛機與非虛擬化的物理服務(wù)器之間的二層數(shù)據(jù)通信要求。
方案三:Overlay虛擬化網(wǎng)絡(luò)+pSwitch GW+pRouter
當(dāng)物理交換機支持VXLAN功能,則pSwitch與vSwicth可以實現(xiàn)Overlay的統(tǒng)一虛擬化組網(wǎng),物理交換機執(zhí)行VXLAN Gateway功能,不僅可以實現(xiàn)Overlay網(wǎng)絡(luò)在物理網(wǎng)絡(luò)上的終結(jié),也可以支持虛機與非虛擬化服務(wù)器的混合組網(wǎng)業(yè)務(wù),因為基于物理實現(xiàn)(物理交換機+物理路由器),整體網(wǎng)絡(luò)可以達到極高性能。

圖10 VXLAN Overlay網(wǎng)絡(luò)與物理網(wǎng)絡(luò)的連通方案
3.2.2 基于物理網(wǎng)絡(luò)的Overlay虛擬化
(如圖11所示)該方案在網(wǎng)絡(luò)架構(gòu)上與TRILL/FabricPath等技術(shù)類似,但是因為對于非VTEP要求的網(wǎng)絡(luò)只需要IP轉(zhuǎn)發(fā),它比TRILL/FabricPath構(gòu)建的成本更低,技術(shù)要求也更加簡單,同時也容易構(gòu)建多個數(shù)據(jù)中心之間的網(wǎng)絡(luò)連接。
為了解決網(wǎng)絡(luò)對虛擬機的感知與自動化控制,結(jié)合IEEE的802.1Qbg/VEPA技術(shù),可以使得網(wǎng)絡(luò)的Overlay與計算虛擬化之間產(chǎn)生關(guān)聯(lián),這樣既可以保持服務(wù)器內(nèi)部網(wǎng)絡(luò)的簡化,使用基本的VEPA,利用外部網(wǎng)絡(luò)強化來保證高能力的控制要求,又在物理網(wǎng)絡(luò)Overlay的虛擬化基礎(chǔ)上增強了虛機在云中大范圍調(diào)度的靈活性。

圖11 物理網(wǎng)絡(luò)的Overlay+VEPA
3.3 基于Overlay網(wǎng)絡(luò)的多租戶與網(wǎng)絡(luò)服務(wù)——H3Cloud云網(wǎng)融合路線
對于計算資源豐富的數(shù)據(jù)中心,Overlay網(wǎng)絡(luò)使得虛擬機不再為物理網(wǎng)絡(luò)所限制,但是對于網(wǎng)絡(luò)的L4-L7深度服務(wù),在云計算環(huán)境下需求更為強烈,資源動態(tài)調(diào)度的計算環(huán)境,需要動態(tài)可調(diào)度的網(wǎng)絡(luò)服務(wù)支撐。因此將傳統(tǒng)的L4-L7服務(wù)轉(zhuǎn)換為可云化的、可動態(tài)調(diào)度的服務(wù)資源,成為Overlay網(wǎng)絡(luò)環(huán)境下的必須集成框架(如圖12所示)。H3C基于Comware V7軟件平臺的L4-L7產(chǎn)品系列,可在虛擬化網(wǎng)絡(luò)環(huán)境下資源化,以虛擬服務(wù)單元運行,分別提供對應(yīng)路由器、防火墻、負載均衡、深度防御的vSR/vRouter、vFW、vLB、vIPS,利用數(shù)據(jù)中心計算資源與Overlay網(wǎng)絡(luò)集成,提供等同于傳統(tǒng)的L4-L7網(wǎng)絡(luò)服務(wù)能力。

圖12 Overlay網(wǎng)絡(luò)集成服務(wù)虛擬化
在Overlay環(huán)境下的虛擬化網(wǎng)絡(luò)服務(wù),必須具備靈活的可分配性、可擴展性及可調(diào)度性,因此,自動化的編排組織能力顯得非常重要(如圖13所示)。除了將虛擬服務(wù)資源化,還要具備業(yè)務(wù)邏輯的組合關(guān)聯(lián),這些與物理網(wǎng)絡(luò)L4-L7服務(wù)的固定配置管理不同,所有的網(wǎng)絡(luò)服務(wù)資源也是在計算池中,要實現(xiàn)相應(yīng)的業(yè)務(wù)關(guān)聯(lián)和邏輯,難以通過物理網(wǎng)絡(luò)實現(xiàn),在Overlay網(wǎng)絡(luò)的連通與編排下則相對易于實現(xiàn)。這種集成思路也將是H3C服務(wù)虛擬化的主要模式。

圖13 基于Overlay虛擬化網(wǎng)絡(luò)的服務(wù)編排
H3C云計算解決方案核心的架構(gòu)是云網(wǎng)融合。在當(dāng)前的特色方案系列均充分利用了云計算與物理網(wǎng)絡(luò)融合、結(jié)合的特點,如:
VEPA——提供網(wǎng)絡(luò)計算自動化的感知關(guān)聯(lián)與自動化部署;
FCoE——統(tǒng)一交換的計算、存儲網(wǎng)絡(luò);
DRX——基于H3C LB與虛擬機管理平臺關(guān)聯(lián)的虛機資源動態(tài)擴展;
PoC(Point of Cloud)——借助云端網(wǎng)絡(luò)連通云計算中心與路由器集成X86虛擬化計算部件的統(tǒng)一云分支擴展;
分級云——通過層級化網(wǎng)絡(luò)構(gòu)建縱向?qū)哟位萍軜?gòu)。
針對云計算即將進入Overlay階段,H3C的技術(shù)路線目標(biāo)是在H3Cloud架構(gòu)中進一步實現(xiàn)Overlay虛擬化網(wǎng)絡(luò)的融合(如圖14所示)。新一階段的云網(wǎng)融合,不僅包含分布式的Overlay、多租戶的虛擬化網(wǎng)絡(luò),還將不斷集成逐步產(chǎn)品化的虛擬網(wǎng)絡(luò)服務(wù)部件(目前已經(jīng)可提供vSR/vFW的服務(wù)部件),而對于原有的VEPA/FCoE/DRX/PoC/分級云等方案,將在基于Overlay的虛擬化網(wǎng)絡(luò)架構(gòu)下重新構(gòu)建和集成,實現(xiàn)技術(shù)演進和延續(xù)的完整性。

圖14 云網(wǎng)融合:H3Cloud從物理網(wǎng)絡(luò)到Overlay虛擬網(wǎng)絡(luò)的集成
4 結(jié)束語
Overlay的網(wǎng)絡(luò)架構(gòu)是物理網(wǎng)絡(luò)向云和虛擬化的深度延伸,云的資源化能力可以脫離物理網(wǎng)絡(luò)的多種限制,但兩個網(wǎng)絡(luò)本身卻是需要連通交互才能實現(xiàn)云的服務(wù)能力,隨著技術(shù)的發(fā)展,主機的Overlay技術(shù)也將向硬件化發(fā)展,并逐步會成為物理網(wǎng)絡(luò)的一部分。但Overlay尚沒有深度成熟,還需要較長時間發(fā)展和應(yīng)用,其中的問題會逐步暴露和解決。