分析100G網絡對于云計算網絡的重要性
1 重新認識100G對于云計算網絡的重要性
1.1 大規模運營的云計算需要100G網絡
云計算的服務供應從技術和運營的角度看擁有近乎無限的計算、存儲、數據通信能力,那么提供云計算服務的IT架構必然是集結了大規模基礎資源的數據中心"超級航母"。
云計算IT資源的大規模集中運營,可極大優化基礎資源的分布與調度。所以,理想的業務模型是,對于使用云計算服務的企業或個人,能夠滿足IT業務的最佳方式為計算能力按需增長、應用部署快速實現、工作負載可動態調整、投入成本規劃可控。對于云計算服務供應商而言,為滿足大量客戶(個人或企業)的IT資源需求,其運營的IT基礎架構需要有一個大規模的資源池,可基于服務客戶數量的增長、客戶業務負載增長的需求變化情況提供匹配的IT資源支持能力。
大規模的IT集中建設與運營還帶來了大幅度的成本節約效應,來自國外的一份數據展示(如圖1所示),在大規模IT服務環境下,網絡、存儲、服務器/管理等各方面的投入都會在單位資源尺度內極大降低,從而在大規模經營條件下可以使得單位資源帶來更大的產出。
圖1 大規模運營云計算的成本效益
在大規模云計算環境下,性能無疑成為最為關注的核心要素。當前以千兆/萬兆為主流(廣域網很多企業還處在155/622M)的常規基礎網絡或許能夠滿足云計算服務初期或者小規模云服務的要求,但隨著云計算資源和規模的不斷擴大,量變必然導致質變,云計算數據中心成為信息計算服務的核反應中樞,以100G為基礎接口的網絡分發將很快成為大規模云計算的必然選擇。
以國內某互聯網公司為例,單個數據中心規模超過萬臺服務器,在實現多個數據中心的后端網絡連接后,發現內部業務量隨著整體規模的擴大(數據中心規模擴大、數據中心數量增加)上升很快,單個數據中心到內部業務網絡的鏈路已經擴至16根10G,因此,尋求N*400G/1000G超高速互聯的是高性價比的方案選擇。
1.2 流量激增的云計算內部
云計算的服務模式,架構上從低至高一般分為IaaS/PaaS/SaaS三種(通稱I-P-S模式),如圖2所示。云計算的著眼點在于"計算",以不同的計算形式來支撐云的服務,通常情況下,我們將云計算的計算技術分成兩種:虛擬化技術和集群技術。
圖2 I-P-S模式云計算
虛擬化技術
虛擬化本質在于對物理服務器的計算能力(當然還包括IO、內存、存儲空間等)進行邏輯的顆粒化分割,每個分割單元都可以作為獨立的計算單元運行,這樣使得一臺物理服務器上虛擬出多個邏輯服務器,也就是虛擬機,這種方式也稱為1:N的虛擬化(如圖3所示)。
由于大多數物理服務器CPU利用率低下,大量可用計算資源處于閑置,為了提高服務器的利用率,采用虛擬化技術將多個應用集中到單臺服務器上(當前的集中比例可達到15:1,將來的集中比可達到40:1~60:1),大幅有效提升計算資源利用率。但這樣帶來的另一個效果是,多個應用的IO疊加使得服務器的吞吐量密集提升(如圖3所示),單位網絡內數據流量十幾甚至數十倍的增長,開始挑戰網絡轉發、傳送性能上限,密集計算的吞吐導致現有的千兆網絡接入開始形成瓶頸。
圖3 虛擬化的密集流量
在云計算特別是IaaS的服務模式下,廣泛采用虛擬化技術來進行計算資源的調度服務,同時服務器多核技術迅速發展,而且服務器的網卡進一步向高速萬兆接口演進,這使得云計算在服務器接入的IO處理層面不僅帶寬擴大,而且流量激增,這直接對骨干網絡層面提出了超萬兆或面向40G/100G的基本要求。
大規模集群技術
集群技術的目的,是將大量的服務器通過集群方式整合起來,形成一個具有大規模計算處理能力的"巨型計算機",從而完成巨大的計算處理任務,這也是一種N:1的虛擬化技術(如圖4所示)。在這樣的計算應用中,幾乎每一臺服務器都處在重負荷的計算與吞吐環境,并且由于大型集群內子群之間的密集數據交換,導致了網絡上各個方向大規模的數據傳輸,性能要求已經超越100G規模。
圖4 大規模集群的密集流量
萬臺級服務器無阻塞交換(10000GE=100*100G)已經成為互聯網行業云計算業務的基本要求。當前對高密、超高密萬兆端口的需求已經達到了目前技術的門限,向100G帶寬過渡、并繼續提出高密40G/100G端口的挑戰需求是大勢所趨。#p#
2 100G云網方案
40G/100G已經標準化,各設備廠商均已進入產品交付的實質開發階段,因此,以10G接入、40G/100G為骨干的云計算網絡逐步會形成系統性的解決方案。
針對云計算網絡,H3C已在實踐一個全面配套路由、交換、安全的云網解決方案(如圖5所示)。通過100G的超高速云內部交換網絡、云間100G高速專線、100G擴展性安全,從而構建整個云計算100G全端網絡架構。
圖5 云網方案分布圖
云數據中心內部網絡的關鍵要素(如圖6所示)
虛擬機感知與精確控制:基于標準化EVB、EVPA的虛擬機(VM)接入網絡,將云中每個虛擬計算單元VM映射到交換網絡上,創建虛擬端口(vPort)對應,并通過虛擬通道vChannel關聯和控制(在EVB VEPA中的Multi Channel技術,H3C通過vChannel+vPort方式來實現)。對應于VM的創建、遷移、釋放,網絡上也有相應的vChannel和vPort的創建、遷移、釋放,從而網絡對虛擬計算的感知可控制轉換為對自身虛擬端口的操作,從而實現精確控制。
統一交換架構:在萬兆接入,40G/100G骨干的數據中心無損交換網(Lossless Ethernet),統一承載計算流量和存儲流量,實現基礎架構的精簡和布線的簡化,在保證網絡性能、計算能力、存儲效率的同時,降低云計算關鍵網絡的購買成本與運維成本。
無阻塞L2/L3并行多路徑FAT Tree 100G網絡:云計算不論是虛擬化部署還是大規模集群的實施,對交換網絡性能要求極高,單接口的100G帶寬并不能完全滿足業務要求,因此提出了通過無阻塞的組網方式來滿足超大規模計算能力的連接。目前業內實現計算的連接方式有L2(二層)、L3(路由)或其混合方式,不論哪種方式,都要求充分利用核心的N*100G,在云的內部形成多路徑傳輸計算結構。對路由模式傳統上稱為ECMP(即通常理解的等價路由);對二層模式稱為L2MP(二層多路徑)。在北美地區,更流行FAT Tree的說法,不論使用L2還是L3技術,構建一個大規模的無阻塞網絡結構。在H3C的解決方案中,充分利用IRF2 (智能彈性架構)技術,結合當前的新標準(如TRILL/L2VPN)等,在100G的核心網絡上提供一個可同時支持L2/L3多路徑,使得計算通信具備更好的靈活性和擴展性。
圖6 云計算數據中心內網絡
高速云專線:100G的可分散、可聚合的云間聯網、云內傳送網
圖7給出了一種比較復雜的云服務模式,企業A分別從SP-A和SP-B獲得云計算服務,在每個SP內部,又從不同地理位置的IDC獲得服務,而用戶除了構建自身的私有云,還在用運營商的公共云服務,這里就存在云計算服務靈活供應的多重模式要求,我們稱之為可分散、可聚合的云結構。
可分散、可聚合: 對于整體云計算服務而言,用戶的業務訪問和服務體驗是完全不依賴于計算所在的物理位置的,然而企業或機構在實際部署云計算數據中心時的地址選擇必然又受實際環境如光纖線路、地理位置、能源供應等基礎設施的影響,使得云數據中心規模或大或小,或集中或分散,或分布在一個園區,或分散在多個地域。這就要求網絡不僅有效支持每個云中心的計算服務,還需要整合各地域的云中心,形成一個聚合后的服務整體,因此靈活的DCI(Data center interconnection)和CSI(Cloud service interconnection)方案是實現可分散、可聚合云專線的基礎,這將由H3C的100G路由器結合云路由軟件操作系統平臺來實現。
圖7 可分散、可聚合的云間網/云內網
集成與可擴展的統一安全控制
在H3C的100G云網方案中,基于交換集成的安全結構,融合IRF2的統一管理方式,在每個交換槽位提供N*10G的防火墻安全性能如圖8所示,并實現一個IRF交換系統上所有防火墻模塊的統一虛擬化和管理控制,從而形成云網安全的單系統200G級別安全處理性能資源池,根據性能需要可部署多套系統以滿足更高性能處理的需求,而在統一安全中心的管理下,可實現云網安全的整體監控與管理策略,使得云計算的安全控制可管理易運維。
圖8 虛擬化可擴展安全防護
云計算的大規模運營,給傳統網絡架構和傳用應用部署經驗都帶來了挑戰,將來只能是全端的100G網絡支撐這種巨型的計算服務,不論是技術革新還是架構變化,都需要服務于云計算的性能要求,滿足動態、彈性、靈活,并實現網絡部署的簡捷化。