萬卡級組網暢通無阻!銳捷網絡推出AI-Fabric智算中心網絡解決方案
5月16日,博通主辦的AI網絡研討會在北京成功舉辦。來自國內外的互聯網、運營商等設備廠商齊聚一堂,圍繞博通在智算中心網絡領域的最新技術、產品方案進行了研討交流。與會者分享了各自在AI網絡領域的優秀實踐,這有助于促進客戶、合作伙伴和學術界之間的交流與合作,共同推動業界技術的創新和發展。
銳捷網絡受邀參會,面向下一代AI云服務的智算中心網絡建設,重磅發布了銳捷網絡AI Fabric智算中心網絡解決方案,以其高吞吐、大帶寬、高可用的特性,可應用于大數據處理、機器學習、AIGC多種業務場景,助力客戶構建網卡級別的智算中心網絡,支撐AI業務快速發展。
研發工程師與客戶技術交流
在展會現場,銳捷網絡展出了兩款 AI Fabric 智算中心網絡產品,分別是 400G NCP 交換機——RG-S6930-18QC40F1,以及 200G NCF 交換機——RG-X56-96F1。
- RG-S6930-18QC40F1 交換機的高度為 2U,提供 18 個 400G 的面板口,40 個 200G 的 Fabric 內聯口,4 個風扇和 2 個電源。
- RG-X56-96F1 交換機的高度為 4U,提供 96 個 200G 的 Fabric 內聯口,4 個風扇和 4 個電源。
左:NCF產品(RG-X56-96F1) 右:NCP產品(RG-S6930-18QC40F1)
在AI研討會上,銳捷網絡劉洋發表了《面向下一代AI云服務的智算中心網絡》主題演講。他認為隨著人工智能生成內容的技術賦能,全球各大云服務商也推出了屬于自己的大模型和對應的AI云服務,加速計算服務器的迅猛發展的同時,也加快了云用戶對AI加速卡的部署進程。因此,如何在AI云服務這個業務模式中保持強有力的競爭力,提升集群的GPU效率變得尤為關鍵。在網絡層面上,提升通信帶寬利用率,降低動態時延以及實現無損的網絡傳輸是提升業務效率、降低成本的關鍵指標。
銳捷網絡解決方案經理劉洋演講現場
針對以上關鍵指標,銳捷網絡推出了AI Fabric智算中心網絡解決方案,AI Fabric方案基于高性能芯片技術,通過將數據流切分成等長的Cell并Hash到所有鏈路,最大化網絡帶寬利用率;基于VOQ+Credit的端到端流控機制實現與業務無關的無損自閉環網絡,同時以NCP+NCF為基礎模塊橫向擴展的三級網絡架構,可以支撐18K~32K規模的GPU卡集群,助力下一代AI云服務的智算中心網絡建設。
AI Fabric智算中心網絡解決方案組網架構
在研發 AI Fabric 智算中心網絡解決方案的同時,銳捷網絡打造了分布式 OS,旨在簡化部署,提高系統可靠性。傳統的 DDC (Distributed Disaggregated Chassis,分布式分散式機箱)由于控制面集中,一旦 NCC (Network Cloud Controller網絡云控制器)失聯,就會影響整個網絡,從而影響整個業務流程。另外,由于版本不兼容,如果部分設備需要升級,就會面臨巨大的運維難題。銳捷網絡 AI Fabric 智算中心網絡解決方案采用去中心化的分布式 OS,實現了控制面與管理面解耦。即使管理平臺出現問題,也不會影響整個網絡的運行。與此同時,它還解決了兼容性問題,設備可以獨立升級,大幅降低了運維難度。
來自行業各界的客戶、專家
作為下一代AI云業務智算中心網絡建設者,銳捷網絡致力于在智算數據中心領域提供高品質、高可靠性的整體網絡解決方案和先進的產品,以滿足客戶對智算中心不斷提高的需求,助力客戶提升業務效率,降低成本。
未來,銳捷將持續精進AI Fabric智算中心網絡解決方案,在降低時延、提高在網計算性能、實現端網融合等方面持續突破,打造高速互聯、彈性可擴展、綠色節能的下一代AI云服務智算中心網絡。此外,銳捷還在積極探索開發基于高性能芯片組網中的端網協同方案,結合智能網卡端到端網絡性能的優化,與客戶一起邁向AIGC智算時代。