開放數據中心大會丨新華三打造新一代智算網絡,助力AIGC時代算力釋放
9月13-14日,2023開放數據中心大會在北京國際會議中心順利召開,本屆大會以“算力使能 開放無限”為主題,圍繞算力行業技術趨勢、數據中心產業生態建設等議題展開研討。新華三集團交換機產品線產品管理部部長陳伯超受邀出席網絡論壇并發表主題演講,分享了AIGC時代下,新華三如何以智算網絡支撐數據中心大規模復雜計算需求的同時,實現速度與效率雙重突破的前瞻思考與實踐。
圖片1.jpg
當前,AIGC應用正以驚人的速度發展,數據顯示,2018至2022年,大模型參數量從1億飆升至5400億,算力需求也隨之爆發式增長。但由于摩爾定律、胖樹架構規模以及并行通信效率的限制,網絡數據傳輸成為算力提升的瓶頸。為打破算力進化的網絡桎梏,助力百行百業享受AIGC技術紅利,新華三集團推出新一代智算網絡解決方案,聚焦超寬網絡、極低時延、端網存一體化、低碳節能四大關鍵方向,全面滿足智算時代對網絡的關鍵技術需求和應用體驗需求。
超寬網絡:加速高性能網絡技術落地
AI集群中,高性能GPU、萬億參數訓練規模以及高速并行計算需求,需要更高的網絡帶寬支撐計算節點間的高效通信。作為網絡先進技術的領導者,新華三集團持續引領高速網絡技術產品化進程,從2017年完成業界首個單框768*100G性能測試,到2023年業界首發800G CPO硅光數據中心交換機,并通過專業機構實測驗證,新華三打造了全系列智算交換機產品及解決方案,引領智算網絡超寬進化。
在高速網絡基礎上,為保障帶寬收益最大化,新華三集團在產品中集成智能無損網絡特性,解決以太網丟包導致的集群性能損失問題。其中,全局負載均衡技術可根據整網交換機節點流擁塞狀態和全網拓撲識別出最優路徑,提升整網吞吐至90%,大大縮短AI訓練周期;SprayLink和AgileBuffer功能為AIGC場景的大象流、老鼠流特征帶來解決方案,可提高95%鏈路帶寬利用率,實現高優先級業務零丟包。
極低時延:優化智算網絡運行效率
大規模算力環境下,時延抖動也會影響AI訓練效率,如何降低計算通信時延,是智算中心充分釋放算力的又一核心問題。新華三集團以領先設計降低設備傳輸時延,H3C S9827系列融合CPO、LPO硅光技術,時延較傳統設計最高可減少25%。此外,為提升智算網絡整體可用性,新華三推出基于DDC超低時延架構的H3C S12500AI系列,有效降低端到端時延和抖動。
陳伯超表示,在傳統胖樹架構下,大規模算力需采用三層網絡架構,轉發時延大,易造成無謂的多跳轉發,也缺少針對多路徑的負載均衡優化技術。為進一步優化智算網絡運行效率,新華三集團基于超寬產品實現Spine-Leaf二層架構,優化全流程傳輸效率,整網帶寬利用率提升20%,端到端時延減少15%。
端網存一體化:提供算力建設全棧產品
與此同時,隨著AI集群規模的增長,計算、存儲、網絡等基礎設施的部署難度也隨之提升。新華三集團整合“云-網-算-存-端”全產業鏈優勢,建立起圍繞AI大模型的“端網存一體化”能力,結合強大的AI服務器、無損網絡解決方案、高性能存儲全系列產品,從模型到基礎設施一站式應用部署,形成端到端的智算解決方案,滿足AI算力建設的全方位需求。
低碳節能:多維度突破功耗困局
高算力往往也伴隨著高能耗,如何構建高效、節能的綠色數據中心,是關乎AIGC可持續發展的重要命題。新華三集團從多維度突破數據中心功耗困局,通過加大光技術的研究,提高網絡速率的同時降低功耗和發熱;通過深挖設備節能潛力,打造高效供電方案、低功耗風扇等提升能效比;通過發展液冷技術,打造冷板式、浸沒式液冷等全棧產品,從底層著手打造綠色數字基礎設施。
隨著智算產業的蓬勃發展,網絡技術必將迎來更多重大革新,新華三集團基于對行業需求和技術演進方向的深刻洞察提出四大網絡技術發展趨勢,包括超大帶寬產品的加速上市、面向Al的以太新協議框架將競相涌現、以CXL為代表的異構計算資源交換技術將持續滲入、嵌入式網絡運維大模型將逐步普及,這四個方向也將是新華三的重點研發投入和技術攻堅方向。
作為網絡領域的領軍企業,面向未來,新華三集團將以行業趨勢為導向,秉持“精耕務實,為時代賦智慧”的理念,持續推動AIGC場景下網絡技術的探索和實踐,不斷精進網絡產品和解決方案,推動百行百業向全面智能化加速邁進。