星云智聯(lián)發(fā)布S1400系列高速互聯(lián)方案,深度適配 DeepSeek,顯著提升AI計算集群通信效率!
6月3日,星云智聯(lián)宣布在AI智算網絡領域實現關鍵技術突破,正式推出S1400系列AI智算高速互聯(lián)網卡。作為完全自主研發(fā)的國產化解決方案,該產品針對大模型訓練與推理場景的嚴苛需求,以突破性網絡性能重新定義智算集群互聯(lián)標準。 目前,產品已成功適配DeepSeek的DeepEP開源通信庫,顯著提升AI計算集群的通信效率,為AI應用創(chuàng)新注入強勁動力。
S1400系列AI智算高速互聯(lián)網卡具備1x400G或2x200G的網絡接口模式,采用PCIe Gen 5.0 x16接口,提供高達雙向100Mpps的RDMA消息速率。其關鍵特性包括:全面支持RoCEv2協(xié)議標準,并兼容NCCL、DeepEP,BCCL等主流集合通信庫,確保與現有AI生態(tài)的無縫對接。另外,S1400支持先進的GPUDirect技術(GDR、GDA)、用戶態(tài)MR(UMR)操作,為大規(guī)模AI計算集群提供了極致的低延遲和高帶寬。尤為突出的是,S1400系列AI智算高速互聯(lián)網卡自研NBL-SRP協(xié)議支持對所有RoCE v2操作(包括Write/Atomic/Send/Read等)的DDP方式的亂序接收和選擇性重傳,并針對GPU側Atomic操作和低延遲Local read進行了特別優(yōu)化,這些特性進一步彌補了國內生態(tài)在此方面的不足。S1400系列AI智算高速互聯(lián)網卡大幅優(yōu)化了數據處理流程,顯著提升了AI智算場景下的互聯(lián)效率。
在擁塞控制方面,S1400系列搭載了星云智聯(lián)自研的NBL-CC算法。該算法基于RTT探測與丟包統(tǒng)計進行主動的端到端擁塞控制,不依賴交換機特定配置,具有參數少、部署便捷、性能優(yōu)異的特點,能實現快速啟動、快速收斂,并保持交換機低隊列深度與高吞吐量。實際測試數據顯示,NBL-CC相較于傳統(tǒng)的DCQCN算法,在平均性能上提升50%,99分位性能提升48%,尤其在短流場景下提升幅度高達60%-100%,有效保障了網絡的低隊列擁塞和持續(xù)高吞吐。配合自研的NBL-SRP協(xié)議(逐包多路徑、DDP亂序接收、選擇性重傳、快速重傳),S1400系列AI智算高速互聯(lián)網卡在AI主流場景及有損網絡下都能夠充分發(fā)揮接口帶寬潛力,其NCCL通信性能在多個關鍵指標上展現出持平并且部分超越業(yè)界標桿產品,并在特定業(yè)務場景時延測試中表現出與國際頂尖產品相媲美的168us優(yōu)異數據(GDR write 7M + atomic),展現了強大的市場競爭力。
在全球科技競爭加劇的背景下,星云智聯(lián)S1400系列產品的發(fā)布不僅是國產高端網絡技術的突破,更展現了中國企業(yè)在AI基礎設施領域的自主創(chuàng)新能力。通過持續(xù)攻克自研芯片與算法關鍵技術,S1400系列產品的發(fā)布標志著我國在AI基礎設施領域已具備與國際領先水平同臺競技的實力,為構建自主可控的AI產業(yè)生態(tài)鏈提供了關鍵網絡支撐。 星云智聯(lián)將堅定不移地加大研發(fā)投入,推動國產AI算力網絡的技術進步,助力客戶把握人工智能時代的戰(zhàn)略機遇,決勝未來。