NVIDIA AI數(shù)據(jù)平臺(tái)與硅光網(wǎng)絡(luò)交換機(jī):驅(qū)動(dòng)下一代AI基礎(chǔ)設(shè)施的技術(shù)革新
原創(chuàng)隨著人工智能(AI)技術(shù)的高速發(fā)展,企業(yè)對(duì)計(jì)算、存儲(chǔ)和網(wǎng)絡(luò)的需求正經(jīng)歷前所未有的變革。傳統(tǒng)的IT基礎(chǔ)設(shè)施已難以滿足AI工作負(fù)載對(duì)實(shí)時(shí)性、能效和擴(kuò)展性的嚴(yán)苛要求。
為應(yīng)對(duì)這一挑戰(zhàn),NVIDIA在2025年GTC大會(huì)上發(fā)布了兩項(xiàng)關(guān)鍵技術(shù)創(chuàng)新:NVIDIA硅光網(wǎng)絡(luò)交換機(jī)與AI數(shù)據(jù)平臺(tái)。前者借助硅光技術(shù)突破網(wǎng)絡(luò)瓶頸,為百萬(wàn)級(jí)GPU集群的AI工廠提供高速、低能耗的通信解決方案。后者通過(guò)優(yōu)化存儲(chǔ)與計(jì)算的協(xié)同,賦能企業(yè)高效處理海量數(shù)據(jù)。這兩項(xiàng)技術(shù)的發(fā)布,不僅代表了當(dāng)前AI基礎(chǔ)設(shè)施的前沿趨勢(shì),更將重塑未來(lái)數(shù)據(jù)中心的設(shè)計(jì)邏輯。
AI時(shí)代的基礎(chǔ)設(shè)施挑戰(zhàn)與創(chuàng)新
眾所周知,AI模型的訓(xùn)練與推理需要快速訪問(wèn)海量數(shù)據(jù),而傳統(tǒng)存儲(chǔ)系統(tǒng)因帶寬和延遲限制,往往成為性能瓶頸。與此同時(shí),隨著AI工廠規(guī)模擴(kuò)展到數(shù)百萬(wàn)GPU,傳統(tǒng)銅纜網(wǎng)絡(luò)的能耗和信號(hào)衰減問(wèn)題日益突出。
在解決海量數(shù)據(jù)訪問(wèn)性能瓶頸上,NVIDIA推出的AI數(shù)據(jù)平臺(tái)通過(guò)整合加速計(jì)算、智能網(wǎng)絡(luò)與專用代理式 AI,實(shí)現(xiàn)了存儲(chǔ)與計(jì)算的深度協(xié)同。
此外,隨著硅光技術(shù)的成熟,標(biāo)志著網(wǎng)絡(luò)通信從電信號(hào)向光信號(hào)的全面過(guò)渡,為分布式AI訓(xùn)練與推理提供了底層支撐。而本次NVIDIA推出的Spectrum-X Photonics與Quantum-X Photonics交換機(jī),則采用了光電一體化封裝,很好的解決了傳統(tǒng)銅纜網(wǎng)絡(luò)的能耗和信號(hào)衰減問(wèn)題。
據(jù)了解,NVIDIA AI數(shù)據(jù)平臺(tái)的核心在于通過(guò)NVIDIA Blackwell GPU與BlueField DPU的組合,以硬件加速的方式大幅提升了數(shù)據(jù)檢索與推理速度。根據(jù)NVIDIA公布的相關(guān)數(shù)據(jù)顯示,BlueField DPU的性能比基于CPU的存儲(chǔ)性能提升最高可達(dá)1.6倍,而功耗又比其降低可達(dá)50%,每瓦性能提高3倍以上。與傳統(tǒng)以太網(wǎng)相比,Spectrum-X通過(guò)采用動(dòng)態(tài)路由和優(yōu)化的擁塞控制,可將AI存儲(chǔ)流量提速最高達(dá) 48%。
在軟件方面,通過(guò)不斷的優(yōu)化,NVIDIA AI-Q Blueprint與NeMo Retriever微服務(wù)將數(shù)據(jù)提取速度提升15倍,并通過(guò)AI查詢智能體(AI Query Agents)支持多源異構(gòu)數(shù)據(jù)的實(shí)時(shí)處理。
在網(wǎng)絡(luò)方面,全新發(fā)布的硅光網(wǎng)絡(luò)交換機(jī)性能與功耗方面也實(shí)現(xiàn)了重要的空破。數(shù)據(jù)顯示,通過(guò)減少激光器數(shù)量并優(yōu)化光路設(shè)計(jì),能耗效率提高到傳統(tǒng)方案的3.5倍,信號(hào)完整性提升到63倍。此外,動(dòng)態(tài)路由與智能擁塞控制技術(shù)使網(wǎng)絡(luò)可靠性提升到10倍,部署速度加快到1.3倍。
重新定義企業(yè)AI基礎(chǔ)設(shè)施
隨著NVIDIA硅光網(wǎng)絡(luò)交換機(jī)與AI數(shù)據(jù)平臺(tái)的發(fā)布,企業(yè)AI基礎(chǔ)設(shè)施也將會(huì)被重新定義。
根據(jù)相關(guān)技術(shù)資料顯示,AI數(shù)據(jù)平臺(tái)核心組件包括Blackwell GPU、BlueField DPU和Spectrum-X網(wǎng)絡(luò)。其中,Blackwell GPU專為AI推理優(yōu)化,支持多模態(tài)數(shù)據(jù)處理(文本、圖像、視頻)。BlueField DPU用于卸載CPU負(fù)載,加速存儲(chǔ)訪問(wèn)與安全隔離。Spectrum-X網(wǎng)絡(luò)則通過(guò)動(dòng)態(tài)路由技術(shù),將AI存儲(chǔ)流量提速48%。
在關(guān)鍵功能方面,AI-Q Blueprint提供了標(biāo)準(zhǔn)化開(kāi)發(fā)框架,支持企業(yè)快速構(gòu)建代理式AI系統(tǒng)。NVIDIA NIM微服務(wù)集成Llama Nemotron等開(kāi)源推理模型,降低AI部署門檻。
硅光網(wǎng)絡(luò)交換機(jī)能夠幫助企業(yè)構(gòu)建AI工廠的“光速通道”。其中,Spectrum-X Photonics支持128×800Gb/s或512×200Gb/s端口,總帶寬達(dá)100 Tb/s。Quantum-X Photonics采用了液冷設(shè)計(jì),實(shí)現(xiàn)了高效散熱確保光器件在高溫環(huán)境下的穩(wěn)定性。性能方面,在InfiniBand協(xié)議下,計(jì)算網(wǎng)速度提升2倍,擴(kuò)展性提升5倍。
由于采用了TSMC-SoIC 3D 芯片封裝,整合硅光芯片與先進(jìn)制程,降低信號(hào)傳輸損耗。可插拔模塊設(shè)計(jì)則讓Coherent與Lumentum提供兼容性光模塊,支持快速部署。
在應(yīng)用場(chǎng)景方面,AI數(shù)據(jù)平臺(tái)可實(shí)時(shí)分析交易日志與市場(chǎng)數(shù)據(jù),檢測(cè)異常模式。結(jié)合NVIDIA NIM的醫(yī)療影像分析系統(tǒng),能夠快速檢索患者歷史數(shù)據(jù)并提供診斷建議。
強(qiáng)大生態(tài)賦能AI發(fā)展
在推出AI 數(shù)據(jù)平臺(tái)和硅光網(wǎng)絡(luò)交換機(jī)的同時(shí),NVIDIA也在通過(guò)積極的構(gòu)建生態(tài),攜手業(yè)界合作伙伴共同賦能AI發(fā)展。
據(jù)了解,NVIDIA 認(rèn)證的存儲(chǔ)提供商借助 NVIDIA AI 數(shù)據(jù)平臺(tái)構(gòu)建基礎(chǔ)設(shè)施,通過(guò)專用 AI 查詢智能體,加速 AI 推理工作負(fù)載。這些智能體可助力企業(yè)應(yīng)用 NVIDIA AI Enterprise 軟件平臺(tái)(包括全新 NVIDIA Llama Nemotron 推理模型的 NVIDIA NIM? 微服務(wù))以及全新的 NVIDIA AI-Q Blueprint,近乎實(shí)時(shí)地生成數(shù)據(jù)洞察。
存儲(chǔ)提供商可借助 NVIDIA Blackwell GPU、NVIDIA BlueField? DPU、NVIDIA Spectrum-X? 網(wǎng)絡(luò)以及 NVIDIA Dynamo 開(kāi)源推理庫(kù),優(yōu)化基礎(chǔ)設(shè)施,為此類智能體提供強(qiáng)勁支持。
DDN、Dell Technologies、Hewlett Packard Enterprise、Hitachi Vantara、IBM、NetApp、Nutanix、Pure Storage、VAST Data 和 WEKA 等領(lǐng)先數(shù)據(jù)平臺(tái)和存儲(chǔ)提供商均選擇與 NVIDIA 合作,打造可定制化的 AI 數(shù)據(jù)平臺(tái),充分運(yùn)用企業(yè)數(shù)據(jù)進(jìn)行推理并響應(yīng)復(fù)雜查詢。
在硅光生態(tài)系統(tǒng)伙伴方面,目前已經(jīng)包括了TSMC、Browave、Coherent、Corning Incorporated、Fabrinet、Foxconn、Lumentum、SENKO、SPIL、Sumitomo Electric Industries 和 TFC Communication。
據(jù)了解,NVIDIA photonics 技術(shù)將推動(dòng)新一代先進(jìn) AI 工廠的大規(guī)模增長(zhǎng),并和 Coherent、Eoptolink、Fabrinet 和 Innolight 等業(yè)界領(lǐng)先企業(yè)的可插拔光模塊技術(shù)共同推動(dòng)這一發(fā)展。
寫在最后:創(chuàng)新技術(shù)驅(qū)動(dòng)AI普惠化
NVIDIA的AI數(shù)據(jù)平臺(tái)與硅光網(wǎng)絡(luò)交換機(jī)不僅解決了當(dāng)前AI基礎(chǔ)設(shè)施的痛點(diǎn),更為未來(lái)的技術(shù)演進(jìn)指明了方向。隨著合作伙伴生態(tài)的擴(kuò)展與技術(shù)的持續(xù)迭代,企業(yè)將能以更低成本、更高效率部署AI應(yīng)用,加速?gòu)臄?shù)據(jù)到洞察的價(jià)值轉(zhuǎn)化。在AI工廠與智能代理的協(xié)同下,一個(gè)由數(shù)據(jù)驅(qū)動(dòng)、光速連接的新計(jì)算時(shí)代已然開(kāi)啟。