超強(qiáng)性能+極致應(yīng)用,寶德AI服務(wù)器推動(dòng)智能化發(fā)展
如今,由于云計(jì)算、AI等技術(shù)的出現(xiàn),正在推動(dòng)數(shù)據(jù)中心設(shè)計(jì)的結(jié)構(gòu)性轉(zhuǎn)變,CPU+GPU加速計(jì)算的平臺(tái)成為主流,未來(lái)隨著這些技術(shù)的不斷普及,越來(lái)愈多的行業(yè)、企業(yè)將會(huì)產(chǎn)生類似需求。寶德早已意識(shí)到這一趨勢(shì),并率先推出了AI系列服務(wù)器產(chǎn)品以提升AI訓(xùn)練和AI推理性能。日前,NVIDIA發(fā)布的Ampere架構(gòu)的第三代Tensor Core,更是帶來(lái)了巨大的性能飛躍,可將AI訓(xùn)練時(shí)間從數(shù)周縮短到幾小時(shí),顯著加快了推理速度,無(wú)疑助推了整個(gè)AI行業(yè)的發(fā)展。
寶德首臺(tái)DGX A100交付應(yīng)用,賦能客戶業(yè)務(wù)
DGX A100是適用于所有AI負(fù)載的通用系統(tǒng),能夠?qū)⒂?xùn)練、推理、分析整合至易于部署的單一人工智能基礎(chǔ)架構(gòu),為企業(yè)提供前所未有的運(yùn)算密度、效能和彈性。相比于上代Volta伏特架構(gòu)的V100計(jì)算卡,安培架構(gòu)的A100核心在INT8推理性能、FP32訓(xùn)練性能均實(shí)現(xiàn)20倍提升,F(xiàn)P64高性能計(jì)算也提高2.5倍,是歷史上進(jìn)步最大的一次。
DGX A100系統(tǒng)集成了8個(gè)全新NVIDIA A100 Tensor Core GPU,具有320GB內(nèi)存用以訓(xùn)練最大型的AI數(shù)據(jù)集,以及最新的高速NVIDIA Mellanox® HDR 200Gbps互連。借助于全新DGX的巨大性能飛躍,面對(duì)呈指數(shù)級(jí)速度增長(zhǎng)的AI模型和數(shù)據(jù),讓企業(yè)保持領(lǐng)先地位。
寶德通過(guò)對(duì)本地客戶業(yè)務(wù)的深度洞悉,以及在實(shí)際使用中對(duì)系統(tǒng)性能要求的深度理解,為客戶提供定制化的DGX A100端到端解決方案。近日,寶德成功交付了首臺(tái)DGX A100,再一次證明了寶德助力企業(yè)智能化轉(zhuǎn)型的上乘實(shí)力。
寶德首臺(tái)DGX A100交付應(yīng)用于AI領(lǐng)域。該客戶是一家視頻產(chǎn)品和系統(tǒng)方案提供商,運(yùn)用AI技術(shù)做機(jī)器視覺(jué)、人臉識(shí)別、體溫檢測(cè)等應(yīng)用,涉及大量數(shù)據(jù)。在合作中,我們發(fā)現(xiàn)該客戶的深度學(xué)習(xí)系統(tǒng)已經(jīng)無(wú)法滿足訓(xùn)練需求,因此,寶德基于DGX A100的優(yōu)秀性能,打造了一套定制化解決方案。通過(guò)實(shí)地應(yīng)用,客戶的深度學(xué)習(xí)系統(tǒng)的GPU容量在原基礎(chǔ)上進(jìn)一步提升、GPU集群可并發(fā)處理兩倍的AI訓(xùn)練任務(wù)、顯存帶寬也能達(dá)到1.6TB/s、互聯(lián)能力更迅速并更具擴(kuò)展性。
當(dāng)寶德AI服務(wù)器“遇上”NVIDIA A100 GPU
NVIDIA A100 GPU中的第三代Tensor Core核心速度更快、靈活性更高,同時(shí)也更易于使用,最高性能可達(dá)每秒4億次,同時(shí)通過(guò)新一代NVSwitch技術(shù)實(shí)現(xiàn)GPU間通信性能翻倍提升,最高達(dá)600GB/S。更強(qiáng)計(jì)算性能與更高的GPU間互聯(lián)帶寬可帶來(lái)更高的AI計(jì)算效率,支撐用戶進(jìn)行更大數(shù)據(jù)規(guī)模、更復(fù)雜模型的AI訓(xùn)練。此外,NVIDIA A100 GPU擁有40GB的HBM2內(nèi)存,內(nèi)存帶寬提高70%,達(dá)到1.6TB/s,可以承載更大的深度學(xué)習(xí)模型訓(xùn)練。
得益于敏捷而強(qiáng)大的產(chǎn)品設(shè)計(jì)開發(fā)能力,寶德在業(yè)界較早實(shí)現(xiàn)了對(duì)NVIDIA® Ampere架構(gòu)GPU的快速跟進(jìn),即將推出多款基于NVIDIA® Ampere架構(gòu)的AI服務(wù)器產(chǎn)品。
新一代產(chǎn)品擁有更好的兼容性,拓?fù)浣Y(jié)構(gòu)更靈活:PCIe插槽支持GEN4,支持4到10張PCIe版NVIDIA A100,最多8個(gè)NVMe驅(qū)動(dòng)器,內(nèi)存最大可以支持DDR4-3200,為AI客戶提供專為應(yīng)用場(chǎng)景極致創(chuàng)新優(yōu)化設(shè)計(jì)的AI計(jì)算平臺(tái),進(jìn)一步豐富寶德AI服務(wù)器產(chǎn)品陣列,以更好地應(yīng)對(duì)當(dāng)前海量數(shù)據(jù)爆發(fā)和復(fù)雜模型所帶來(lái)的巨大計(jì)算挑戰(zhàn)。同時(shí)與AI客戶展開緊密合作,幫助其在語(yǔ)音、語(yǔ)義、圖像、視頻、搜索等各方面取得數(shù)量級(jí)的AI應(yīng)用性能提升。