MLPerf最新榜單:阿里AI算力斬獲多項(xiàng)第一
4月7日,權(quán)威AI基準(zhǔn)評(píng)測(cè)組織MLPerf公布了最新一期推理性能榜單。阿里云聯(lián)合平頭哥、達(dá)摩院等在數(shù)據(jù)中心、邊緣計(jì)算、物聯(lián)網(wǎng)領(lǐng)域斬獲多項(xiàng)第一,展現(xiàn)出阿里AI算力的強(qiáng)大競(jìng)爭(zhēng)力。
北京時(shí)間4月7日,MLCommons發(fā)布最新MLPerf榜單
MLPerf由圖靈獎(jiǎng)得主David Patterson于2018年發(fā)起,每年組織全球AI訓(xùn)練和AI推理性能測(cè)試并發(fā)榜,已成為業(yè)界最主流標(biāo)準(zhǔn)之一。本次榜單重點(diǎn)更新了面向數(shù)據(jù)中心和邊緣計(jì)算的場(chǎng)景,以及最新的MLPerf Tiny 0.7測(cè)試榜單。
在當(dāng)前激烈的數(shù)據(jù)中心和邊緣計(jì)算場(chǎng)景下,各廠商及機(jī)構(gòu)基于硬件加速的成績(jī)差距并不大,競(jìng)爭(zhēng)主要聚焦在模型軟硬協(xié)同優(yōu)化方面。最終,阿里云磐久服務(wù)器脫穎而出,成為MLPerf有史以來(lái)首個(gè)獲得純CPU推理性能最高的ARM架構(gòu)服務(wù)器,且在數(shù)據(jù)中心和邊緣側(cè)該類(lèi)別的總體性能均為第一。
MLPerf 2.0 DatacenterCPU-Only推理性能數(shù)據(jù)對(duì)比
據(jù)悉,阿里云震旦異構(gòu)加速平臺(tái)利用模型優(yōu)化工具SinianML來(lái)進(jìn)行用于AI任務(wù)的神經(jīng)網(wǎng)絡(luò)架構(gòu)搜索和壓縮,以及最佳算子實(shí)現(xiàn)。在保證達(dá)到基準(zhǔn)測(cè)試精度目標(biāo)同時(shí),能得到遠(yuǎn)高于標(biāo)準(zhǔn)ResNet50 v1.5的計(jì)算效率。此外在MLPerf Tiny場(chǎng)景,阿里云通過(guò)大規(guī)模深度算子融合和針對(duì)平頭哥玄鐵RISC-V微架構(gòu)的極致優(yōu)化,從而能夠大大提高CPU算力利用率,實(shí)現(xiàn)軟硬協(xié)同優(yōu)化。
Tiny場(chǎng)景是MLPerf近年新增的性能測(cè)試分類(lèi)。有別于Datacenter等大規(guī)模、高算力的情景,Tiny聚焦于低功耗、高性?xún)r(jià)比的IoT場(chǎng)景,考驗(yàn)在日益廣泛的IoT智能應(yīng)用場(chǎng)景下的軟硬件性能和優(yōu)化能力。在此次公布的MLPerf Tiny 0.7性能數(shù)據(jù)榜單中,阿里云震旦異構(gòu)計(jì)算加速平臺(tái)通過(guò)編譯和軟硬件一體化創(chuàng)新優(yōu)化,結(jié)合達(dá)摩院在語(yǔ)音和視覺(jué)等機(jī)器智能的算法知識(shí),基于平頭哥自研RISC-V玄鐵C906處理器在所有4項(xiàng)Benchmark的CPU性能數(shù)據(jù)均取得第一,在滿(mǎn)足模型精度要求的同時(shí)創(chuàng)造了RISC-V架構(gòu)在該AI基準(zhǔn)測(cè)試榜單上的最好成績(jī)。
MLPerf Tiny 0.7 推理性能數(shù)據(jù)對(duì)比
不難發(fā)現(xiàn),MLPerf正將評(píng)測(cè)環(huán)境更多地向云廠商傾斜,后者已成為AI產(chǎn)業(yè)的主力軍。“高度集成的專(zhuān)業(yè)化AI芯片對(duì)應(yīng)用場(chǎng)景限制很多,我們希望研發(fā)出更通用的軟硬協(xié)同加速平臺(tái)來(lái)發(fā)揮AI應(yīng)用的價(jià)值,”阿里云異構(gòu)計(jì)算首席科學(xué)家張偉豐博士表示。