騰訊云推出國(guó)內(nèi)首款FPGA云服務(wù)器,F(xiàn)PGA的普及化應(yīng)用時(shí)代到來(lái)
1月20日,騰訊云宣布,推出國(guó)內(nèi)首款高性能異構(gòu)計(jì)算基礎(chǔ)設(shè)施——FPGA云服務(wù)器,以云服務(wù)方式將大型公司才能長(zhǎng)期支付使用的FPGA推廣到更多企業(yè)。通過FPGA云服務(wù)器,企業(yè)可以進(jìn)行FPGA硬件編程,可將性能提升至通用CPU服務(wù)器的30倍以上,而只需支付相當(dāng)于通用CPU約40%的費(fèi)用。此舉讓騰訊云成為國(guó)內(nèi)首家在云端開放FPGA計(jì)算服務(wù)的云服務(wù)商。
騰訊云官網(wǎng)現(xiàn)已開放FPGA使用申請(qǐng)
與已經(jīng)深入人心的高性能計(jì)算的代表GPU相比,F(xiàn)PGA具有硬件可編程、低功耗、低延時(shí)的特性,代表了高性能計(jì)算的未來(lái)發(fā)展趨勢(shì)。企業(yè)可以在火熱的深度學(xué)習(xí)領(lǐng)域,將FPGA用于深度學(xué)習(xí)的檢測(cè)階段,與主要用于訓(xùn)練階段的GPU互為補(bǔ)充。不僅如此,F(xiàn)PGA還可應(yīng)用于金融分析、圖像視頻處理、基因組學(xué)等需要高性能計(jì)算的領(lǐng)域,是這類對(duì)效率要求高的行業(yè)應(yīng)用的***選擇。
例如金融行業(yè)實(shí)時(shí)處理交易數(shù)據(jù),使用通用CPU處理延時(shí)大、成本高,而使用FPGA可以很好的解決上述問題,F(xiàn)PGA在搜索領(lǐng)域也因?yàn)榈脱訒r(shí)被互聯(lián)網(wǎng)搜索公司深度應(yīng)用。FPGA之所以比CPU甚至GPU能效高,本質(zhì)上是無(wú)指令、無(wú)需共享內(nèi)存的體系結(jié)構(gòu)帶來(lái)的福利。
騰訊云副總裁王慧星認(rèn)為,F(xiàn)PGA從底層開始變革人工智能的設(shè)計(jì)邏輯,加速企業(yè)業(yè)務(wù)在云端的處理能力,推動(dòng)全行業(yè)在人工智能領(lǐng)域的創(chuàng)新步伐。他進(jìn)一步指出,F(xiàn)PGA已經(jīng)在QQ、微信等騰訊海量業(yè)務(wù)中長(zhǎng)期使用,具備深厚的技術(shù)積累和復(fù)雜的場(chǎng)景實(shí)踐,希望這項(xiàng)的技術(shù)開放大大降低企業(yè)的使用門檻,讓大中小型企業(yè)都搭上人工智能這班列車。
FPGA的應(yīng)用場(chǎng)景:深度學(xué)習(xí)、圖片處理等領(lǐng)域測(cè)評(píng)優(yōu)勢(shì)明顯
FPGA誕生至今已有30余年,此前主要應(yīng)用于大型互聯(lián)網(wǎng)和科技公司,騰訊等互聯(lián)網(wǎng)大型企業(yè)均在數(shù)據(jù)中心批量部署了FPGA,為自身的深度學(xué)習(xí)等應(yīng)用提供硬件加速平臺(tái)。
與傳統(tǒng)的計(jì)算架構(gòu)相比,F(xiàn)PGA能夠更好地支撐深度學(xué)習(xí)等大規(guī)模并行計(jì)算需求。通過與通用CPU橫向測(cè)試對(duì)比表明,F(xiàn)PGA在深度學(xué)習(xí)、圖片壓縮和分類檢測(cè)等應(yīng)用場(chǎng)景中,在成本、性能上具有明顯優(yōu)勢(shì)。
FPGA在騰訊的深度學(xué)習(xí)領(lǐng)域被廣泛應(yīng)用,深度學(xué)習(xí)在圖片分類識(shí)別、語(yǔ)音識(shí)別、個(gè)性化內(nèi)容推薦算法等領(lǐng)域廣泛應(yīng)用。其中,微信、QQ為了增強(qiáng)社交通訊等業(yè)務(wù)的違規(guī)圖片檢測(cè)的處理能力,降低圖片檢測(cè)成本,通過FPGA對(duì)深度學(xué)習(xí)模型的CNN算法進(jìn)行加速后,F(xiàn)PGA處理性能是通用CPU的4倍,單位成本是通用CPU的1/3。
FPGA在圖片處理的優(yōu)勢(shì)也很明顯,用戶每天通過微信和QQ等社交平臺(tái)上傳了海量的圖片,如果采用WEBP圖片壓縮格式替代標(biāo)準(zhǔn)的JPEG格式,圖片大小可減少三分之一,同時(shí)給用戶帶來(lái)更好的圖片下載體驗(yàn)。而通過FPGA對(duì)大小為853x640的圖片轉(zhuǎn)碼進(jìn)行加速測(cè)試得出,F(xiàn)PGA的處理延時(shí)比通用CPU降低20倍,處理性能是通用CPU的6倍,而FPGA單位成本僅為通用CPU的1/3。
另一項(xiàng)測(cè)試表明,F(xiàn)PGA在DNN計(jì)算加速上有較明顯的優(yōu)勢(shì)。國(guó)內(nèi)外的搜索引擎公司普遍使用DNN算法用于廣告搜索,騰訊使用FPGA對(duì)DNN計(jì)算進(jìn)行加速測(cè)試得出,在使用50%的FPGA資源的情況下,將4000個(gè)樣本的DNN計(jì)算時(shí)延減小為1.2毫秒,吞吐率達(dá)到6000集合/s(4000個(gè)樣本為1個(gè)集合),不僅達(dá)到了系統(tǒng)對(duì)低延時(shí)的要求,而且極大地提高系統(tǒng)的吞吐能力:處理延時(shí)降低100倍,處理吞吐率提高5倍,而成本是通用CPU服務(wù)器的1/5。
FPGA的部署革命:從數(shù)月到數(shù)分鐘
過去,中小企業(yè)部署FPGA面臨諸多問題:FPGA硬件成本高、靈活性差、一次性采購(gòu)?fù)度氪螅枰甙旱馁M(fèi)用和巨大精力進(jìn)行FPGA的定制和采購(gòu),并需配備相應(yīng)的硬件工程師和軟件工程師。
同時(shí)企業(yè)接下來(lái)還會(huì)面臨FPGA芯片更新?lián)Q代帶來(lái)的資源閑置流轉(zhuǎn)問題。雖然FPGA知識(shí)產(chǎn)權(quán)(FPGA IP,F(xiàn)PGA Intellectual Property)提供了業(yè)務(wù)所需的硬件加速功能,但研發(fā)周期長(zhǎng),研發(fā)投入和風(fēng)險(xiǎn)高,令諸多企業(yè)望而卻步。
騰訊云帶來(lái)的革命性進(jìn)展是:將FPGA部署時(shí)間從數(shù)月縮短到數(shù)分鐘,企業(yè)可按需付費(fèi)使用FPGA,極大降低FPGA的使用成本,實(shí)現(xiàn)高性能FPGA硬件加速處理。同時(shí)騰訊云率先在國(guó)內(nèi)提供第三方FPGA知識(shí)產(chǎn)權(quán)市場(chǎng),通過騰訊云服務(wù)市場(chǎng),FPGA開發(fā)者和使用者可以更高效地交易。
長(zhǎng)期以來(lái),F(xiàn)PGA行業(yè)內(nèi)的提供者和使用者一直缺乏交易平臺(tái)和信用保證,導(dǎo)致交易環(huán)節(jié)冗長(zhǎng),很難達(dá)成交易。騰訊云服務(wù)市場(chǎng)搭建一個(gè)簡(jiǎn)單可靠的FPGA知識(shí)產(chǎn)權(quán)交易市場(chǎng)。對(duì)于FPGA使用者而言,可以在騰訊云服務(wù)市場(chǎng)購(gòu)買已開發(fā)并驗(yàn)證好的FPGA知識(shí)產(chǎn)權(quán)功能,可節(jié)約長(zhǎng)達(dá)數(shù)月的FPGA研發(fā)周期,同時(shí)采用按需使用付費(fèi)的模式,能***化地幫助使用者節(jié)省硬件投入成本。
而FPGA開發(fā)者可以通過使用騰訊云FPGA的開發(fā)框架,顯著提升研發(fā)效率,更專注于核心功能開發(fā),將圖像處理功能、深度學(xué)習(xí)功能等已有的成熟FPGA知識(shí)產(chǎn)權(quán)通過簡(jiǎn)單封裝適配,集成并投放到騰訊云服務(wù)市場(chǎng),開放給FPGA使用者使用,分?jǐn)侳PGA知識(shí)產(chǎn)權(quán)的研發(fā)成本。
王慧星認(rèn)為,對(duì)于云計(jì)算行業(yè)而言,在云端提供FPGA是云計(jì)算IaaS層面革命性的推進(jìn),從底層開始加速云計(jì)算在各個(gè)場(chǎng)景中的應(yīng)用,云計(jì)算將從純粹的資源服務(wù)邁向人工智能云服務(wù)時(shí)代。
了解騰訊云FPGA 云服務(wù)器的更多信息https://www.qcloud.com/product/fpga