打破AI算力瓶頸的,是基于FPGA的異構計算加速平臺解決方案
原創【51CTO.com原創稿件】無人超市落地、類人機器人采訪、無人車即將量產…當下, AI融入各個細分領域,正在悄然改變著我們的生活。但要實現如同科幻電影中人機互動的效果,算力是緊要瓶頸之一。硬件算力是AI向前發展必不可缺的條件之一,GPU/ASIC/FPGA都是解決龐大計算量的加速引擎。
鄔剛·加速云創始人兼CEO
近日,杭州加速云信息技術有限公司(簡稱:加速云)加速云創始人兼CEO鄔剛在新品發布會上表示:“人工智能未來發展存在瓶頸,需要硬件技術和算法方面的突破。異構計算是計算架構的未來趨勢,而FPGA 是實現異構計算的***選擇。”
基于FPGA的深度學習方案助力深度學習模型高效運轉
在大數據時代,深度學習是人工智能的主要推動力。最近幾年大數據和計算力的快速增長使得深度學習技術有了質的飛躍,從而在計算機視覺、語音識別、自然語言處理等領域出現了重大突破。然而深度學習需要大量的并行計算,對硬件平臺有極高的要求,傳統的計算機是無法滿足的。
現有的解決方案是使用GPU來完成深度學習的訓練,但GPU的功耗太高,性能功耗比差,處理延時大,在大規模推理部署和一些對延時敏感的場景就不是很適合。由于FPGA具有很高的性能功耗比,而且基于門級電路設計使得FPGA是一個超低延時和確定延時的方案,FPGA的可編程性及動態可重構可以適應深度學習未來算法的變化,IO可編程性可以滿足更多業務需求(網絡加速,邊緣計算),因此基于FPGA的深度學習方案成為未來技術發展方向。
此次發布會,加速云推出一整套基于FPGA的深度學習加速方案,包括SC-OPM/SC-OPF/SC-OPS加速卡及FDNN加速庫,快速滿足市場需求。
SC-OPS加速卡
SC-OPS基于Intel***14nm工藝的 Stratix10 FPGA,能夠提供2800K LE及9.2TFLOPS的計算性能,支持8個DDR4控制器,提供高達150GB/S訪存帶寬,提供PCIe*16Lane接口,支持高達128Gbps的訪問速度,致力滿足數據中心高性能深度學習加速。
SC-OPM/SC-OPF加速卡
SC-OPM/SC-OPF基于Intel最20nm工藝的 ARRIA 10 FPGA,能夠提供1150K~2*1150K LE及1.5~2TFLOPS計算性能,致力滿足數據中心和邊緣計算網關深度學習加速。
FDNN加速庫
FDNN加速庫是一套基于RTL的深度神經網絡加速庫FDNN,可以實現參數可配置的CNN/DNN/LSTM,也提供高性能的常見網絡模型加速庫(包括Lenet,VGG16,Darknet19,YOLOV2,RestNet,DNN,LSTM),致力滿足客戶對深度學習高性能、靈活性加速要求。
基于FPGA完整的OpenCL異構開發環境
為了方便客戶使用高層語言開發,加速云提供基于FPGA完整的OpenCL異構開發環境,快速實現用戶自定義的深度學習加速方案。同時也提供快速深度神經網絡定制加速服務。
方案特點:
A. 高性能集成IP,便于使用和二次開發
B. 豐富IO接口,方便靈活擴展
C. 模塊化設計,支持各種應用場景
D. 高性能功耗比,降低運營成本
E. 超低延時及確定性延時,支持時間敏感型應用場景
具體性能指標:
深度學習加速方案應用—圖片OCR
某電商平臺每天要面對大量的客戶開店和業務申請需求,需要大量的營業執照等證件審核,傳統采用人工審核方法,但隨著業務的增長,人工審核是不可能完成,采用深度學習的圖片OCR就是一個很好的解決方案。
基于深度學習的圖片OCR方案包括文字定位和文字識別兩部分,文字定位采用4層CNN網絡,文字識別采用4層雙向LSTM,由于CNN部分計算量不大,主要的計算量在LSTM,因此對LSTM部分加速。
原有方案采用GPU完成,但存在兩個問題:
- 處理延時很大,不能滿足要求
- 有些圖片中的文字超長,在超長文字和一般長度文字一起送入GPU處理時一般長度文字處理時間和超長文字時間一樣,這使得業務無法到達上線條件。
具體LSTM規格如下:
加速云采用FPGA方案實現完成的雙向LSTM的加速,從而滿足客戶要求,具體方案特性如下:
- 采用SC-OPM加速卡(半高半長:56*167mm)
- Altera Arria 10 GX660器件, 集成 660k LE和1.5T FLOPS 單精度浮點處理能力
- 四層LSTM+1層全連接,各層網絡參數可以軟件配置下載
- 可以實現40000T/S的流量,延時超低,數據長度可以混合長度
- 單卡只有33W
除上述內容,本次發布會加速云還推出了 FBLAS IP庫、高性能計算及數字信號處理解決方案、邊緣計算解決方案。
在采訪過程中,鄔剛表示:“加速云是從技術上推導出來的一家公司,解決方案可以廣泛應用于深度學習、人工智能、金融、機器視覺等領域。目前已與阿里、騰訊、科大訊飛等多家企業開展深入合作。”
寫在***:
最初,FPGA只是用于膠合邏輯(Glue Logic),從膠合邏輯到算法邏輯再到數字信號處理、高速串行收發器和嵌入式處理器,FPGA真正地從配角變成了主角。高性能計算及數字信號處理、邊緣計算、AI等新應用需求的出現給FPGA帶來歷史性的發展機遇。目前,國內廠商的主導市場仍在應用終端以及中低端的后臺服務器市場,要想走入云端,打破AI算力瓶頸外,還必須打破在FPGA高端技術人才、先進工藝制程等方面瓶頸,建立起自己的生態。
【51CTO原創稿件,合作站點轉載請注明原文作者和出處為51CTO.com】