降低人工智能成本50% 阿里云推出新一代異構實例GN5i
9月12日,阿里云正式推出***一代GPU實例GN5i。這款產品主要適用于深度學習的在線推理(Inference)階段,可一鍵部署TensorFlow等主流深度學習框架,提供智能調度、自動運維、實時擴容等服務。人工智能產業用戶可通過GN5i搭建微秒級響應的AI服務,在線服務成本減少50%以上。
阿里云官網顯示,GN5i采用了英偉達Pascal架構P4圖形處理器,提供***45Tops INT8整型計算能力和11TFlops FP32單精度浮點計算能力,在滿足數據處理吞吐的基礎上,時延***可達微秒級。支持小時付費,也支持包月包年。
此外,針對自建GPU服務器經常會遇到的擴容難、適配難的問題,GN5i規格族提供了靈活彈性的系列化配置,可以根據深度學習計算力的要求,按需選擇合適的規格,分鐘級即可完成實例的創建,并可根據運算力需求進行GPU實例的“Scale-out”水平擴容或“Scale-up”垂直變配。
阿里云高級技術專家龍欣介紹,在面向AI深度學習在線推理場景時,GN5i實例能夠給客戶帶來以下價值:
· 穩定的企業級GPU計算能力,保障深度學習推理任務處理效率;
· 全面兼容主流深度學習框架,如TensorFlow、Caffe、MXNet、CNTK等;
· 配備阿里云高性能SSD云存儲,加速數據的讀取性能;搭配阿里云的OSS存儲服務,能達到***的存儲性價比;
· 在滿足數據處理吞吐的基礎上,時延***可達微秒級;
· 推理型專用GPU,大幅降低AI在線服務建設成本;
· GN5i的推出進一步豐富了阿里云異構計算家族的產品線。針對模型訓練學習,阿里云在今年5月推出了高性能GPU實例GN5,單實例最多可提供8個英偉達 P100 GPU、2萬多個并行處理核心,***75TFLOPS FP32單精度浮點、150 TFLOPS FP16半精度浮點和37 TFLOPS FP64雙精度浮點運算能力,每個P100搭配的16GB HBM2 3D堆疊內存提供了高達732GB每秒的數據傳輸速率,配合GN5i可有效保障深度學習的處理效率。
除了產品層面,阿里云還提供了全方位的人工智能產業服務,包括智能語音交互、圖像/視頻識別、交通預測、情感分析等技術服務,這些技術正通過阿里云ET對外輸出。過去一年,阿里云推出ET城市大腦、ET工業大腦、ET醫療大腦等行業垂直的人工智能系統,為工廠或者醫院創造更多利潤或者更高的診斷準確率。