華為云全球率先引入GPU加速型容器,助AI算力高效運(yùn)轉(zhuǎn)
1月25日,華為云·云容器實(shí)例(CCI)全球首發(fā)基于K8S的serverless GPU加速型容器實(shí)例。這是繼華為云在全球首發(fā)基于K8S的容器實(shí)例后,為容器實(shí)例服務(wù)提供更豐富的計(jì)算選擇,給關(guān)注AI、視頻處理等高性能計(jì)算的企業(yè)和開發(fā)者帶來更多的玩法。
AI算力需求迎來爆發(fā)式增長
以AI場景為例,OpenAI發(fā)布研究報(bào)告,透露2012年到2018年6年間單次AI訓(xùn)練的計(jì)算量增加30萬倍,這意味著訓(xùn)練計(jì)算量每3.5個月翻倍,是摩爾定律的5倍。同時,AI正在向各行各業(yè)普及,因此AI算力的需求會出現(xiàn)爆炸式增長。公有云因?yàn)榈统杀镜挠布o需關(guān)注基礎(chǔ)設(shè)施、0交付周期的優(yōu)勢,是客戶在有AI算力需求時是更好的選擇。
隨著容器技術(shù)逐漸被各個領(lǐng)域開發(fā)者接受,大家發(fā)現(xiàn)容器技術(shù)可以提供標(biāo)準(zhǔn)化的容器打包,解決AI場景中不同工具對環(huán)境的依賴。用戶在搭建深度學(xué)習(xí)訓(xùn)練環(huán)境,需要準(zhǔn)備帶GPU的機(jī)器,安裝python,tensorflow,GPU驅(qū)動等,如果要從開發(fā)環(huán)境到測試環(huán)境,再從測試環(huán)境到生成環(huán)境,涉及環(huán)境遷移過程中如何保證環(huán)境的一致性。然而容器帶來的標(biāo)準(zhǔn)化打包能力可以提供了***的解決方案,可以極大降低AI平臺的復(fù)雜度,做到多訓(xùn)練框架并存、大幅簡化生產(chǎn)環(huán)境部署。
目前K8S已經(jīng)成為業(yè)界最主流的容器管理平臺,它提供靈活的編排調(diào)度系統(tǒng),可以滿足大規(guī)模、高并發(fā)的AI分布式訓(xùn)練,大幅提高訓(xùn)練速度。因此,公有云GPU容器實(shí)例對AI用戶的吸引力越來越高。
華為云·GPU加速型云容器實(shí)例
華為云·云容器實(shí)例本次發(fā)布的GPU加速型容器實(shí)例本質(zhì)是在Serverless K8S的基礎(chǔ)上提供GPU算力,這兩個技術(shù)的結(jié)合給AI、基因、視頻處理等場景帶來不一樣的體驗(yàn)。
- 免運(yùn)維。相比傳統(tǒng)租用云服務(wù)器、甚至自建IDC,GPU加速型容器實(shí)例無需客戶維護(hù)集群、考慮集群的升級、社區(qū)bug修復(fù)、集群資源利用率等問題,直接購買和管理GPU容器實(shí)例。同時,CCI提供了可視化的pod CPU/MEM/GPU監(jiān)控功能,可以實(shí)時監(jiān)控處理過程,極大的簡化運(yùn)維成本.
- 高性能。華為云GPU加速型云容器實(shí)例支持秒級伸縮和高并發(fā),kata容器啟動速度實(shí)測600ms,集群規(guī)模高達(dá)上十萬容器實(shí)例,讓客戶快速利用GPU實(shí)例實(shí)現(xiàn)分布式計(jì)算。例如,華為云EI使用該GPU容器實(shí)例,在斯坦福大學(xué)DAWNBench測試中取得前兩名的好成績,并達(dá)到0.8+的GPU線性加速比。
- 低成本。很多高性能計(jì)算時長非常靈活,以AI訓(xùn)練為例,很多場景下,客戶需要快速、多次計(jì)算進(jìn)行迭代。華為云GPU加速型云容器實(shí)例提供按需按秒計(jì)費(fèi),讓客戶真正按業(yè)務(wù)計(jì)算市場進(jìn)行消費(fèi),避免包年包月帶來的高成本。
華為云·GPU加速型云容器實(shí)例在Serverless K8S上展現(xiàn)了免運(yùn)維、高性能、低成本算力的優(yōu)勢,逐步成為解決AI場景中各種環(huán)境問題的利器。未來也將在AI、基因、視頻處理等行業(yè),為高性能計(jì)算的企業(yè)和開發(fā)者提供更加高效,安全、低成本的公有云服務(wù)。