華為云最強計算系列:異構計算 軟硬結合 釋放超強算力
隨著信息化的普及,數據量暴增對互聯網產生了新的挑戰,同時,機器學習、人工智能、無人駕駛、工業仿真等領域的崛起,使得通用CPU在處理海量計算、海量數據/圖片時遇到越來越多的性能瓶頸,如并行度不高、帶寬不夠、時延高等。目前***的解決方法就是特定的事情讓特定的硬件去做,因此越來越多的場景開始引入GPU、FPGA等硬件進行加速,異構計算應運而生。
華為云于2017年推出異構計算服務,包含GPU、FPGA多款實例滿足客戶不同場景需求。華為云異構計算理念是不做單純的堆砌硬件,提倡深入硬件、聯合軟件做深度優化,讓異構計算的性能提升達到***,從而提供無短板的異構計算服務。近日,在2018年首屆中國高性能云計算創新大賽中,華為云GPU P1型云主機以高出競品40%的性能優勢摘得《性能優秀獎》,同時首批獲得GPU云主機可信云認證,再次向業界證明了華為云異構計算的硬實力!
二十余載的技術積淀與創新,構筑企業級全棧能力
為了讓異構計算發揮***性能優勢,需要對硬件設計特定的算法以及軟件優化,才能夠***化硬件能力,就是業界常說的軟硬結合。要做到真正的軟硬結合,需要同時具備硬件、軟件、算法、調優等多方面的積累,而華為正是少數同時具備此能力的廠商,華為有20多年的硬件積累,在虛擬化領域也有超過十年的積累。
下面通過兩個小例子,看看華為怎么做到真正意義上的軟硬結合:
- 硬件平臺:華為云使用專為云環境優化的Atlas智能硬件平臺,Atlas平臺能夠針對異構場景進行定向優化。比如在某些HPC或深度學習訓練等的場景下,不僅需要超強的計算能力,還需要在GPU/FPGA之間傳輸大量的數據,多個GPU/FPGA之間的拓撲結構對傳輸帶寬和時延的影響至關重要。Atlas 智能平臺可以對GPU/FPGA的拓撲結構動態編排,根據實際客戶業務選擇最適合的拓撲結構,使整個系統的綜合性能發揮到***。
- 虛擬化平臺:虛擬化是云計算的基石,直接影響著客戶實際的性能體驗。硬件經過虛擬化之后,性能下降在所難免, 尤其像NVMe、GPU、FPGA這些超高性能的器件,在虛擬化下的性能損失非常嚴重。華為云虛擬化專家團隊在Atlas硬件平臺的基礎上,通過優化硬件直通能力,能夠做到性能無損。例如GPU p2p能力,友商虛擬化后的性能損失74%,而華為可以做到性能無損。
同等的硬件,領先的技術能力
***的GPU云服務器,不只是提供市面上***的GPU這么簡單,只有真正做到軟硬結合,才能讓用戶有***的性能體驗。以GPU互聯為例,從下圖我們可以對比不同的技術帶來的巨大性能差異。選取同等規格P100卡的雙GPU實例,華為云GPU互聯帶寬是友商的2.5倍,而這個性能差異對實際業務影響巨大,以生物分子仿真業務Amber數據來看,高帶寬能力能夠將4*GPU的計算能力進一步提升151%。
GPU p2p互聯帶寬對比圖
華為云異構計算集合了整個華為的全棧優勢,并集結了華為芯片、硬件、FPGA、GPU、虛擬化、算法等各個領域專家的智慧,真正做到了軟硬結合,對公有云的全棧優化,讓客戶真正體驗到軟硬結合的優勢。
性能狀態了然于心
P1型云服務器接入華為云監控服務,能夠詳細監控云服務器的各項性能指標。除了CPU、內存等各項指標外,用戶能夠在云監控服務平臺上查看詳細的GPU性能狀態,比如GPU占用率等。用戶還可以根據需要設置告警,例如GPU占用率持續沖高告警。
如下圖,用戶能獲取指定時間段內的GPU性能狀態,根據這些性能趨勢對業務作進一步的性能調優。也能夠看出性能的忙閑程度,對業務做更好的規劃。
GPU性能狀態監控圖
匠心打造,只做精品
華為云異構計算從成立之初,就立志打造業界精品,P1型云服務器于2017年8月30日公測上線,公測期間異構計算的專家團隊不斷傾聽客戶的反饋意見,貼合客戶場景對產品進行持續優化,最終為用戶呈現滿意的產品。
在2018年首屆中國高性能云計算創新大賽中,華為云GPU P1型云主機以高出競品40%的性能優勢摘得《性能優秀獎》,******異構計算,再一次用實踐證明了用匠心打造的華為云異構計算服務才是真真正正的精品。
穩扎穩打,做新計算時代的佼佼者
華為云異構計算的宗旨是穩扎穩打只做精品,針對圖像圖像、人工智能、基因測序、視頻轉碼、圖片壓縮等領域打造新計算時代的爆款。而華為云的精品策略也確實打動了一大批客戶,以至于在免費公測期間就已經有了付費客戶。
華為云異構計算服務的理念就是不堆硬件,提供無短板的異構計算服務,我們也非常愿意把十余年的積累開放出來,幫助客戶將軟硬結合應用到實際業務中,將客戶體驗提升到新的高度。
點擊了解華為云GPU加速云服務器:https://www.huaweicloud.com/product/gpu.html