從邊緣到核心,PCIe Switch需要貴人相助!
閃存市場上,NVMe發展速度可以用出乎意料來形容,總之普及速度超快。在我看來,原因也很簡單,當SSD解決了磁盤低I/O 性能的問題,這個瓶頸消失后,iSCSI存儲傳輸協議的瓶頸,特別是時延的問題就會凸顯出來。從技術上,NVMe專門針對SSD的特點而設計,解決了存儲傳輸協議,NVMe SSD成為服務器標準配置,這是時代的選擇。
NVMe SSD也會帶來新的問題,例如PCIe插槽的擴展問題,對此PCIe Switch會是順理成章的事情。但讓人完全預料不到的是:PCIe Switch的價值不限于此,它還有更核心更重要的定位。這也是“大話存儲系列圖書及同名公眾號作者冬瓜哥在2017中國閃存峰會主題演講所傳遞的信息。
采用傳統的架構設計方式,CPU是核心,內存、SSD、 網卡以及GPU等通過CPU進行控制和調度,在這種模式下,數據首先要傳遞給CPU內存,GPU相關應用中,GPU要到CPU 內存來讀取數據,在這個過程中 ,內存和網絡訪問就會成為瓶頸。冬瓜哥指出,CPU擅長邏輯控制,類似比特幣挖礦這類的應用,主要依靠GPU的計算能力,數據經過CPU,有些多此一舉。
有沒有更加理想的模式呢?對此,冬瓜哥給出了如下架構模型。
新的模型以PCIe Switch為核心進行鏈接。CPU仍然擔任邏輯控制和調度,但是數據傳輸透過PCIe Switch直接連接,其效率更高。
新設計模型的思想和網卡協議卸載、RDMA的思想有些類似,核心都是針對特殊的應用需求(例如存儲),Bypass掉CPU、或者OS,縮短路徑,提升效率。傳統模型主要針對通用場景設計,針對特殊的場景,其應用效率不高。與之相比,新的模型顯然更加具有競爭力。
從PCIe Switch擔任核心效果看,成效顯著。以GPU家督圖像搜索應用為例,采用傳統方式,數據讀取速度為1.90GB/S,主機內存(CPU)相對使用率為5230;對比新的方式,速度為2.50GB/S,主機資源占用率僅為1。圖像處理速度方面,傳統方式為312.5像素點/秒,其主要瓶頸在主機內存;與之相比,新的模式為534.2像素點/秒,圖像處理的速度完全取決于GPU的能力。
無獨有偶。同樣在2017中國閃存峰會上,啟示錄技術服務公司創始人張廣彬在演講中披露,Intel下一代處理器(skylake)會集成NVMe RAID 控制器(RSTE),未來IO路徑更短,計算能力更強。因此,CPU會集成更多的功能,但與此同時,設備廠商也希望更多Bypass掉CPU。這是一場有關控制力的爭奪。PCIe Switch要從邊緣到核心,CPU將是其強大對手和阻力。
毫無疑問,但PCIe Switch的角色從邊緣演變為核心,效果顯而易見。PCIe Switch已經散發出王者氣息,但要想成為真正的王者,PCIe Switch顯然還有一段艱難旅程,誰會成為PCIe Switch真正的貴人呢?!還是靜觀其變吧!