CPU被「卡脖子」,中國企業紛紛換賽道:國產GPU這條路能走通嗎?
根據技術市場研究機構Jon Peddie Research的一份新報告,中國的GPU初創企業數量非同尋常,因為該國試圖獲得人工智能的優勢以及半導體主權。
隨著人工智能(AI)、高性能計算(HPC)和圖形處理的需求以前所未有的速度增長,近年來全球GPU制造商的數量也在增長。談到個人電腦的獨立顯卡,AMD和Nvidia保持領先,而英特爾正在努力追趕。
在上世紀八九十年代,全球一度有多達數十家公司在開發了顯卡和獨立圖形處理器,但為了在3D游戲中獲得最高性能而進行的殘酷競爭,其中絕大多數公司被淘汰。
到大約2010年時,只有AMD和Nvidia能夠為游戲和計算提供有競爭力的獨立GPU,而其他公司則專注于集成GPU或GPU IP。
從2015年左右開始,中國的PC GPU開發商數量開始迅速增加,這得益于中國對技術自給自足的推動,以及AI和高性能計算作為高科技大趨勢的出現。
根據Jon Peddie Research的數據,目前總共有18家公司在開發和生產GPU。有兩家公司主要針對智能手機和筆記本電腦開發SoC綁定的GPU,有6家開發GPU IP,有11家GPU開發商專注于PC和數據中心的GPU,包括AMD、英特爾和英偉達。
事實上,如果在名單中加入其他中國公司,如壁仞科技和天樞智信,那么GPU企業數量將更多。不過,壁仞科技和天樞智信目前只專注于AI和高性能計算,所以JPR不認為他們是傳統意義上的GPU開發商。
中國的技術救國之路:GPU開發
作為世界第二大經濟體,中國不可避免地與美國和其他發達的國家在幾乎所有方面進行競爭。中國竭盡所能地吸引世界各地的工程師。
事實上,在中國,每年都有數百家新的IC設計公司成立。他們開發的產品種類繁多,從微小的傳感器到復雜的通信芯片均由涉獵,力圖實現對西方國家供應商的自給自足。
但要真正跳上人工智能和高性能計算的浪潮,需要CPU、GPU和特殊用途的計算加速技術。
談到CPU,中國面臨美國在制造設備和技術上的越來越嚴密的技術封鎖,不可能很快趕上全球先進水平。然而在另一個賽道上,可以說,開發和生產一款像樣的GPU,比試圖造出一款有競爭力的CPU更容易出成果。
「對于中國公司來說,人工智能訓練是自主研發GPU的主要驅動力,一方面是因為英偉達的GPU太貴了,另外也是出于對自給自足的渴望。」JPR的負責人Jon Peddie說。
GPU本質上是并行設備,其內部有大量的計算單元可以用于冗余,這使得GPU更容易啟動和運行,單位晶體管的成本相對較低,整體產量也不錯。此外,GPU的并行性質使其更容易以擴展的方式實現部署。
與CPU相比,GPU在設計和制造上對制程工藝的要求沒有那么苛刻,即使目前中國最先進的芯片制造商中芯國際并沒有像臺積電那樣先進的生產工藝,仍然可以利用GPU性能擴展的方式實現足夠可觀的性能。
事實上,即使中國的GPU開發商失去了使用臺積電先進節點(N7及以下)的機會,至少他們中的一些人仍然可以在中芯國際生產更簡單的GPU設計,并滿足AI、HPC和部分游戲/娛樂市場的需求。
而且,從國家的角度來看,具有AI和HPC能力的GPU可能也可以說比CPU更重要,因為AI和HPC可以實現全新的應用,如自動駕駛汽車和智能城市等應用。
盡管美國政府大力限制向中國出口以超級計算機為基礎的CPU和GPU,但比起CPU,GPU在設計和制造上的相對較低的門檻,使得這種限制的效果遠沒有CPU來的明顯 。
GPU微架構相對容易,硬件設計卻很昂貴
不過,應該注意的是,雖然目前有很多GPU開發商,但只有兩家能真正為PC打造有競爭力的獨立GPU。這也許是因為,開發一個GPU架構相對容易,但要正確實現它并設計適當的驅動程序確實很難。
CPU和GPU微架構基本上是「科學和藝術的交匯」。這些架構是一組復雜的算法,開發這些架構的團隊規模可能相當小,但可能需要長達幾年的時間。
可以這么理解,微架構是在餐巾紙和白板上完成的。至于成本,如果只是架構師自己,團隊規模可以只有一個人,也許是三四個人。但是任何類型的建筑,建筑、火箭飛船、網絡或處理器都是一個復雜的棋局。
比如,試圖預測五年后的制造工藝和標準,性價比的權衡,增加什么功能,放棄或忽略什么功能,這些都是非常棘手和耗時的工作。
架構師們花了很多時間在頭腦中進行假設,比如如果把緩存做大25%,如果有6000個FPU,是否應該做一個PCIe 5.0 I/O總線?這么做能不能按時完成?諸如此類。
由于微架構的開發可能需要數年時間,而且需要有才華的設計師,在這個上市時間至關重要的世界里,許多公司就干脆從Arm或Imagination Technologies等公司授權使用現成的微架構,或者是是經過驗證的GPU IP。
例如,中國的芯動科技(Innosilicon)就從英國的Imagination公司授權GPU微架構IP用于其Fantasy GPU。
還有一家中國的GPU開發商,使用了Imagination的PowerVR架構。同時,另一家GPU制造商兆芯(Zhaoxin)使用的是Via Technologies獲得的GPU微架構。
開發一個微架構的成本可能有所不同,但與現代高端GPU的物理實現成本相比,它的開發成本相對較低。
多年來,蘋果和英特爾這兩家擁有大量工程人才的公司都依賴Img進行GPU設計。聯發科和其他小型SoC供應商依靠Arm。高通公司在很長一段時間內使用ATI/AMD,而三星在嘗試設計自己的圖形引擎數年后,也轉向了AMD。
最近,兩家新的中國GPU公司聘請了前AMD和英偉達的架構師,另外兩家使用Img。進入市場的時間和學習作為一個架構師的技能,要擔心什么,以及如何找到解決方法,是一個非常耗時的過程。
「如果你能去找一家已經有了設計方案,并且已經設計了很長時間的公司,可以節省大量的時間和金錢,而在市場上,時間就是一切。」
「這個過程中會有太多的問題。并非每一個由AMD或英偉達設計的GPU都能成為贏家。不過,一套好的架構設計可以經歷幾代的調整,慢慢進步。」研究機構Jon Peddie Research的負責人表示。
對于新的生產制程來說,硬件實現和軟件開發的成本太高了。據《國際商業時報》估計,使用5nm級技術制造的設備,其設計成本超過5.4億美元。如果制程為3nm,設計成本還將增加3倍。
「如果將布局和平面圖、模擬、驗證和驅動程序全部考慮在內,GPU開發的成本和時間就會激增。」Peddie解釋說。
「硬件設計和布局是非常直接的:如果弄錯一條線,可能要花幾個月的時間來查錯。」
目前,世界上只有少數幾家公司能夠開發出具有AMD和英偉達級別的現代游戲或計算用GPU(460億-800億個晶體管規模)芯片。
不過,前不久中國的壁仞科技發布的BR104和BR100也達到了幾乎類似的水平。(據猜測,BR104包含大約385億個晶體管)。
目前,全球11個PC/數據中心GPU設計供應商中的8個來自中國,這本身就說明了問題。
也許在不久的將來,除了美國公司,我們不會看到有競爭力的獨立游戲GPU。中國是否能推出有競爭力的競爭對手,目前還有待觀察。