自研AI芯片之風已起,擺脫技術依賴僅僅是開始
在AI大模型熱潮的推動下,屬于AI芯片領域的百家爭鳴時代終于來啦。微軟于近日透露,其計劃于下個月的年度開發者大會上推出首款為人工智能設計的芯片,來降低成本并減輕對英偉達的依賴。算上之前的亞馬遜云科技、谷歌、OpenAI、Meta,一家獨大的英偉達還是將科技巨頭逼得親自下場造AI芯片,組團拉開一場關于AI芯片領域大戰的帷幕。
AI芯片領域,科技巨頭紛紛“揭竿而起”
1.亞馬遜云科技
在自研芯片領域,亞馬遜云科技充分占得了先機,自2013年推出首顆Nitro1芯片至今,亞馬遜云科技已經擁有網絡芯片、服務器芯片、人工智能機器學習芯片等3條產品線。?
亞馬遜云科技已于2018年開始設計定制AI芯片,推出自研AI推理芯片Inferentia,并于2023年推出Inferentia的迭代版Inferentia?2,將計算性能提高了三倍此外,2020年底,亞馬遜云科技推出專用于訓練機器學習模型的Trainium。
2.谷歌
在AI芯片領域的這場競賽中,谷歌也不甘示弱。在2013年,谷歌便秘密研發一款專注于AI機器學習算法的芯片,并將其用在內部的云計算數據中心中,這款自研芯片于2016年5月公諸于世。?
2020年,谷歌實際上已在其數據中心部署了人工智能芯片TPU?v4。目前,谷歌已將負責AI芯片的工程團隊轉移到了谷歌云,旨在提高谷歌云出售AI芯片給租用其服務器的公司的能力。
3.)Meta
敢于在元宇宙火熱之時更名的Meta,在AI大潮之下,也同樣采用“激進”的態度。Meta在今年5月份披露其正在構建首款用于運行AI模型的定制芯片——MTIA(Meta?Training?and?Inference?Accelerator)芯片,使用名為RISC-V的開源芯片架構,預計于2025年問世。?
4.微軟
早已將目光聚焦于AI芯片領域的微軟,也在步步為營,按照原定計劃繪制AI芯片版圖。今年5月,微軟發布了一系列芯片相關招聘信息,其中一則寫道,“我們正在尋找一名首席設計工程師在充滿活力的微軟AISoC(人工智能芯片及解決方案)團隊中工作。”?
不久前,微軟更是透露將于下個月推出其首款人工智能芯片。據悉,微軟的芯片也是專為數據中心服務器設計,可用于訓練和運行諸如ChatGPT這類的大語言模型。
5.OpenAI
OpenAI正在探索自研AI芯片,同時開始評估潛在收購目標。其招聘網站上,最近也出現了AI硬件共同開發、評估相關崗位。
是無奈,也是最具性價比之選
OpenAI公布的數據顯示,大模型訓練所需算力的增速保持在3-4個月/倍速度增長,遠超摩爾定律18-24個月/倍。這也意味著對更快的數據處理速度、更強大的大模型服務能力提出了新的需求。?
然而,正在越來越多的企業入局大模型領域,越來越多的大模型出爐,導致對A100和H100等高端GPU的需求直線增加。今年8月,百度、字節跳動、騰訊和阿里巴巴向英偉達共訂購了價值50億美元的芯片。據CoreWeave聯合創始人兼CTO?Brian?Venturo表示,最新英偉達GPU的交貨時間也要等到2024年Q1甚至Q2。
盡管英偉達及其制造伙伴臺積電都在努力供應,但仍難以滿足市場需求。OpenAI的CEO?Sam?Altman也曾多次抱怨算力短缺問題,而這個市場主要由英偉達主導。調查數據顯示,英偉達獨立GPU市場份額達80%,在高端GPU市場份額高達90%,可以說,英偉達的GPU是全球應用最為廣泛的AI芯片。
企業在苦AI芯片久矣的同時,也在苦英偉達。根據伯恩斯坦分析師斯塔西拉斯剛(StacyRasgon)的分析,如果ChatGPT的查詢規模增長到谷歌搜索的十分之一,那么它最初需要大約價值480億美元的GPU(圖形處理器),每年還需要約160億美元的芯片來維持運營。?
在高昂的成本與技術研發兩者之間,越來越多的企業開始選擇后者,自研成為科技大廠的一致選擇。微軟打造的“雅典娜”會使用臺積電的5nm工藝打造,預計可以將每顆芯片的成本降低1/3。
隨著微軟繼續推動在Bing、Office、GitHub和其他地方推出AI?驅動的功能,自研芯片可能會大幅削減成本。分析師認為,與英偉達的產品相比,雅典娜可以將每芯片的成本降低三分之一。
因此,在筆者看來,自研AI芯片不僅可以大幅度降低成本,減少對英偉達的依賴,還意味著可以瓜分這塊巨大的“蛋糕”。
挑戰依舊在,心理準備尚需做足
“晶上世界”認為,當前AI芯片主要面臨以下三個技術挑戰:性能功耗比控制、帶寬瓶頸、軟件開發。
在性能功耗比控制方面,AI芯片的大量運算會造成功耗大幅增加。很多AI應用端對于功耗都有嚴格的限制,如何達到優異的性能功耗比是AI芯片研發的一個重要目標。
在帶寬瓶頸方面,深度學習算法中參與計算的數據和模型參數很多,數據量龐大,導致內存帶寬成為了整個系統的一個瓶頸,“Memory?Wall”也是需要優化和突破的主要問題。?
在軟件開發方面,除了芯片本身硬件的設計以外,軟件對于AI芯片性能的發揮也有著十分重要的作用,編譯器和工具鏈軟件的優化能力、易用性現在也得到越來越多的重視。
在筆者看來,英偉達圍繞其開發的?CUDA架構(統一計算設備架構)構建了一個強大的生態系統,包括龐大的開發者社區、第三方軟件和硬件供應商以及學術機構。
可以說,英偉達擁有極其豐富的軟件系統和生態,即便有其他芯片公司想要兼容英偉達的架構,但底層芯片架構不同,從底層硬件到應用層,中間有很多層,每一層的優化都會極大影響效率,所以換一個芯片,軟件的運行效率還是會下降。
寫在最后
他強任他強,清風拂山崗。AI芯片領域從來不缺強者,在面對屬于藍海市場的AI芯片領域,越來越多的企業開始走向自研之路,用長期研發投入,來換取高昂的使用成本。當越來越多的企業意識到自研的重要性之后,AI芯片領域的百家爭鳴將開啟,這將為行業帶來更具性價比的產品,推動AI算力的發展。