老黃霸氣一句話股價飆升8%!GPU全部售罄,遭全世界客戶瘋搶
繼上周出現2000億大跌后,本周三,英偉達又迎來了8%的股價飆升。
截至收盤時,股價已回升至116.91美元,部分扭轉了前段時間大跌的損失。
老黃再次表示,自家芯片正面臨「驚人的」需求,甚至由于客戶爭相購買,已經到了「全部售罄」的程度。
老黃:大家都在指望我們
老黃最大的擔憂是什么?
在高盛的「Communacopia+」技術大會上,高盛CEO David Solomon向老黃發問,而他的回答出乎意料:
「我們肩負著很多人的期望,大家都指望著我們。」
何以如此?
老黃補充了其中的原因——「需求如此之大,以至于組件、技術、基礎設施和軟件的交付很容易讓人情緒化,因為這直接影響到收入,直接影響到競爭力。」
甚至,彭博社的報道指出,對有限供應的芯片的爭奪讓人沮喪,加劇了客戶之間的緊張局勢。
追捧英偉達的也絕不止需要GPU的客戶。
在高盛的會議開始前一個多小時,投資者和記者們就在門外排起了長隊,只為能一睹老黃的風采。
對于老黃來說,股價暴跌、反壟斷風波相繼襲來,這次主題演講也是絕佳的安撫投資人情緒的機會。
老黃表示,盡管GenAI仍處于早期階段,但即將擴展到數據中心之外。
「現在令人驚嘆的是,投在數據中心上的第一筆萬億美元資金心將加速這種新型軟件的發明——生成式AI。它不僅僅是一種工具,更是一種技能。」
「我們將首次創造出增強人類的技能。」
英偉達在GPU市場的份額
在這場GenAI熱潮中,很多人都沒有想到,最先賺得盆滿缽滿的,是「賣鏟子」的英偉達。
但GenAI能否持續給AI企業帶來盈利?英偉達收獲「驚人回報」之后又如何?
前段時間被問到這些問題時,老黃并沒有給出讓人信服的答案。
而這次會議上,他著重闡述了作為基礎設施提供商的英偉達,如何參與并推動GenAI變革。
比如,「the more you buy, the more you save」,到底是個什么邏輯?
根據老黃所說,云服務提供商在英偉達這里花的每一分錢,都能從租金上賺回5倍。
英偉達的服務器雖然看起來很昂貴,每個機架動輒數百萬美元,但實際上可以替代數千個節點。
劃重點:購買云服務的客戶際上是在租用GPU的計算時間。
如果云平臺將將傳統的數據處理工作轉變為加速計算方法,增量成本可能會翻倍,但工作速度將提高20倍,相當于節省了10倍的費用。
老黃表示,「這種投資回報率并不罕見。」
「更令人驚訝的是,連接舊的通用計算系統的電纜成本,不如全部換掉并集中到一個機架中密集部署,來得更省錢。」
英偉達歷年收入,2024年預計達到創下新高的300.4億美元
加速一切
即使云平臺能賺到錢,但對AI公司來說,訓練GenAI要花這么多錢「買鏟子」,值得嗎?
老黃認為,雖然訓練AI模型需要密集的資源投入,但從長遠來看是值得的。
「其中一個要點是,AI當然不僅僅是關于訓練模型,這只是第一步,關鍵在于使用模型,這可以幫我們節省大量時間——處理時間。」
比如,僅僅是觀賞芯片設計公司如何利用AI,就是一件令人驚嘆的事。
「每一行代碼都由軟件工程師編寫的時代已經徹底結束了,每一個工程師基本上都會有24/7全天候工作的數字工程師伙伴——這就是未來。」
除了加速計算,老黃自己的生物鐘也在「狂飆」。
由于產品交付的責任過于重大,壓力重重的老黃甚至表示「少睡一點沒關系,睡足三個小時就可以了。」
他還放出話來,英偉達目前有3.2萬名員工,不久的將來他們就會有「數量增加100倍的數字工程師」來補充。
對于AI的投資回報率何時顯現的問題,老黃的答案是敦促公司「加速一切」——任何大規模的數據處理,都必須加速。
他表示,將現有數據中心升級為「加速計算」,即由英偉達GPU和其他AI芯片支持的并行計算,是不可避免的。
配備液冷的、更小更密集的數據中心是未來的發展方向,密集化的數據中心將更具能源和成本效益,「這就是未來十年」。
有趣的是,老黃的這場演講似乎收獲了他理想中的效果。對話開始后不到一小時,英偉達的股價開啟飆升。
然而,即便英偉達宣稱的AI計算更節能是屬實的,AI熱潮對電網造成的壓力仍是巨大的。
就連老黃本身也指出,參與熱潮的各方都面臨著巨大的挑戰。
Blackwell遲遲不發,大客戶情緒激動
會議上,老黃親口承認,芯片的需求緊張,讓客戶們逐漸坐不住了
「我們的組件、技術、基礎設施和軟件的交付讓人們情緒波動很大,因為直接影響到他們的收入和競爭力」。
「所以我們今天可能有更多情緒激動的客戶……這是理所當然的」。
為此,老黃還「貼心」地安撫了大客戶們的不滿情緒,他稱英偉達非常理解大客戶們(亞馬遜、微軟和谷歌)對于GPU供不應求的焦慮。
他也同樣大方承認,是英偉達的技術援引拖了Blackwell量產計劃的后腿,導致客戶們不得不購買可能不需要的網絡設備或服務器機架。
超級芯片GB200或將在年底量產
早前,迫于延遲交付的壓力,英偉達的Blackwell更改了其6層GPU掩膜,使其可在不重新流片的情況下繼續生產。
據報道稱,更新版的GB200也將在10月底完成,并預計將于12月量產,在明年第一季度大規模交付。
GB200由2個Blackwell B200 GPU和一個Arm架構的Grace CPU組成,號稱在參數為1750億的GPT-3 LLM基準測試中,性能達H100的7倍,速度達H100的4倍。
此前,GB200的大規模出貨也曾被報道將延遲一個季度,曾有報告暗示,其中的封裝工藝可能存在bug。
甚至有知情人士稱,Blackwell芯片曾在HV工藝中面臨金屬層不穩定的問題,直到7月問題才解決。
雖然該問題發生在較為靠后的工序中,不需要新的流片,但受限于臺積電CoWoS-L技術的產能,今年GB200的先進封裝預計仍將采用CoWoS-S。