成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

老黃播客大玩凡爾賽:呼吁買家少囤GPU!營收1250億美元,英偉達PPT從不討論市場份額! 原創

發布于 2024-10-21 09:59
瀏覽
0收藏

出品 | 51CTO技術棧(微信號:blog51cto)

編輯 | 伊風

老黃也太凡爾賽了!竟然在播客中喊話客戶少買英偉達,“每年買一點”就好。

上述發言就在黃仁勛做客的科技節目Bg2 Pod,在與主持人Brad、Clark對談時,老黃非常投機,話匣子一開就收不住了!

老黃播客大玩凡爾賽:呼吁買家少囤GPU!營收1250億美元,英偉達PPT從不討論市場份額!-AI.x社區上圖:播客開場,黃仁勛與Brad戴了搞怪的眼鏡

主持人一開始還緊張地打斷,并表示自己還有不少問題。

而黃仁勛一直慷慨地表示:沒事,我的時間多的是!

最終,這場酣暢淋漓的對話持續了一個半小時之久,黃教主從英偉達的護城河、AI向AGI的發展、AI推理的未來,一直聊到 OpenAI 和 xAI 的最新進展。

那先給大家畫個重點:

1.摩爾定律已經被突破,十年內英偉達將計算的邊際成本降低了十萬倍。

2.黃仁勛認為,AGI個人助手很快會以某種形式出現。

3.黃仁勛認為,機器學習的飛輪是最重要的東西,需要有更智能的AI來處理數據,以支持研究人員在這個飛輪中高效工作。

4.黃仁勛表示,英偉達在推理方面的護城河只會比訓練更強,英偉達重視舊設備從訓練轉向推理的兼容性,并且持續創新算法,提升推理體驗。

5.技術更迭很快,每年的產品在性能、成本和能源效率上都有巨大飛升。黃仁勛建議,用戶不要做一次性購買,“每年買一點”。

6.Nvidia是一家市場創造者,唯一關心的是如何創造下一個產品,公司的PPT從來不討論市場份額。

7.分析師曾預言Nvidia 2023 年將實現 260 億美元的收入,但他們最終實現了 600 億。黃仁勛認為,重塑計算這件事使得英偉達注定會取得巨大成功。

8.AI是基礎設施。黃仁勛估計,有一萬億美元的舊系統需要現代化,至少還有一萬億的新AI工作負載即將出現,預計今年的收入大概是1250億美元。

9.黃仁勛不認為,AGI實現的節點特別重要。“AI將在未來擁有一條充滿能力的路線圖,沿著這條路線,它的能力將會非常驚人。”

10.在談AI技術和商業化時,黃仁勛提到,模型能力和人工智能之間存在根本的區別,就像GPU與加速計算之間的關系,一些非常擅長構建GPU的人可能完全不知道如何成為一家加速計算公司。AI初創公司的管理者應該厘清這些概念,并意識到“哪些部分能被商品化”。

11.黃仁勛爆料,馬斯克的超級集群從開始到投入訓練僅用19天,稱贊馬斯克“是超人的成就,我認為,世界上只有一個人能夠做到這一點。Elon 對工程、建設、大型系統和資源調配的理解是獨一無二的。”

12.隨著需求的增長,未來集群會需要數百萬個GPU。

13.談論AI行業,就是談論工業革命,推理及智能的生產還將增長千億倍。

14.黃仁勛說,未來英偉達可能會有5萬員工,和1億AI助手。未來,每個人都會是AI Agents 的CEO。

15.英偉達之所以做Nemotron,是為了生成合成數據。

以下是經過整理的完整播客內容,enjoy:

Brad Gerstner:

Jensen 的眼鏡很好看。

老黃播客大玩凡爾賽:呼吁買家少囤GPU!營收1250億美元,英偉達PPT從不討論市場份額!-AI.x社區圖片

黃仁勛:

嘿嘿,是啊。

Brad Gerstner:

很高興和你在一起。

黃仁勛:

是的,我戴的是丑眼鏡。

Brad Gerstner:

別這樣,那不丑,挺不錯的。你更喜歡紅色的那副嗎?

黃仁勛:

那是只有你家里人才能喜歡的東西。

Brad Gerstner:

好吧,現在是10月4日星期五,我們在Nvidia總部,離Altimeter(編者注:風投公司,Brad是這家公司的創始人兼 CEO )很近。

黃仁勛:

歡迎!

Brad Gerstner:

感謝你,感謝你。我們將在周一舉行年度投資者會議,討論AI的所有影響,以及我們擴展智能(scaling intelligence)的速度。我真的找不到比你更合適的人來開啟這個討論了,作為股東和想法伙伴,你和我們一起探討,讓我們更能看到更多。我們非常感激這段友誼。所以謝謝你來這里。

黃仁勛:

很高興來這里。

所需算力每年增4倍,見證職業生涯最大“變局”

Brad Gerstner:

你知道,今年的主題是擴展智能到AGI(通用人工智能)。想想兩年前我們討論的是AI的時代,那時距離ChatGPT發布還有兩個月,想想這一切變化多么令人驚訝。所以我想我們可以通過一個思想實驗和預測開始。如果我將AGI視作口袋里的個人助手,如果我把AGI看作那個能了解我所有信息、擁有我完美記憶的助手,它可以幫我訂酒店,或者幫我預約醫生。當你看到當今世界的變化速度,你認為我們什么時候會擁有這種個人助手?

黃仁勛:

很快就會以某種形式出現,對,很快會以某種形式出現。而且這個助手會隨著時間變得越來越好。這就是我們熟知的科技的美妙之處。所以我認為一開始,它會相當有用,但并不完美,然后隨著時間的推移會越來越完美,就像所有科技一樣。

Brad Gerstner:

當我們看變化的速度時,我想Elon曾經說過,唯一重要的事情就是變化的速度。對我們來說,這確實感覺像是變化速度大幅加快了,是我們見過的最快的變化速度。因為我們已經在AI領域摸索了十年,你甚至比我們更久。這是你職業生涯中見過的最快的變化速度嗎?

黃仁勛:

是的,因為我們重新發明了計算。你知道,很多事情之所以發生,是因為我們在十年內將計算的邊際成本降低了十萬倍。摩爾定律預測的提升大約是100倍,但我們通過多種方式達到了更大的突破。我們通過引入加速計算,將在CPU上效果不佳的工作轉移到GPU上。我們發明了新的數值精度,我們發明了新的架構,發明了Tensor核心,系統的構建方式,NVLink加上了極快的HBM內存,以及通過NVLink Infiniband擴展整個堆棧。基本上,我描述的所有Nvidia做的事情都導致了一個超級摩爾定律的創新速度。

現在,真正令人驚訝的是,結果是我們從人類編程轉向了機器學習。令人驚訝的是,事實證明,機器學習可以學得很快。因此,隨著我們重新設計了計算的分配方式,我們進行了各種各樣的并行處理,Tensor并行處理,流水線并行處理,各種并行處理方法,并且我們變得擅長在這些新訓練方法的基礎上發明新算法。所有這些發明都在彼此疊加,結果非常顯著,對吧?

回到過去,如果你看看摩爾定律的運作方式,軟件是靜態的。它是預編譯的,包裝好,放到商店里,它是靜態的,而底下的硬件則按照摩爾定律的速度增長。現在,我們的整個堆棧都在增長,在整個堆棧上進行創新。所以我認為這是現在的情況。

突然之間,我們看到了非凡的擴展。當然,我們過去談論的是預訓練模型的擴展,如何在那個層面擴展,以及我們如何每年將模型大小翻倍,因此適當地將數據大小翻倍。因此,所需的計算能力每年增加4倍,這是一件大事。

但現在我們看到了后訓練的擴展,我們在推理階段也看到了擴展,不是嗎?以前人們認為預訓練很難,推理很容易。現在一切都很難,人類思維是一擊即中的想法有點荒謬。所以一定有快速思考和慢速思考的概念,推理、反思、迭代和模擬這些,現在都在進入。

英偉達的護城河繼續加深:重視機器學習的飛輪

Clark Tang:

我認為,在這個點上,你知道,有關Nvidia最被誤解的事情之一就是Nvidia的真正護城河有多深,對吧?我認為外界有一種觀念,認為只要有人發明了一個新的芯片,一個更好的芯片,他們就贏了。但事實是,你們在過去十年里一直在構建從GPU到CPU到網絡的整個堆棧,特別是支持應用程序在Nvidia上運行的軟件和庫。

所以我認為你已經講到了這一點。當你想到今天的Nvidia護城河時,對吧?你認為今天的Nvidia護城河比三四年前更大還是更小?

黃仁勛:

我很感激你認同計算的改變。事實上,之所以人們認為,也許你仍然認為,設計一個更好的芯片,它擁有更多的浮點運算能力,有更多的翻轉操作和洛杉磯比特,你懂我的意思嗎?你會在他們的主題演講幻燈片上看到這些,有所有這些翻轉操作和浮點運算條形圖,之類的東西。這些都很好,我的意思是,性能確實很重要,所以這些事情從根本上說是重要的。然而,不幸的是,這是舊思維,這種舊思維認為軟件是運行在Windows上的某個應用程序,而軟件是靜態的,這意味著你改進系統的最佳方式就是讓芯片越來越快。

但我們意識到,機器學習不是人類編程。機器學習不僅僅是軟件,它涉及整個數據管道,事實上,機器學習的飛輪是最重要的東西。那么,你如何思考如何支持這個飛輪,一方面,支持數據科學家和研究人員在這個飛輪中高效工作?這個飛輪從最開始就開始了。

很多人甚至不知道需要AI來策劃數據,以教會另一個AI。而僅僅是那個AI本身就相當復雜。

Brad Gerstner:

而且那個AI本身也在改進,也在加速,對嗎?當我們再次考慮競爭優勢時,對吧?它是所有這些系統的組合。

黃仁勛:

完全正確,完全正確,這正是我要說的。因為有更智能的AI來策劃數據。我們現在甚至有合成數據生成和各種策劃數據的方法,呈現數據。因此,在你進行訓練之前,已經有大量的數據處理在進行。人們認為,哦,PyTorch就是一切的開始和結束,它確實很重要。但不要忘記,在PyTorch之前有很多工作,在PyTorch之后也有很多工作。而關于飛輪的思考方式確實是你應該思考的方式,如何思考整個飛輪?

你如何設計一個計算系統,一個計算架構,幫助你讓這個飛輪盡可能高效?它不是一個應用程序訓練的某個片段,對吧?

這只是其中一步,每一步都不容易。所以首先你應該做的不是思考如何讓Excel更快,如何讓《毀滅戰士》更快,那是過去的日子,對嗎?現在你要思考的是如何讓這個飛輪更快,這個飛輪有很多不同的步驟,而且機器學習沒有任何容易的地方,你們都知道,OpenAI或X或Gemini和DeepMind團隊做的事情都不容易。所以我們決定,這才是你真正應該思考的東西。

這是整個過程,你要加速每一部分。你要尊重Amdahl法則(編者注:計算機科學中的一個基本定律,主要描述了在多處理器系統中并行計算的加速比如何受到串行部分的限制),Amdahl法則會建議,如果這個步驟占了30%的時間,我通過3倍的速度加速它,我并沒有真的顯著加速整個過程,對吧?你真的想創建一個系統,加速每一步,因為只有這樣做,你才能真正實質性地改善循環時間,而那個飛輪的學習速度最終就是導致指數增長的原因。因此,我想說的是,一個公司的視角決定了他們的產品表現方式。我一直在談論這個飛輪,你知道的,整個過程,對吧?我們現在正在加速一切,對,現在主要關注的是加速推理,但我們也關注加速訓練的所有步驟。

想象一下前端系統每秒鐘攝取的數據量是以TB計算的。給我舉個例子,說明數據管道是如何攝取這些數據的,并為訓練做準備的,而這一切都是由CUDA加速的。

Clark Tang:

人們現在只考慮文本模型,但未來還會有視頻模型。還有,你知道,像o1的這些文本模型能處理大量數據,這都是在我們真正到達未來之前的過程。

黃仁勛:語言模型將涉及到每一個步驟。行業為訓練這些大型語言模型投入了巨大的技術和努力。現在我們每一步都在使用大型語言模型,真的很了不起。

談競爭對手:我們和英特爾的想法相反

Brad Gerstner:

我不想過于簡化這個問題,但你知道,投資者們經常問:“是的,但定制ASIC呢?是的,但他們的競爭優勢會被打破。”我聽你說的意思是,在組合系統中,優勢隨著時間的推移而增長。所以我聽到你說我們今天的優勢比三到四年前更大,因為我們在改進每個組件,而這就是組合優勢。例如,如果作為商業案例研究來考慮英特爾,他們在堆棧中的主導地位相對于今天的位置如何?你能不能稍微簡化一下,比較一下你們的競爭優勢與英特爾在其巔峰時期的競爭優勢?

黃仁勛:

英特爾是非凡的,因為他們可能是第一家在制造工藝工程和制造方面非常出色的公司,此外,他們在制造之上還有一層,那就是設計和架構x86芯片,并不斷推出更快的x86芯片。這是他們的聰明之處。他們將這一點與制造結合了起來。

我們的公司有點不同,我們認識到并行處理不需要每個晶體管都表現優異,而串行處理卻要求每個晶體管都要表現優異。并行處理需要大量晶體管,并且要更加具有成本效益。我寧愿擁有速度慢20%卻多10倍的晶體管,也不愿擁有速度快20%但數量少10倍的晶體管。英特爾則是相反的想法。單線程處理和并行處理是非常不同的。因此,我們發現,在我們的世界中,不是為了變得更好而向下優化,我們希望盡可能優秀,但我們的世界實際上是為了通過并行計算變得更好而向上發展。

并行處理很難,因為每個算法都需要根據架構進行重新設計和重新架構。人們沒有意識到的是,在三種不同的CPU ISA中,每種都有自己的C編譯器。你可以將軟件編譯到ISA中。但在加速計算中,并行計算中,這是不可能的。

提出架構的公司還必須提供自己的OpenGL。所以我們因為專用庫 cuDNN而徹底改變了深度學習。沒有人討論 cuDNN,因為它是在PyTorch和TensorFlow之下的一層,早期的Caffe和Theano也是如此,現在還有Triton和許多不同的框架。專用庫cuDNN,專用庫OptiX,還有叫 Quantum Rapids的專用庫。還有其他很多,比如ArrayFire。

Brad Gerstner:

行業特定的算法位于所有人都關注的PyTorch層之下。

黃仁勛:

如果我們沒有發明那個,沒有任何應用程序能在上層運行。你們理解我的意思嗎?Nvidia擅長的是算法和架構之間的數學融合,這就是我們真正擅長的。

推理其實就是大規模的訓練,Nvlink功不可沒

Clark Tang:現在終于有很多關注推理的目光了。但我記得兩年前,Brad和我和你共進晚餐時,我們問你,你認為你們在推理中的護城河會和在訓練中一樣強嗎?

黃仁勛:

我肯定當時說了,會的。

Clark Tang:

更強。你剛才提到了很多相關的元素,比如我們對某些組合的靈活性。對于客戶來說,靈活性是非常重要的。能不能談談現在我們處于推理時代的情況?

黃仁勛:

推理其實就是大規模的訓練。如果你訓練得好,你很可能推理得也好。如果你在這個架構上進行了訓練,它就會在這個架構上運行。你仍然可以為其他架構進行優化,但至少在最小的情況下,它會在Nvidia上運行。

當然,另一個方面就是資本投資的考慮。當你訓練新模型時,你會希望使用最新的設備,這意味著之前的設備可以用于推理。因此,舊設備其實非常適合推理。而我們非常注重兼容性,確保舊設備依然能很好地工作。

我們還投入了很多精力持續創新新算法,使得當Hopper架構推出時,它比以前的版本好2到4倍,這樣基礎設施仍然非常高效。我們對新算法和新框架的改進不僅僅幫助了Hopper,也幫助了Ampere,甚至是Vault。最近,Sam告訴我他們剛剛在OpenAI退役了他們的Volta基礎設施。所以,這種舊設備的遺留就像所有計算基礎設施一樣重要,Nvidia的設備遍布所有云端、本地,甚至到邊緣設備。因此,在云端創建的Vila語言模型可以無縫運行在機器人上,而無需修改。

這一切都是由CUDA驅動的。所以我認為架構兼容性對大型模型來說非常重要。

我認為推理中,基礎安裝的影響非常重要。但我們真正受益的是,由于我們在訓練這些大型語言模型的新架構上進行工作,我們能夠考慮如何為未來設計出優秀的推理架構。因此,我們一直在思考迭代模型的推理方式,以及如何為你的個人代理創建非常互動的推理體驗。比如,當你和它對話時,它需要去思考一會兒,然后迅速與你互動。所以我們一直在想,如何才能實現這樣的事情?

于是,我們發明了Nvlink。你知道,Nvlink使我們能夠把這些系統用在訓練上,訓練完成后,其推理性能同樣非常卓越。你想要優化的其實是從訓練到第一個Token輸出的時間,這非常難做到。因為第一個Token輸出時間需要大量帶寬,如果你的上下文很豐富,你還需要大量計算能力。因此,為了在幾毫秒內響應,你需要無限的帶寬和無限的計算能力同時具備,這種架構非常難設計。為了實現這一目標,我們發明了Grace、Hopper Blackwell的Nvlink。

Brad Gerstner:

為了節省時間,我還有更多的問題。

黃仁勛:

 別擔心,別擔心時間。各位,聽我說,Janine,讓我們做到最好。

Nvidia是一家市場創造者,而不是市場份額的搶奪者

Brad Gerstner:

太棒了,我喜歡這種感覺。上周我和Andy Jassy(編者注:亞馬遜CEO)共進晚餐時,(現在我們不用再擔心時間了)。Andy說:“我們有Trainium,還有Inferentia來了。”我認為大多數人會覺得這些對Nvidia是個問題。但他接著說:“Nvidia是我們重要的合作伙伴,并且會繼續是未來的重要伙伴。” 這個世界運行在Nvidia上,對吧?當你想到那些專門為特定應用構建的定制ASIC (編者注:Application-Specific Integrated Circuit,專用集成電路)可能是Meta的推理加速器,或者是Amazon的Trainium,或者是Google的TPU ISS,再結合你目前的供應短缺情況,這些會改變動態或對他們從你這里購買的系統產生影響嗎?

黃仁勛:

我們在做不同的事情,追求不同的目標。Nvidia在做的是為這個新世界——這個機器學習、生成式AI、代理式AI的世界——構建一個計算平臺。令人深刻的是,在計算發展的60年后,我們重新發明了整個計算棧。從編程到機器學習的寫軟件方式,從CPU到GPU的處理方式,以及從軟件到人工智能的應用程序方式——每一個計算棧和技術棧的方面都發生了變化。

我們想要做的是創建一個隨處可用的計算平臺。這就是我們所做事情的復雜性。

我們在做的事情很復雜,如果你思考我們在做什么,我們正在構建整個AI基礎設施,我們將其視為一個計算機。我以前說過,數據中心現在是計算單元。當我想到一臺計算機時,我不會只想到芯片,而是整個軟件、所有編排系統、所有內部的機器設備,這是我的使命,這是我的計算機,我們每年都試圖構建一個全新的版本。

是的,這太瘋狂了,沒人之前做過這樣的事。我們每年構建一個全新的計算機,每年性能提高兩到三倍,成本降低兩到三倍,能源效率提高兩到三倍。所以我們建議客戶不要一次性購買所有東西,每年買一點,好嗎?

我們希望他們隨著時間推進,而不是一次性買完。現在我們所有的架構都是兼容的,在這個速度下單獨構建這些就已經非常困難了。更加復雜的是,我們將所有這些基礎設施分解開來,不是作為一個基礎設施賣出,而是作為一個服務銷售。我們將其分解并集成到GCP、AWS、Azure、X中,每一個集成都不同。我們需要將所有的架構庫、算法、框架與他們集成起來。我們將安全系統、網絡集成到他們的系統中。每年我們進行10個這樣的集成,這就是奇跡。

Brad Gerstner:

這的確是個奇跡!這太瘋狂了。是什么驅使你每年去做這件事的?另外,你們的合作伙伴在(中國)臺灣、韓國、日本見面時,這些長期合作關系在構建這個競爭壁壘時有多重要?

黃仁勛:當你系統性地分解這些問題時,你會發現整個電子生態系統今天都在與我們合作,最終要構建這個整合到各個生態系統中的超級計算機。這種無縫的協調非常驚人。有API、方法論、業務流程、設計規則,這些都是我們在向前和向后傳播的。

Brad Gerstner:

這些方法已經經過了幾十年的打磨。

黃仁勛:

是的,幾十年磨練的同時也在不斷演進。這些API到時都會整合在一起,所有在臺灣和全球制造的東西,最后都會落到Azure的數據中心中,然后一切都會融合,“咔咔咔咔”,一切都配合得天衣無縫。

Clark Tang:

有人只需要調用OpenAI的API,它就能立即工作。

黃仁勛:

沒錯,正是這種瘋狂的整合。我們發明了這個全球性的計算基礎設施,整個星球都在和我們一起構建這個體系,集成到各個地方。你可以通過Dell銷售,通過HPE銷售,它在云中托管,甚至已經延伸到邊緣計算,很多人在機器人系統中使用它,包括人形機器人、自動駕駛汽車等,所有這些都在架構上兼容,非常瘋狂的整合。

Brad Gerstner:

的確是瘋狂。

黃仁勛:

Clark,我不想讓你覺得我沒有回答你的問題。事實上,我已經回答了。對于你提到的ASIC問題,我們公司在做的是完全不同的事情。作為一家公司,我們必須對周圍的環境保持敏銳的感知。我非常清楚我們公司和生態系統的所有動態。我知道很多公司在做一些不同的事情,有時候是競爭的,有時候不是。我非常清楚這些,但這并不改變我們公司的使命。公司的唯一使命是構建一個可以無處不在的架構和平臺,這就是我們的目標。

我們并不試圖從任何人那里搶占市場份額。Nvidia是一家市場創造者,而不是市場份額的搶奪者。看看我們的公司PPT,從來沒有一天我們在討論市場份額。

我們唯一關心的是如何創造下一個產品?下一個問題是什么?如何為用戶做得更好?如何加速我們原本需要一年的飛輪效應,縮短到一個月?這些都是我們在思考的事情。但唯一確定的是,我們對使命非常堅定。

唯一的問題是產品對我們的這個使命是否必要,是否有意義,你知道嗎?所有公司,所有偉大的公司都應該有這樣的使命。

核心問題是你在做什么,對吧?唯一的問題是它是否必要、是否有價值、是否有影響力、是否幫助了人們?我確信你是開發者,是一家生成式 AI 初創公司,你正要決定如何成為一家公司,唯一不需要做的決定就是選擇支持哪個 A6。如果你僅支持 CUDA,你就可以走遍全球,你以后隨時可以改變主意,但我們是進入 AI 世界的入口,不是嗎?一旦你決定進入我們的平臺,其他決定可以延后做,你以后隨時可以自己構建 ASIC。我們不反對,也不會因此感到冒犯。

當我與所有 GCP 合作時,無論是 GCP 還是 Azure,我們會提前多年向他們展示我們的路線圖。他們從不會向我們展示他們的 ASIC 路線圖,但這從未冒犯到我們。明白了嗎?如果你的目標明確,且目標對你和其他人都非常重要,那么你可以透明化。注意,我在 GTC 會議上展示的路線圖是透明的。我們的路線圖會更深入地展示給 Azure 和 AWS 的朋友們。即使他們在構建自己的 ASIC,我們也毫無問題。

從第一性原則分析,英偉達注定會“起飛”

Brad Gerstner:

我認為,當人們觀察商業時。你最近說過對 Blackwell 的需求非常瘋狂,你還說你工作中最難的部分是面對世界缺乏計算能力時,拒絕人們的情感負擔。但批評者說這只是暫時的,對吧?他們說這就像 2000 年的 Cisco(編者注: Cisco 在 2000 年左右在光纖建設方面過度投資,直到互聯網泡沫破裂),我們過度建設光纖,最終將是繁榮與衰退。我記得 23 年初我們共進晚餐時,當時對 Nvidia 的預測是 2023 年將實現 260 億美元的收入,而你們最終實現了 600 億,對吧?

黃仁勛:

讓真相大白,這是歷史上最大的一次預測失敗,大家能否承認這一點?

Brad Gerstner:對我來說(是的)。

當時我們在 22 年 11 月非常興奮,因為像 Mustafa(來自 Inflection)等人,以及 Character AI 的 Noam 來到我們辦公室討論投資他們的公司。他們說,如果你不能投資我們的公司,那就買 Nvidia,因為全世界的人都在努力獲取 Nvidia 芯片來構建這些將改變世界的應用。當然,ChatGPT 的誕生帶來了坎勃里時刻(編者注:源自寒武紀大爆發,指飛躍性突破),盡管如此,那些 25 位分析師過于關注加密貨幣寒冬,以至于無法想象當時世界上正在發生的事情。所以最終規模遠超預期。你用非常直接的語言說,對 Blackwell 的需求是瘋狂的,并且在你所能預見的未來都會如此。當然,未來是未知的,但批評者為什么錯了?這不會像 Cisco 在 2000 年的過度建設那樣嗎?

思考未來的最佳方式是從第一性原理推理(編者注:通過將復雜問題分解為最基本的真理(或者最基本的已知事實)來進行推理和解決問題的思維方式)。那么問題是,我們的第一性原理是什么?

首先,我們在做什么?我們做的第一件事是我們正在重新定義計算,對吧?我們剛剛說過,未來的計算將高度依賴機器學習,幾乎我們做的每一個應用,無論是 Word、Excel、PowerPoint、Photoshop、Premiere、 AutoCAD,你隨便挑一個你最喜歡的應用,過去都是手工工程化的,我向你保證未來它們都會高度依賴機器學習,對吧?所以這些工具都會如此,除此之外,還會有機器、代理來幫助你使用這些工具,對吧?所以我們現在已經知道這是事實,對吧?

我們已經重新定義了計算,不會回頭了,整個計算技術堆棧正在被重新構建。所以我們已經完成了這一點,現在軟件也會有所不同,軟件能寫的東西會不同,我們使用軟件的方式也會不同。所以讓我們承認這些是我的基礎事實。現在的問題是接下來會發生什么?

讓我們回顧過去的計算方式。過去我們有價值數萬億美元的計算機。你看看數據中心,問問自己:這些計算機是你想用來做未來的計算機嗎?答案是否定的,后面有那么多 CPU,我們知道它們能做什么,不能做什么,我們有價值數萬億美元的數據中心需要現代化。所以現在,如果我們設定一個未來四到五年的軌跡來現代化這些舊設備,這是合理的,不是嗎?

Brad Gerstner:

所以你和那些需要現代化的人有這些對話,他們正在用 GPU 進行現代化,對吧?

黃仁勛:

讓我們再做一個測試。你有 500 億美元的資本支出,你有兩個選項:A 選項,未來的資本支出,B 選項,過去的資本支出。你已經有了過去的資本支出,它就在那里,不會再有大的改進了。

摩爾定律幾乎已經終結了,那為什么還要重建那些呢?讓我們拿 500 億美元投資到生成式 AI 上,對吧?你的公司因此變得更好了,對吧?你會把多少 500 億投入到其中?我會全部投入,因為我已經有四年的舊基礎設施了。所以現在,我只是從第一性原理的角度進行推理。這就是聰明人在做聰明的事。

第二部分是,現在我們有價值數萬億美元的容量需要構建,對吧?我們要投入約 1500 億美元。我們有價值數萬億美元的基礎設施要在未來四到五年內構建。

其次,我們觀察到,軟件的編寫方式變了,未來使用軟件的方式也會變。我們將擁有代理,對吧?我們將有數字員工。在你的收件箱中,你會看到這些小點和小臉。未來,它們將是 AI 的小圖標,對吧?我會發送它們。我將不再用 C++ 編寫程序,而是用提示詞編寫 AI,對吧?

這跟我早上給團隊寫郵件沒有什么不同,對吧?我會描述背景,說明我所知道的基本限制,還會講清楚他們的任務。我會給出足夠明確的方向,讓他們明白我的需求,同時也留出足夠的模糊空間,讓他們在創造力方面給我驚喜,對吧? 

這跟我今天如何提示AI是一樣的,完全一樣。所以在我們即將現代化的基礎設施之上,還會有一個新的基礎設施。這新的一層將是運行這些數字人類的AI工廠,它們會全天候24小時不停運作。我們將在全球所有的公司、工廠和自主系統中使用這些AI。對吧?所以這是一整層的計算架構,我稱之為AI工廠,這層基礎設施目前還不存在。問題是,它的規模有多大?現在還無法知道,也許幾萬億美元,但現在我們所構建的美妙之處在于,現代化這個新數據中心的架構和AI工廠的架構是一樣的。

Brad Gerstner:這很棒。你已經明確說明了:有一萬億美元的舊系統需要現代化,至少還有一萬億的新AI工作負載即將出現,預計今年的收入大概是1250億美元。你知道,曾有人對你說公司市值永遠不會超過十億。現在,你坐在這里,有什么理由認為你的收入不會翻倍、三倍增長?有沒有什么理由會阻礙你的收入增長?

黃仁勛:

沒有,對,你知道,問題不在于一切。公司的規模受限于市場的大小。金魚只能在魚缸里長到一定程度,問題是我們的‘魚塘’有多大?這需要很大的想象力。這也是為什么市場締造者會考慮未來,而不是單純去爭取市場份額。

回頭看很難弄清楚,只靠爭市場份額只能做到一定程度,但市場締造者的潛力是非常大的。我認為我們公司一直以來的幸運之處在于,自成立之初,我們就不得不為自己創造市場來發展。人們也許現在不記得了,但我們幾乎從零開始創建了3D游戲PC市場。我們發明了這個市場和所有的生態系統,所有的顯卡生態系統,都是我們發明的。因此,創造新市場并在未來為其服務,這對我們來說是很自然的事。  

談OpenAI:我們這個時代最具影響力的公司之一

Brad Gerstner:

確實如此,作為一位市場創造者,我們來談談模型和OpenAI。你知道,OpenAI本周融資了65億美元,估值達到了1500億美元。我們都參與了。 

黃仁勛:

真的為他們感到高興,這件事最終得以實現。他們做得很棒,團隊表現得非常出色。  

Brad Gerstner:

有報道稱他們今年的年化收入大概是50億美元,明年可能達到100億。如果你看看這家公司,收入是谷歌IPO時的兩倍。他們擁有2.5億的每周活躍用戶,是谷歌當年IPO時的兩倍。如果你相信他們明年的收入將達100億美元,那么它的前瞻市盈率約為15倍,和谷歌與Meta在IPO時的市盈率相當。你怎么看待一家22個月前還沒有收入、沒有每周活躍用戶的公司?  

黃仁勛:

Brad對歷史的掌控非常驚人。

Brad Gerstner:

對此你怎么看?跟我們談談OpenAI作為你們的合作伙伴的重要性,以及它在推動公眾對AI的認識和使用方面的重要性。  

黃仁勛:

這是我們這個時代最具影響力的公司之一。

一家純粹的AI公司,追求AGI(通用人工智能)的愿景,無論它的定義如何,我幾乎認為定義本身并不重要,我也不認為時間節點特別重要。我唯一知道的是,AI將在未來擁有一條充滿能力的路線圖,沿著這條路線,它的能力將會非常驚人。而且在到達任何人定義的AGI之前,我們會充分利用它。

現在,只要你去找數字生物學家、氣候科技研究者、材料研究者、物理學家、天體物理學家、量子化學家,你去問問視頻游戲設計師、制造工程師、機器人專家,隨便你挑選一個行業,深入其中,問問那些重要的人,問他們:AI是否已經徹底改變了他們的工作方式?你收集這些數據點,再回來問問自己,你還是否懷疑AI。  

“因為他們現在談論AI時,不是在說未來某一天的概念性的好處,而是在談論當下的實際應用。現在就有農業科技、材料科技、氣候科技,你挑一個科技領域或科學領域,他們都在前進,而AI正在幫助他們,推進他們的工作。此時此刻,每一個行業、每一家公司、每一所大學都在使用AI,不可思議,對吧?它必然會以某種方式改變商業,我們知道這一點,對吧?我意思是,我們知道這已經如此具象化了,你可以看到它正在發生。所以,我認為AI的覺醒,由ChatGPT引發,完全令人難以置信。我也非常欣賞他們推進這一領域的速度和專一目標,因此,這真的非常重要。” 

Brad Gerstner:

他們構建了一個可以為下一代模型提供資金的引擎,對吧?我認為在硅谷,關于整個模型層面正在商品化的共識在不斷增長,LLaMA正在讓很多人以非常低的成本構建模型。所以,早期我們有很多模型公司,比如 Character AI、Inflection、Cohere 和 Mistral,名單可以列得很長。很多人質疑這些公司是否能建立起能夠為下一代模型持續提供資金的經濟引擎。我個人的看法是,這就是你看到整合的原因,對吧?OpenAI顯然已經達到了逃逸速度(指公司有足夠的資源持續發展),他們可以為自己的未來提供資金。而我不確定其他許多公司能否做到這一點。這是否是對模型層現狀的合理評估,即我們將看到像許多其他市場一樣的整合,形成可以負擔得起、擁有經濟引擎的市場領導者,并且可以繼續投資?

黃仁勛:

首先,模型和人工智能之間存在根本的區別,對吧?模型是人工智能的一個基本要素,這是必要但不充分的,對吧?所以人工智能是一種能力,但它的應用是什么呢?汽車駕駛軟件的人工智能與人形機器人使用的人工智能相關,但并不相同,它又與聊天機器人的人工智能相關,但也不相同,對吧?所以你必須理解技術堆棧的分類,在堆棧的每一層都會有機會,但并不是每一層堆棧上都有無限的機會。

我剛才說了一些話,你只需要把“模型”這個詞替換為“GPU”。事實上,這是我們公司32年前的一個重大觀察,即GPU(圖形處理器)與加速計算之間存在根本區別。而加速計算與我們在人工智能基礎設施中所做的工作又是不同的,它們是相關的,但并不完全相同,它們是建立在彼此之上的。每一層抽象都需要不同的基本技能。

一些非常擅長構建GPU的人可能完全不知道如何成為一家加速計算公司。有很多公司制造GPU,我不知道哪個是第一個,我們發明了GPU,但你知道的,現在不止我們一家公司制造GPU。而且到處都有GPU,但它們不是加速計算公司。還有很多公司做應用加速器,但這與加速計算公司又不同。例如,一個非常專業的AI應用程序可能會非常成功。

Brad Gerstner:

確實如此。

黃仁勛:

但是它可能不是那種具有廣泛覆蓋面和能力的公司。所以你得決定你想要在哪里立足。可能在所有這些不同領域都有機會,但像構建公司一樣,你必須意識到生態系統的變化以及隨著時間推移哪些部分被商品化,認識到什么是功能、什么是產品、什么是公司。

馬斯克是超人,超級集群投產只用19天

Brad Gerstner:

當然,有一個新的進入者擁有資金、智慧和野心,那就是 xAI,對吧?有報道稱你和 Larry(編者注:甲骨文公司 CEO) 以及 Elon 共進晚餐。他們向你要了10萬臺 H100 GPU。他們去了孟菲斯,并在幾個月內建立了一個大型的超級計算集群,你知道,這真是一個奇跡。

黃仁勛:

(慌張打斷)首先……三個點連不成一條線(編者注:three points don't make a line,這里指主持人列舉的細節是事實,但之間的邏輯或連貫關系不是這樣),好嗎?是的,我的確和他們共進了晚餐。但這個因果關系……

Brad Gerstner:

你怎么看他們構建這個超級集群的能力?外界有傳言說他們還要再要10萬臺 H100,對吧?以擴大那個超級集群的規模。首先,和我們聊聊 X 及其野心,以及他們已經取得的成就。其次,我們已經進入擁有20萬或30萬臺GPU的集群時代了嗎?

黃仁勛:

答案是肯定的。首先,(xAI)成就應該得到應有的認可,從概念的提出,到準備好讓 Nvidia 的設備進入數據中心,再到我們啟動電源、連接好所有設備,并進行首次訓練。

僅僅是建立一個大型工廠、液冷系統、供電、獲得許可,并在如此短的時間內完成。這是超人的成就,我認為,世界上只有一個人能夠做到這一點。Elon 對工程、建設、大型系統和資源調配的理解是獨一無二的。真的太不可思議了。

當然,他的工程團隊也是非凡的。

軟件團隊很棒,網絡團隊很棒,基礎設施團隊也很棒。Elon 對此有著深刻的理解。從我們與他們的工程團隊、網絡團隊、基礎設施計算團隊和軟件團隊開始規劃,到所有的準備工作,再到基礎設施、物流以及當天涌入的大量技術和設備,Nvidia 的基礎設施、計算設備,所有這些技術到訓練僅用了19天。

你知道嗎?沒人睡覺,全天候工作。當然,19天非常了不起,但也讓我們稍微停下來想一想,19天有多長?也就幾個星期。而如果你看到現場的技術數量,那真是令人難以置信。

所有的布線和網絡連接,Nvidia 的設備網絡與超大規模數據中心的網絡非常不同。一個節點的背后全是電纜。只是把這座技術山整合起來并安裝好所有的軟件,簡直令人驚嘆。所以我認為 Elon 和 X 團隊所做的事情非常了不起,我也非常感謝他對我們工程工作、規劃工作的認可。但他們的成就是獨一無二的,前所未有的。

為了更好地理解,10萬個GPU就是目前地球上最快的超級計算機,這只是一個集群。你要建造一臺這樣的超級計算機,通常需要三年的規劃時間,對吧?然后交付設備,花一年時間讓它全部運行。是的,我們說的是19天。

Clark Tang:

哇,這要歸功于Nvidia的平臺,對吧?整個流程已經非常完善了。

黃仁勛:

沒錯,一切都已經準備就緒。當然,還有很多 X 算法、X 框架和 X 堆棧之類的東西,所以我們要做大量的集成工作。但規劃的部分真的很了不起,所有的預規劃都非常出色。

Brad Gerstner:

萬里挑一是對的。Elon 是一個萬里挑一的存在。但是你一開始回答時就說,是的,20萬到30萬個GPU的集群已經出現了,對吧?那么這個規模會擴大到50萬個嗎?會擴大到100萬個嗎?你們的產品需求是否依賴于規模將擴大到數百萬?

黃仁勛:

 最后這個問題的答案是否定的。我的感覺是,分布式訓練必須得可行,我認為分布式計算將會被發明出來,某種形式的聯邦學習和異步分布式計算會被發現,我對此非常樂觀。當然,值得注意的是,擴展法則以前只適用于預訓練。現在我們已經進入了多模態,我們進入了合成數據生成,后訓練已經大規模發展,合成數據生成、基于獎勵系統的強化學習也隨之增加,推理擴展現在也達到了前所未有的高度。

在模型給你答案之前,可能已經進行了1萬次內部推理,這并不夸張。它可能已經進行了樹搜索,可能進行了強化學習,可能進行了某些模擬,肯定也進行了大量反思,它可能查找了某些數據或信息,對吧?因此,這種情境可能相當龐大。

這種類型的智能就是我們所做的工作,不是嗎?這就是我們做的事情,對吧?因此,考慮到這一擴展,如果你做了這些計算,并且結合每年模型規模和計算規模的4倍增長,而另一方面,需求還在繼續增長。

我們是否認為需要數百萬個GPU?毫無疑問,是的。這現在是一個確定的事實。

問題在于如何從數據中心的角度進行架構設計,而這很大程度上取決于數據中心是每次提供千兆瓦的電力,還是每次提供250兆瓦的電力。我的感覺是你會同時看到這兩種情況。

Clark Tang:

我認為分析師們總是關注當前的架構賭注。但我覺得這次對話的最大收獲之一是,我們是在考慮整個生態系統,并且是在展望許多年后的未來。所以,Nvidia的擴展上升或擴展外展是為了適應未來,而不是僅僅依賴于一個擁有50萬或100萬個GPU集群的世界。到那時,分布式訓練的軟件已經被寫好了。

黃仁勛:

 沒錯,記得沒有我們七年前開發的Megatron,這些大型訓練作業的擴展就不會發生。所以我們發明了Megatron,發明了NCCL GPU direct,所有的工作都與我們的DMA(編者注:Direct Memory Access)有關,這使得流水線并行化變得輕而易舉。所有的模型并行化工作現在都在進行,所有分布式訓練的拆解和批處理都在發生,所有這些工作都是因為我們做了早期的工作,現在我們也在為未來的下一代做早期的工作。

談 o1:今天,我的導師是AI

Brad Gerstner:

那么我們來談談 Strawberry 和 o1。我想尊重你的時間。

黃仁勛:

我有的是時間。

Brad Gerstner:

你非常慷慨。

黃仁勛:

我有的是時間。

Brad Gerstner:

首先,我覺得他們用 o1 來命名這個項目真的很酷,這與 o1 簽證(編者注:美國非移民簽證,專門為具有特殊才能的人提供)有關,簽證是為了招募世界上最優秀和最聰明的人,將他們帶到美國。這是我們兩人都非常關心的話題。因此,我喜歡這種構建能夠思考并將我們帶到下一層智能擴展的新模型的想法,它向那些通過移民來到美國的人致敬,是他們的集體智慧造就了今天的我們。

黃仁勛:

向外星智慧致敬。

Brad Gerstner:

當然,這個項目是由我們的朋友Noah Brown領導的。他曾在Pluribus和Cicero工作,后來加入了Meta。推理時間的推斷作為一個全新的智能擴展向量有多重要?它是否與構建更大模型的方式完全不同?

黃仁勛:

模型?這是個大問題。它是個大問題。很多智能是無法預先完成的,你知道嗎?而且很多計算,即使是很多計算,也無法重新排序。我知道,亂序執行是可以預先完成的,你知道嗎?所以很多事情只能在運行時完成。無論你是從計算機科學的角度看,還是從智能的角度看,很多事情都需要上下文。  

情況、你想要的答案類型。有時候,快速的回答就足夠了,取決于答案的后果,取決于答案的使用性質。所以,有些答案,可能需要一晚時間,有些答案需要一周時間。是吧?  

我完全可以想象我把一個提示發給我的AI,告訴它,你知道嗎,想一想吧,想一晚上,別馬上告訴我,我希望你一整晚思考,明天回來告訴我你最好的答案,幫我推理一下。

所以,我認為智能的質量和分段現在,從產品的角度來看,會有一種一錘子買賣的版本。是的,然后有些可能需要五分鐘。  

Brad Gerstner:

那個智能層會將這些問題引導到適合的模型,用于正確的用例。我是昨晚在使用先進的語音模型和o1預覽版時,我在輔導我兒子的AP歷史考試,就像擁有世界上最棒的AP歷史老師坐在你旁邊思考這些問題一樣,真的是太不可思議了。 

黃仁勛:

今天,我的導師是AI。 

Brad Gerstner:

當然,他們現在就在這里,這又回到了這個問題,你們今天超過40%的收入來自推理。而推理正在因為推理鏈的出現而迅速增長,對嗎?

黃仁勛:

它即將增長一千億倍。 

Brad Gerstner:

一千億倍。  

黃仁勛:

是的。這部分大多數人還沒有完全理解。我們談論的那個行業,但這就是工業革命。  

Brad Gerstner:這就是智能的生產。對吧?  

黃仁勛:

它將增長一千億倍。

Brad Gerstner:

每個人都過于專注于Nvidia,認為它僅僅是在做更大模型的訓練。難道不應該是你們的收入——如果今天是50美元——未來將會有更多推理,而不是說訓練永遠重要,但推理的增長將比我們希望的訓練增長要大得多。我們幾乎無法想象別的方式。  

黃仁勛:

我們希望是對的。是的,去上學是好事,但目標是讓你能在社會中更有生產力,所以訓練這些模型是好事,但目標是推理。

Brad Gerstner:

你們現在已經在使用推理鏈和像 o1 這樣的工具來改善你們自己的業務了嗎?  

黃仁勛:

我們今天的網絡安全系統沒有我們的Agents就無法運行。我們有Agents幫助設計芯片,沒有它們,Hopper不可能存在,Blackwell 不可能存在,Ruben(下一代架構)連想都別想,根本不可能有數字化。我們有AI芯片設計師,AI軟件工程師,AI驗證工程師,我們在現場建立了這些,因為我們有能力,也更愿意使用它,利用這個機會自己探索技術。  

英偉達的未來:5萬名員工,1億個AI

Brad Gerstner:

今天走進大樓時,有人走過來對我說,知道你們的文化嗎?一切都關乎文化,我看著這個公司,有很多關于健身、效率、扁平化的組織結構,可以快速執行的小團隊。

你知道,Nvidia真的處于一個獨特的地位,每名員工帶來的收入為400萬美元,每名員工對公司的凈利潤或自由現金流貢獻約為200萬美元。你們建立了一個高效的文化,真正釋放了創造力、創新、所有權和責任感。你們打破了職能管理的模式。每個人都喜歡談論你們所有的直接下屬。是利用AI繼續保持高創造力的事情嗎,同時保持效率呢?  

黃仁勛:

毫無疑問,我希望有一天Nvidia有32000名員工,我們在以色列有4000個家庭。我希望他們能想念你們。我希望有一天,Nvidia會是一個擁有50000名員工的公司,配有1億個AI助手。  

在每個小組里,我們都會有一個AI目錄,它們非常擅長做事情。我們的收件箱將充滿我們與之合作的AI目錄,這些AI非常擅長特定的技能。因此,AI將招募其他AI來解決問題。AI將與彼此、與人類一起在Slack頻道(編者注:企業通信工具)中工作。所以我們將是一個龐大的團隊,你可以說有些是數字的、有些是AI的、有些是生物的,我希望有些甚至是機電一體化的。  而且…  

Brad Gerstner:

我覺得從商業角度看,這是一件被極大誤解的事情。你剛剛描述了一個公司,它的輸出相當于擁有15萬人,但你們做到了只有50000人。現在,你并沒有說我要去掉所有員工,你們仍然在增長員工的數量,但這個組織的產出將比現在大得多。  

黃仁勛:

這常常被誤解。AI不是,AI不會改變每一份工作。AI將對人們思考工作的方式產生巨大影響。讓我們承認這一點,AI有可能帶來巨大的好處,也有可能帶來傷害,我們必須建立安全的AI,讓這一點成為基礎。好吧?被忽視的一部分是,當公司通過人工智能提高生產力時,它通常會轉化為更好的收益、更好的增長,或者兩者兼有。當發生這種情況時,下一封來自CEO的郵件很可能不是裁員通知。  

Brad Gerstner:

當然,因為你們在增長。

黃仁勛:

是的,原因在于我們有更多的想法可以探索,但我們需要人們幫助我們思考這些問題,然后再自動化。所以,自動化部分AI可以幫助我們做,顯然,它也會幫助我們思考,但它仍然需要我們去弄清楚,我想解決什么問題?有無數問題我們可以去解決。公司需要解決哪些問題?從中選出那些想法,找到方法來自動化和擴展。因此,結果是,當我們變得更加高效時,我們將雇傭更多的人。人們常常忘記這一點。如果你回顧過去,顯然我們今天的想法比200年前要多。這就是為什么GDP增長的原因,雖然我們在瘋狂地進行自動化。

Brad Gerstner:

這是我們即將進入的時期的一個非常重要的點,幾乎所有的人類生產力,幾乎所有的人類繁榮,都是過去200年自動化技術的副產品。你可以看看,從亞當·斯密到熊彼特的創造性毀滅,你可以看到過去200年人均GDP的增長,它只是加速了,這引出了這個問題,如果你看看90年代,美國的生產力增長大約是每年2.5%到3%,然后到了2000年代,下降到了大約1.8%。而過去10年是生產力增長最慢的時期。也就是說,勞動和資本的總產出增長最慢,實際上創下了歷史紀錄。很多人都在爭論這個原因。但是如果世界如你所描述的那樣,我們將利用并制造智能,那是不是意味著我們即將迎來人類生產力的戲劇性擴展?

黃仁勛:

這是我們的希望,當然,你知道,我們生活在這個世界中,所以我們有直接證據。我們有直接的證據,無論是作為一個孤立的案例,比如一個研究人員,能夠利用AI以如此不可思議的規模探索科學,這是生產力的一個衡量標準,或者我們在設計芯片時,以如此高的速度構建的芯片復雜度和計算機復雜度不斷上升,而公司員工數量并沒有像生產力那樣增長,正確嗎?我們正在開發的軟件越來越好,因為我們使用AI和超級計算機來幫助我們,而員工數量幾乎是線性增長的。

好吧,另一個生產力的展示,無論是我可以進入,我可以在許多不同的行業中進行抽查。我自己可以進行驗證。對,商業上就是這樣。毫無疑問,智能是世界上最有價值的商品,而現在我們將大規模生產它。我們所有人都必須變得擅長于AI,如果你被這些AI包圍,而它們做的事情非常出色,比你做得好得多,那么會發生什么呢?

反思這一點,這就是我的生活。我有60個直接下屬。之所以他們在高管團隊,是因為他們在自己擅長的領域世界級,比我做得好得多。我和他們互動毫無困難,且我也不難對他們進行提示工程,因為我不難編程他們。所以,我認為人們將會學到的是,每個人都會成為CEO,每個人都會是AI Agents 的CEO。他們的創造力、意志力和一些知識,以及如何進行推理、分解問題的能力,將使得你可以編程這些AI幫助你實現像我一樣的目標。這就是經營公司。

AI不是閉源和開源的零和博弈,而是兩者的結合

Brad Gerstner:

你提到了這個對齊問題,安全AI,你提到了中東正在發生的悲劇。你知道,世界各地有很多AI正在被濫用。我們來談談AI的負面影響、安全AI、與官方的協調問題。

你今天的感覺如何?我們走在正確的道路上嗎?我們有足夠的協調嗎?你知道,馬克·扎克伯格曾說過,我們打敗壞AI的方法就是讓好的AI變得更好。你如何看待確保這對人類來說是積極的凈收益,而不是讓我們陷入一個沒有目的的反烏托邦世界?

黃仁勛:

關于安全的討論非常重要,而且好的。抽象的看法,即將AI看作一個龐大的神經網絡,這種看法不好。原因在于,我們知道人工智能和大語言模型是相關的,但并不相同。許多正在做的事情我認為是非常優秀的。首先,開源模型,這樣整個研究者社區、各個行業和公司都可以參與AI并學習如何在他們的應用中利用這種能力。非常好。第二,致力于AI安全的技術數量也在增加。

AI用于整理數據、傳遞信息、訓練AI。AI創建它,來使AI對齊,生成合成數據以擴展AI的知識,減少其幻覺,所有這些AI的創造,都是為了向AI提供保護的邊界。AI之間互相監控,系統中的AI用于創建安全的AI,這是被低估的。

我們已經建立了這樣的系統。

我們正在構建的所有這些東西,行業中每一個人都在進行方法論、紅隊測試、過程、模型卡、評估系統、基準測試系統,所有這些以驚人的速度進行建設,真的是被低估的。你們理解嗎?

Brad Gerstner:

沒有政府規定你必須這樣做。今天在這個領域中創建這些AI的參與者們,認真地協調著最佳實踐,尊重這些關鍵問題。

黃仁勛:

所以這是被低估和誤解的。有人需要,也應該說每個人都需要開始討論人工智能作為一種AI系統和工程化系統的系統,這些系統是經過良好設計的,從基本原理構建,經過充分測試等等。

監管。記住,人工智能是一項可以應用的能力,并且不...需要對重要技術進行監管,但也不要過度干預到某些監管應該進行的領域,大部分的監管應該在應用層面進行,比如FAA、NIH、FDA等等,對吧?所有現在已經對技術應用進行監管的不同生態系統,現在必須對融入AI的技術應用進行監管。我認為...不要誤解,也不要忽視世界上那種需要為人工智能激活的、龐大的監管量,不要僅僅依賴于一個可能能夠做這件事的普遍的銀河級別的AI委員會,因為這些不同的監管機構之所以被創建,是有原因的。

這些不同的監管機構之所以被創建,是有原因的。再回到基本原理。

Brad Gerstner:

如果我不提開源問題,我會被我的合作伙伴Bill Gurley批評。你們最近發布了一個非常重要、非常大的、非常有能力的開源模型,顯然Meta也在開源方面做出了重要貢獻。我發現當我讀推特時,關于開源與閉源有很多討論。你如何看待開源,尤其是你自己的開源模型在與前沿保持同步方面的能力?這是第一個問題。第二個問題是,擁有開源模型同時也有閉源模型,驅動商業運作,你認為這是未來的趨勢嗎?這兩者是否能夠創造出有益的安全張力?

黃仁勛:

開源與閉源涉及安全,但不僅僅是關于安全。例如,完全沒有問題的是擁有作為經濟模型引擎的閉源模型,這對維持創新是必要的。我全力支持這一點。我認為封閉與開放之間的爭論是錯誤的,它不應該是封閉或開放,應該是封閉和開放的結合。是的,因為開放對許多行業的激活是必要的。

如果沒有開源,所有這些不同領域的科學怎么能夠在人工智能上得到應用?因為他們必須開發自己的領域特定的AI,并且必須使用開源模型來創建領域特定的AI。這是相關的,但并不相同。僅僅擁有開源模型并不意味著你擁有人工智能。所以你必須擁有這些開源模型,才能啟用AI的創建。金融服務、醫療保健、交通等行業,科學領域的所有工作都是由于開源的啟用而得以實現。

Brad Gerstner:

不可思議。你們的開源模型是否有大量需求?

黃仁勛:

開源模型?首先是Llama下載量(就能說明),顯然,是的。馬克和他們所做的工作,令人難以置信,完全激活并參與了每一個行業,每一個科學領域。

我們之所以做Nemotron,是為了生成合成數據。直觀地說,一個AI坐在那里不斷循環生成數據來學習自己,這聽起來很脆弱,你能在那個無限循環中繞多少次呢?那樣的循環是有問題的。我的內心圖像就像是把一個超級聰明的人放進一個房間,關上門待上一個月,出來的可能并不會更聰明。但是,假設你可以有兩三個不同的AI,擁有不同的知識分布,大家可以互相QA。我們三個都能變得更聰明。因此,AI模型交換、互動、辯論、強化學習、合成數據生成等方面的想法,直覺上是合理的。

是的,所以我們的模型Nemotron 340B是世界上最好的獎勵系統模型,它是最好的批判模型。好吧,有趣,嗯,所以,這是一個出色的模型,用來提升別人的模型,不管別人模型有多好,我建議使用Nemotron 340B來增強和改進它。我們已經看到LMA的效果,更好地讓所有其他模型變得更好。

工作并不總是有趣,但始終充滿熱愛

Brad Gerstner:

好了,我們快到結尾了。

黃仁勛:

謝天謝地。(小編注:謝天謝地)

Brad Gerstner:

作為2016年交付DGX-1的人,這真是一次非凡的旅程。你的旅程既不可能又非凡,感謝你一直都在。像我們在2016年交付了第一個DGX-1,我們在2022年經歷了一個Cambrian(小編注:寒武紀,物種大爆發)時刻。我將問你一個我常被問到的問題,如何在有60名直接下屬的情況下維持你今天所做的工作?你無所不在,推動著這場革命。你開心嗎?有沒有想做別的事情?

黃仁勛:

這個問題關于過去一個半小時的討論。答案是:很好,我度過了一段美好時光,真的是非常開心,我不能想象有比這更好的事情做了。讓我看看,我不認為應該給人留下這樣的印象,認為我們的工作一直很有趣。我的工作并不是總是有趣的,我也不期望它總是有趣。是不是每時每刻都應該有趣?我認為很重要的是,我不把自己看得太重,我非常認真地對待工作,對待我們的責任,對待我們的貢獻和我們所處的時刻。

那總是有趣嗎?不,但我總是熱愛它。就像所有的事情一樣,不管是家庭、朋友、孩子,是不是每時每刻都很有趣?不,但我們總是深深愛著它。所以,我認為...

我能做多久?真正的問題是我能保持多久的相關性?這個問題只能通過我如何繼續學習來回答。我今天比以前更樂觀。我今天這樣說并不是因為我們今天的話題,而是因為人工智能。每天我都會使用它。我不確定你們是否也在使用,但我可以說,我每天都在使用它。

沒有一項研究我不涉及人工智能,沒有一個問題,即使我知道答案,我都會用人工智能再檢查一下,令人驚訝的是,我接下來的兩三次提問,居然會揭示我之前不知道的事情。你選擇任何一個話題,我認為AI作為一個導師、AI作為一個助手、AI作為一個合作伙伴來進行頭腦風暴、檢查我的工作,哇,簡直是革命性的。你知道,我是一個信息工作者,我的輸出就是信息。所以,我認為所有對社會的貢獻都是非凡的。如果是這樣,如果我能保持相關性,并繼續做出貢獻,我知道這份工作足夠重要,值得我繼續追求。而且我的生活質量非常好。所以我會說...

Brad Gerstner:

我無法想象,你和我已經做了幾十年,我們不能錯過這個時刻,這是我們職業生涯中最有意義的時刻,我們深深感激這段合作。

黃仁勛:

不要錯過未來十年。

Brad Gerstner:

感謝你的思維分享,你讓我們變得更聰明。謝謝,我認為你真的是那個領導團隊中的重要一員,能夠樂觀、安全地推動這一切向前發展。

黃仁勛:感謝大家陪伴,真的很開心,感謝Brad,謝謝Clark。

Brad Gerstner:

提醒大家,這只是我們的個人觀點,不構成投資建議。

來源: ??51CTO技術棧??

?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
已于2024-10-21 12:31:52修改
收藏
回復
舉報
回復
相關推薦
主站蜘蛛池模板: 日韩欧美专区 | 亚洲天堂影院 | 视频在线观看一区 | 亚洲视频一区 | 人人干天天干 | 亚洲一区二区日韩 | 91av视频在线免费观看 | 国产一区二区小视频 | 91精品国产91久久久久游泳池 | 9999久久 | 成人免费视频观看视频 | 亚洲一区国产精品 | 一区二区三区高清 | 久久精品黄色 | 国际精品鲁一鲁一区二区小说 | 中文字幕一区二区三区在线乱码 | 国产高清一区二区三区 | 亚洲iv一区二区三区 | 中文字幕一区二区三区乱码图片 | 四虎精品在线 | 激情亚洲 | 免费视频一区二区 | 视频一区二区中文字幕日韩 | 欧美国产一区二区 | 国产高清免费视频 | 精品国产一区二区三区成人影院 | 四虎永久影院 | 久久九| 久久成人精品一区二区三区 | 亚洲精品免费在线观看 | 免费视频一区二区 | 国产一区二区三区视频 | 亚洲电影免费 | 亚洲精品国产电影 | 久综合 | 综合精品| 久久九七| 成人在线免费视频观看 | 精品欧美| 国产91精品在线 | 亚洲一区久久 |