成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

英偉達B200打破摩爾定律!老黃順便公開GPT-4的秘密

人工智能 新聞
我們需要更大的GPU,如果不能更大,就把更多GPU組合在一起,變成更大的虛擬GPU。

整個AI圈最想知道的秘密,被老黃在PPT某頁的小字里寫出來了?

圖片

時隔兩年,英偉達官宣新一代Blackwell架構,為AI帶來30倍推理加速。定位直指“新工業革命的引擎” 。

老黃PPT中拿了一個1.8萬億參數MoE的GPT系列大模型測試結果來證明。

圖片

眼尖的網友當場就盯上了這行不起眼的小字,截圖發出神秘暗號。

圖片

1.8萬億參數、MoE架構,與初代GPT-4的細節傳聞一毛一樣,32k序列長度也能對得上。

圖片

剛升任研究經理不久的英偉達科學家Jim Fan,甚至直接攤牌了。

表達摩爾定律已經限制不住英偉達了的同時,直接點破了這層窗戶紙。

圖片

不過個秘密之所以能以這種形式半官方確認,很可能說明對OpenAI來說已經無關緊要了。

很多人相信,最新版gpt-4-turbo經過一輪輪的優化,已經蒸餾到更小規模。

圖片

說回到英偉達GTC大會本身,作為架構更新的大年,老黃的主題演講亮點頗多:

  • 宣布GPU新核彈B200,超級芯片GB200
  • Blackwell架構新服務器,一個機柜頂一個超算
  • 推出AI推理微服務NIM,要做世界AI的入口
  • 新光刻技術cuLitho進駐臺積電,改進產能。
    ……

圖片

8年時間,AI算力已增長1000倍。

老黃斷言“加速計算到達了臨界點,通用計算已經過時了”。

我們需要另一種方式來進行計算,這樣我們才能夠繼續擴展,這樣我們才能夠繼續降低計算成本,這樣我們才能夠繼續進行越來越多的計算。

圖片

老黃這次主題演講題目為《見證AI的變革時刻》,但不得不說,英偉達才是最大的變革本革。

GPU的形態已徹底改變

我們需要更大的GPU,如果不能更大,就把更多GPU組合在一起,變成更大的虛擬GPU。

Blackwell新架構硬件產品線都圍繞這一句話展開。

通過芯片,與芯片間的連接技術,一步步構建出大型AI超算集群。

4nm制程達到瓶頸,就把兩個芯片合在一起,以10TB每秒的滿血帶寬互聯,組成B200 GPU,總計包含2080億晶體管。

內存也直接翻倍,高達192GB的HBM3e高速內存。

沒錯,B100型號被跳過了,直接發布的新架構首個GPU就是B200。

圖片

兩個B200 GPU與Grace CPU結合就成為GB200超級芯片,通過900GB/s的超低功耗NVLink芯片間互連技術連接在一起。

兩個超級芯片裝到主板上,成為一個Blackwell計算節點。

圖片

18個這樣的計算節點共有36CPU+72GPU,組成更大的“虛擬GPU”。

它們之間由今天宣布的NVIDIA Quantum-X800 InfiniBand和Spectrum?-X800以太網平臺連接,可提供速度高達800Gb/s的網絡。

圖片

在NVLink Switch支持下,最終成為“新一代計算單元”GB200 NVL72

一個像這樣的“計算單元”機柜,FP8精度的訓練算力就高達720PFlops,直逼H100時代一個DGX SuperPod超級計算機集群(1000 PFlops)。

圖片

與相同數量的72個H100相比,GB200 NVL72對于大模型推理性能提升高達30倍,成本和能耗降低高達25倍

把GB200 NVL72當做單個GPU使用,具有1.4EFlops的AI推理算力和30TB高速內存。

圖片

再用Quantum InfiniBand交換機連接,配合散熱系統組成新一代DGX SuperPod集群。

DGX GB200 SuperPod采用新型高效液冷機架規模架構,標準配置可在FP4精度下提供11.5 Exaflops算力和240TB高速內存。

此外還支持增加額外的機架擴展性能。

圖片

最終成為包含32000 GPU的分布式超算集群。

老黃直言,“英偉達DGX AI超級計算機,就是AI工業革命的工廠”。

將提供無與倫比的規模、可靠性,具有智能管理和全棧彈性,以確保不斷的使用。

圖片

在演講中,老黃還特別提到2016年贈送OpenAI的DGX-1,那也是史上第一次8塊GPU連在一起組成一個超級計算機,當時只有0.17 PFlops。

圖片

從此之后便開啟了訓練最大模型所需算力每6個月翻一倍的增長之路。

圖片

GPU新核彈GB200

過去,在90天內訓練一個1.8萬億參數的MoE架構GPT模型,需要8000個Hopper架構GPU,15兆瓦功率。

圖片

如今,同樣給90天時間,在Blackwell架構下只需要2000個GPU,以及1/4的能源消耗。

圖片

在標準的1750億參數GPT-3基準測試中,GB200的性能是H100的7倍,提供的訓練算力是H100的4倍。

圖片

Blackwell架構除了芯片本身外,還包含多項重大革新:

  • 第二代Transformer引擎

動態為神經網絡中的每個神經元啟用FP6和FP4精度支持。

圖片

  • 第五代NVLink高速互聯

為每個GPU 提供了1.8TB/s雙向吞吐量,確保多達576個GPU之間的無縫高速通信。

圖片

  • Ras Engine(可靠性、可用性和可維護性引擎)

基于AI的預防性維護來運行診斷和預測可靠性問題。

  • Secure AI

先進的加密計算功能,在不影響性能的情況下保護AI模型和客戶數據,對于醫療保健和金融服務等隱私敏感行業至關重要。

  • 專用解壓縮引擎

支持最新格式,加速數據庫查詢,以提供數據分析和數據科學的最高性能。

圖片

在這些技術加持下,一個GB200 NVL72就最高支持27萬億參數的模型。

假如初代GPT-4真是1.8萬億參數,一臺GB200 NVL72就能跑15個GPT-4。

圖片

英偉達要做世界AI的入口

老黃官宣ai.nvidia.com頁面,要做世界AI的入口。

任何人都可以通過易于使用的用戶界面體驗各種AI模型和應用。

同時,企業使用這些服務在自己的平臺上創建和部署自定義應用,同時保留對其知識產權的完全所有權和控制權。

圖片

這上面的應用都由英偉達全新推出的AI推理微服務NIM支持,可對來自英偉達及合作伙伴的數十個AI模型進行優化推理。

圖片

此外,英偉達自己的開發套件、軟件庫和工具包都可以作為NVIDIA CUDA-X?微服務訪問,用于檢索增強生成 (RAG)、護欄、數據處理、HPC 等。

圖片

比如通過這些微服務,可以輕松構建基于大模型和向量數據庫的ChatPDF產品,甚至智能體Agent應用。

圖片
圖片

NIM微服務定價非常直觀,“一個GPU一小時一美元”,或年付打五折,一個GPU一年4500美元。

從此,英偉達NIM和CUDA做為中間樞紐,連接了百萬開發者與上億GPU芯片。

什么概念?

老黃曬出AI界“最強朋友圈”,包括亞馬遜、迪士尼、三星等大型企業,都已成為英偉達合作伙伴。

圖片

最后總結一下,與往年相比英偉達2024年戰略更聚焦AI,而且產品更有針對性。

比如第五代NVLink還特意為MoE架構大模型優化通訊瓶頸。

新的芯片和軟件服務,都在不斷的強調推理算力,要進一步打開AI應用部署市場。

當然作為算力之王,AI并不是英偉達的全部。

這次大會上,還特別宣布了與蘋果在Vision Pro方面的合作,讓開發者在工業元宇宙里搞空間計算。

圖片

此前推出的新光刻技術cuLitho軟件庫也有了新進展,被臺積電和新思科技采用,把觸手伸向更上游的芯片制造商。

圖片

當然也少不了生物醫療、工業元宇宙、機器人汽車的新成果。

圖片

圖片

以及布局下一輪計算變革的前沿領域,英偉達推出云量子計算機模擬微服務,讓全球科學家都能充分利用量子計算的力量,將自己的想法變成現。

圖片

One More Thing

去年GTC大會上,老黃與OpenAI首席科學家Ilya Sutskever的爐邊對談,仍為人津津樂道。

當時世界還沒完全從ChatGPT的震撼中清醒過來,OpenAI是整個行業絕對的主角。

如今Ilya不知蹤影,OpenAI的市場統治力也開始松動。在這個節骨眼上,有資格與老黃對談的人換成了8位——

Transformer八子,開山論文《Attention is all you need》的八位作者。

他們已經悉數離開谷歌,其中一位加入OpenAI,另外7位投身AI創業,有模型層也有應用層,有toB也有toC。

這八位傳奇人物既象征著大模型技術真正的起源,又代表著現在百花齊放的AI產業圖景。在這樣的格局中,OpenAI不過是其中一位玩家。

而就在兩天后,老黃將把他們聚齊,在自己的主場。

圖片

要論在整個AI界的影響力、號召力,在這一刻,無論是“鋼鐵俠”馬斯克還是“奧特曼”Sam Altman,恐怕都比不過眼前這位“皮衣客”黃仁勛。

……

直播回放:https://www.youtube.com/watch?v=Y2F8yisiS6E

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-03-19 09:52:50

2024-06-03 12:00:23

2015-05-13 09:58:23

摩爾定律

2010-05-05 09:46:03

NVIDIA摩爾定律

2025-01-02 11:00:34

2024-06-03 08:35:00

2022-08-26 05:42:41

AI技術人工智能

2009-03-10 11:14:59

2010-04-13 09:56:45

32納米摩爾定律

2011-05-19 09:06:51

2013-01-09 10:07:37

摩爾定律處理器ARM

2013-05-14 09:12:01

Intel摩爾定律工藝制程

2010-02-01 10:30:09

摩爾定律“電子自轉”

2024-04-29 13:06:00

模型數據

2024-10-09 14:52:00

2015-06-29 09:14:00

云計算摩爾定律失效

2021-03-12 10:23:02

芯片半導體技術

2012-12-11 10:35:20

2023-10-13 13:11:58

數據智能
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 久久狠狠 | 黄色免费网址大全 | 国产在线观| 日韩成人 | 红桃成人在线 | 久久久www成人免费无遮挡大片 | 91麻豆产精品久久久久久 | 亚洲视频在线看 | 久久99深爱久久99精品 | 日日夜夜免费精品视频 | 亚洲视频免费在线观看 | 日韩毛片| 国内精品视频在线 | 欧美a∨ | 真人毛片| 欧美日韩在线观看视频 | 在线国产一区二区 | 日日干日日射 | 天天射影院 | 久久久久国产 | 亚洲欧美视频一区二区 | 欧美在线国产精品 | 蜜臀久久99精品久久久久野外 | 国产亚洲精品久久19p | 日韩在线综合网 | 国产麻豆乱码精品一区二区三区 | 激情久久av一区av二区av三区 | 粉嫩国产精品一区二区在线观看 | 在线一区 | 欧州一区二区三区 | 2018国产精品 | 999精品在线观看 | 中文区中文字幕免费看 | 亚洲精品亚洲人成人网 | 区一区二在线观看 | 国产亚洲一区二区三区在线观看 | 午夜影院 | 免费网站国产 | 成人免费精品视频 | 中文字幕第一页在线 | 成人免费淫片aa视频免费 |