成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

英偉達最強通用大模型Nemotron-4登場!15B擊敗62B,目標單張A100/H100可跑

人工智能 新聞
許久未更新大模型的英偉達推出了150億參數的Nemotron-4,目標是打造一個能在單個A100/H100可跑的通用大模型。

最近,英偉達團隊推出了全新的模型Nemotron-4,150億參數,在8T token上完成了訓練。

值得一提的是,Nemotron-4在英語、多語言和編碼任務方面令人印象深刻。

論文地址:https://arxiv.org/abs/2402.16819

在7個評估基準上,與同等參數規模的模型相比,Nemotron-4 15B表現出色。

甚至,其性能超過了4倍大的模型,以及專用于多語言任務的模型。

如今LLM已經非常多了,英偉達新發布的語言模型,有何不同?

打造最強通用LLM,單個A100/H100可跑

最近發表的LLM研究受到了Chinchilla模型「縮放定律」的啟發——給定固定計算預算,數據和模型大小一同優化。

而過去,研究主要針對模型大小進行縮放。

研究表明,給定兩個數據分布類似的IsoFLOP GPT模型,一個是在1.4萬億token上的65億參數模型,另一個是3000億token上的2800億參數模型。

顯然,65B的模型在下游任務上的準確性更高。

圖片

從推理的角度來看,將計算分配給更多數據的訓練,而不是增加模型大小特別有吸引力,可以減少延遲和服務模型所需的計算量。

因此,語言建模訓練工作的主要焦點已轉向從CommonCrawl等公共資源中,收集高質量的數萬億token數據集。

對此,英偉達研究人員提出了Nemotron-4 15B,來延續這一趨勢。

具體來說,Nemotron-4 15B是在8萬億個token,包括英語、多語種、編碼文本的基礎上進行訓練。

英偉達稱,Nemotron-4 15B的開發目的:

成為能在單個英偉達A100或H100 GPU上運行的最佳「通用大模型」。

架構介紹

Nemotron-4采用了標準的純解碼器Transformer架構,并帶有因果注意掩碼。

核心的超參數,如表1所示。

圖片

Nemotron-4有32億個嵌入參數和125億個非嵌入參數。

研究人員使用旋轉位置編碼(RoPE)、SentencePiece分詞器、MLP層的平方ReLU激活、無偏置項(bias terms)、零丟失率,以及無限制的輸入輸出嵌入。

通過分組查詢關注(GQA),可實現更快的推理和更低的內存占用。

數據

研究人員在包含8萬億個token的預訓練數據集上訓練Nemotron-4 15B。

分為三種不同類型的數據:英語自然語言數據(70%)、多語言自然語言數據(15%)和源代碼數據(15%)。

英語語料庫由來自各種來源和領域的精選文檔組成,包括網絡文檔、新聞文章、科學論文、書籍等。

代碼和多語言數據包括一組多樣化的自然語言和編程語言。

研究人員發現,從這些語言中適當地采樣token是在這些領域獲得高準確度的關鍵。

此外,研究人員分別在圖3和圖4中共享預訓練數據集中用于代碼和多語言標記的分布。

圖片

預訓練

Nemotron-4使用384個DGX H100節點進行訓練。每個節點包含8個基于英偉達Hopper架構的H100 80GB SXM5 GPU。

在執行無稀疏性的16位浮點(bfloat16)算術時,每個H100 GPU的峰值吞吐量為989 teraFLOP/s。

每個節點內,GPU通過NVLink和NVSwitch(nvl)連接;GPU到GPU的帶寬為900 GB/s(每個方向450 GB/s)。

每個節點都有8個NVIDIA Mellanox 400 Gbps HDR InfiniBand主機通道適配器(HCA),用于節點間通信。

研究人員使用8路張量并行和數據并行的組合來訓練模型,還使用了分布式優化器,將優化器狀態分片到數據并行副本上。隨著批大小的增加,數據并行度從96增加到384。

表2總結了批大小提升的3個階段,包括每次迭代時間和模型FLOP/s利用率(MFU)。MFU量化了GPU在模型訓練中的利用效率。訓練大約在13天內完成。

圖片

再訓練

與最近的研究類似,研究人員發現在模型訓練結束時,切換數據分布和學習率衰減時間表,可以極大地提高模型質量。

具體來說,在對整個8T預訓練數據集進行訓練之后,使用相同的損失目標,并對與預訓練token相比的較少的token進行持續訓練。

在這一額外的繼續訓練階段,利用兩種不同的數據分布。

第一個分布是,從持續訓練期間大部分token采樣。它利用在預訓練期間已經引入的token,但其分布將更大的采樣權重放在更高質量來源上。

第二個分布,引入了少量基準式對齊示例,以更好地讓模型在下游評估中回答此類問題,同時還增加來自模型性能較低區域的數據源的權重。

實驗結果

研究人員在涵蓋各種任務和領域的下游評估領域評了 Nemotron-4 15B。

常識推理

作者使用LM-Evaluation Harness在所有上述任務中評估Nemotron-4 15B。

表3顯示了Nemotron-4 15B在這組不同的任務中實現了最強的平均性能。

圖片

熱門的綜合基準

從表4可以看出,Nemotron-4 15B在現有模型中獲得了BBH的最佳分數,增長了近7%。

此外,Nemotron-4在BBH基準測試中明顯優于LLaMA-2 70B模型,其中LLaMA-2 70B的得分為51.2,Nemotron-4的得分為58.7。

Nemotron-4 15B另外還獲得了極具競爭力的MMLU分數。

圖片

數學和代碼

表5重點介紹了Nemotron-4 15B在數學和代碼任務上的性能。

具體來說,在數學推理上,Nemotron-4 15B表現強勁,得分與Gemma 7B相似,但落后于Baichuan-2和QWEN等模型。

在代碼任務中,Nemotron-4的性能與QWEN 14B相當,但略落后于Gemma 7B。

在這兩種類型的任務中,Nemotron-4 15B的性能均優于Mistral 7B和LlaMA-213B/34B。

圖片

幾乎所有類似規模的開放模型都只根據Python相關任務的性能來確定其代碼能力,而忽略了對其他編程語言能力的評估。

在表6中,展示了Nemotron-4 15B在Multiple-E基準上的結果,涉及11種不同的編程語言。

結果發現,Nemotron-4 15B在各種編程語言中都有很強的編碼性能,平均性能優于Starcoder和Mistral 7B。

研究人員特別強調了Nemotron-4 15B在Scala、Julia和R等低資源編程語言上的卓越性能。

圖片

多語言

分類

在表7中,可以清楚地看到Nemotron-4在所有模型中實現了最佳性能,在4次設置中實現了近12%的改進。

圖片

生成

表8顯示Nemotron-4 15B實現了最佳性能。

令人印象深刻的是,Nemotron-4 15B能夠顯著改進下一個最佳模型PaLM 62B-cont。

表9顯示了MGSM上的性能,進一步證明了Nemotron-4 15B令人印象深刻的多語言能力。

在這項評估數學和多語言能力交集的挑戰性任務中,Nemotron-4 15B在比較模型中實現了最佳性能,并且比最接近的分數提高了近30%。

圖片

機器翻譯

如表10所示,Nemotron-4 15B的性能遠遠優于LLaMA-2 13B和Baichuan-2 13B,性能分別提高了90.2%和44.1%。

Nemotron-4 15B不僅在中文翻譯成英文方面表現出色,而且在中文直接翻譯成其他語言方面也能取得令人印象深刻的效果。

這種能力凸顯了Nemotron-4 15B對廣泛的自然語言的深刻理解。

圖片

責任編輯:張燕妮 來源: 新智元
相關推薦

2024-06-17 08:55:00

2023-06-14 12:08:51

2023-08-14 08:07:46

ChatGPTAI

2023-08-13 07:44:18

GPU模型英偉達

2025-01-20 07:30:00

2024-09-05 14:10:00

AI計算

2023-11-21 09:14:33

微軟Azure AI

2023-10-18 13:17:12

AI芯片英偉達美國

2023-11-14 08:59:25

英偉達AI

2025-02-27 09:09:45

2022-11-08 15:00:51

芯片英偉達

2024-07-22 07:50:00

模型英偉達

2025-04-22 09:47:07

2024-03-14 14:49:34

Meta人工智能

2023-08-10 13:54:36

GPUAI

2024-10-17 14:05:34

2023-09-11 12:58:00

AI訓練

2023-08-06 13:01:34

AI開發

2021-10-12 15:03:18

模型人工智能深度學習

2023-09-14 13:23:00

AI芯片
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 亚洲精品亚洲人成人网 | 精品视频在线观看 | 久久国内精品 | 国产成人99久久亚洲综合精品 | 夏同学福利网 | 久久久一二三区 | 欧美最猛黑人xxxⅹ 粉嫩一区二区三区四区公司1 | 四虎成人精品永久免费av九九 | 黄视频网址 | 国产精品99久久久久久久久 | 国产剧情一区 | 欧美在线一区二区三区 | 九九九视频在线观看 | 天天操伊人| 久久精品亚洲一区二区三区浴池 | 在线一区 | 亚洲精品视频一区二区三区 | 日本午夜精品 | 久久伊人一区 | 国产免费av在线 | 日韩精品一区二区三区视频播放 | av色在线| 日韩视频中文字幕 | 久久久久亚洲精品 | 亚州视频在线 | 亚洲精品第一页 | 国产精品精品久久久 | 国产97视频在线观看 | 国家aaa的一级看片 h片在线看 | 9久久婷婷国产综合精品性色 | 日本成人中文字幕 | 国产精品国产精品国产专区不卡 | 日韩成人专区 | 国产在线精品一区二区三区 | 新超碰97| 国产激情一区二区三区 | 亚洲 欧美 精品 | 日韩午夜一区二区三区 | 精品欧美一区二区三区久久久 | 久久综合婷婷 | 国产精品久久久久久久久久久久 |