成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Karpathy最新四小時視頻教程:從零復現GPT-2,通宵運行即搞定

人工智能 新聞
這是Karpathy「Neural Networks:zero to hero」系列視頻的最新內容。

AI 大牛 Andrej Karpathy 又「上新」了,這次一口氣放出了長達四個小時的視頻。

視頻主題為「讓我們來復現 GPT-2(1.24 億參數)」。

圖片

Karpathy 表示,此次視頻之所以這么長,是因為它很全面:從空文件開始,最后得到一個 GPT-2(124M)模型。

具體實現步驟包括如下:

  • 首先構建 GPT-2 網絡。
  • 然后對其進行優化,以便快速訓練。
  • 然后通過參考 GPT-2 和 GPT-3 論文來設置訓練運行優化和超參數。
  • 然后進行模型評估。
  • 然后祈禱好運,并去睡覺。
  • 第二天早上,查看結果并享受有趣的模型生成。通宵運行的結果甚至非常接近 GPT-3(124M)模型。

該視頻以「Zero To Hero」系列視頻為基礎,有些地方參考了以往視頻。你可以根據該視頻構建 nanoGPT 存儲庫,到最后大約有 90% 相似。

當然,Karpathy 上傳了相關的 GitHub 存儲庫「build-nanogpt」,包含了全部提交歷史,這樣你可以一步步看到視頻中所有的代碼變化。

圖片

 GitHub 地址:https://github.com/karpathy/build-nanogpt

AI 獨角獸 Scale AI CEO Alexandr Wang 表示,Karpathy 發布視頻就像是流行歌手發布新單曲一樣。

圖片

甚至還有人將 Karpathy 的推特內容通過文生音樂模型 Suno 轉換為了一首 Rap,簡直了。

圖源:https://x.com/peterxing/status/1799960277288677478

視頻概覽

該視頻分為了四大部分:建立網絡(很多是以往教程回顧)、加快訓練速度、設置運行和結果。

視頻第一部分內容(帶時間戳)具體如下:

  • 00:13:47 第 1 部分:實現 GPT-2 nn.Module
  • 00:28:08 加載 huggingface/GPT-2 參數
  • 00:31:00 實現前向傳遞以獲取 logits 
  • 00:33:31 采樣初始化、前綴 token、tokenization
  • 00:37:02 采樣循環
  • 00:41:47 采樣、自動檢測設備
  • 00:45:50 讓我們訓練:數據批次 (B,T) → logits (B,T,C)
  • 00:52:53 交叉熵損失
  • 00:56:42 優化循環:過度擬合單個批次

視頻第二部分內容(帶時間戳)具體如下:

  • 01:22:18 第 2 部分:讓我們加快速度。GPU、混合精度、1000 毫秒 
  • 01:28:14 Tensor Cores、代碼計時、TF32 精度、333 毫秒 
  • 01:39:38 float16、梯度縮放器、bfloat16、300 毫秒 
  • 01:48:15 torch.compile、Python 開銷、內核融合、130 毫秒 
  • 02:00:18 flash attention 技術、96 毫秒 
  • 02:06:54 nice/ugly 數。詞匯量 50257 → 50304,93 毫秒

視頻第三部分內容(帶時間戳)具體如下:

  • 02:14:55 第 3 部分:超參數、AdamW、梯度裁剪
  • 02:21:06 學習率調度器:預熱 + 余弦衰減
  • 02:26:21 批大小調度、權重衰減、FusedAdamW、90 毫秒
  • 02:34:09 梯度累積
  • 02:46:52 分布式數據并行 (DDP)
  • 03:10:21 GPT-2、GPT-3、FineWeb (EDU) 中使用的數據集
  • 03:23:10 驗證數據拆分、驗證損失、采樣恢復
  • 03:28:23 評估:HellaSwag,開始運行

視頻第四部分內容(帶時間戳)具體如下:

  • 03:43:05 第 4 部分:早上出結果!GPT-2、GPT-3 復現成功
  • 03:56:21 向 llm.c 致敬,原始 C/CUDA 中等效但速度更快的代碼

03:59:39 總結,并上傳「build-nanogpt github」存儲庫

完整視頻參見如下:https://www.youtube.com/watch?v=l8pRSuU81PU&feature=youtu.be

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-06-12 13:27:58

2024-05-30 07:02:00

KarpathyGPT-2人工智能

2024-07-12 12:46:03

2024-04-11 12:47:37

AI模型

2023-08-17 08:00:00

2024-02-22 09:51:56

代碼AI

2024-11-21 14:30:00

模型訓練

2023-06-05 14:04:59

模型AI

2024-02-21 14:07:00

2009-06-04 08:53:57

struts2視頻教程

2013-06-18 02:39:29

CocoStudio工Cocos2d-x

2009-03-22 18:16:04

CCNA視頻教程

2009-04-10 18:16:19

CCNP視頻

2024-02-29 15:39:00

AI研究算力

2025-03-05 08:50:00

模型AI數據

2011-06-14 16:33:21

Android視頻教程

2011-06-14 16:13:48

Dalvik系統架構Android

2011-06-14 15:49:45

Android視頻教程

2011-12-30 15:21:38

PhoneGap視頻
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: www.嫩草| 中文字幕福利 | 精品欧美一区二区三区久久久 | 中文字幕一区二区三区日韩精品 | 精品国产区 | 亚洲成人网在线观看 | 国产精品视频一区二区三区四蜜臂 | av中文字幕在线观看 | 亚洲精品久久久久久首妖 | 视频在线一区二区 | 91网站视频在线观看 | 五月天国产 | 久色网| 精精国产xxxx视频在线播放 | 久久久久国产精品 | 午夜成人在线视频 | 日韩精品视频在线免费观看 | 亚洲精品久久嫩草网站秘色 | 亚洲精品久久久久中文字幕欢迎你 | 久久久久久国产精品久久 | 日本不卡视频 | 欧美综合一区 | 日韩欧美在线观看 | 亚洲一区久久 | 国产视频一区二区三区四区五区 | 亚洲一区亚洲二区 | 精品国产亚洲一区二区三区大结局 | 成人欧美一区二区 | 成人伊人| 国产一区二区三区不卡av | www中文字幕| 九九热国产精品视频 | 成人精品鲁一区一区二区 | 男女视频在线看 | 国产我和子的乱视频网站 | 日日夜夜精品 | 精品国产欧美一区二区 | 人人干人人干人人干 | 国产精品久久久久久久久久久新郎 | 中文字幕一区二区三区精彩视频 | 久久草在线视频 |