Karpathy最新四小時視頻教程：從零復現GPT-2，通宵運行即搞定

作者：機器之心 2024-06-11 08:37:00

這是Karpathy「Neural Networks：zero to hero」系列視頻的最新內容。

AI 大牛 Andrej Karpathy 又「上新」了，這次一口氣放出了長達四個小時的視頻。

視頻主題為「讓我們來復現 GPT-2（1.24 億參數）」。

Karpathy 表示，此次視頻之所以這么長，是因為它很全面：從空文件開始，最后得到一個 GPT-2（124M）模型。

具體實現步驟包括如下：

該視頻以「Zero To Hero」系列視頻為基礎，有些地方參考了以往視頻。你可以根據該視頻構建 nanoGPT 存儲庫，到最后大約有 90% 相似。

當然，Karpathy 上傳了相關的 GitHub 存儲庫「build-nanogpt」，包含了全部提交歷史，這樣你可以一步步看到視頻中所有的代碼變化。

GitHub 地址：https://github.com/karpathy/build-nanogpt

AI 獨角獸 Scale AI CEO Alexandr Wang 表示，Karpathy 發布視頻就像是流行歌手發布新單曲一樣。

甚至還有人將 Karpathy 的推特內容通過文生音樂模型 Suno 轉換為了一首 Rap，簡直了。

圖源：https://x.com/peterxing/status/1799960277288677478

該視頻分為了四大部分：建立網絡（很多是以往教程回顧）、加快訓練速度、設置運行和結果。

視頻第一部分內容（帶時間戳）具體如下：

視頻第二部分內容（帶時間戳）具體如下：

視頻第三部分內容（帶時間戳）具體如下：

視頻第四部分內容（帶時間戳）具體如下：

03:59:39 總結，并上傳「build-nanogpt github」存儲庫

完整視頻參見如下：https://www.youtube.com/watch?v=l8pRSuU81PU&feature=youtu.be

責任編輯：張燕妮來源：機器之心

成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看