成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

速攬2500星,Andrej Karpathy重寫了一份minGPT庫(kù)

新聞 人工智能
時(shí)隔兩年,GPT的Pytorch訓(xùn)練庫(kù)minGPT迎來更新!

作為人工智能領(lǐng)域「暴力美學(xué)」的代表作,GPT 可謂是出盡風(fēng)頭,從誕生之初的 GPT 1.17 億參數(shù),一路狂飆到 GPT-3 1750 億參數(shù)。隨著 GPT-3 的發(fā)布,OpenAI 向社區(qū)開放了商業(yè) API,鼓勵(lì)大家使用 GPT-3 嘗試更多的實(shí)驗(yàn)。然而,API 的使用需要申請(qǐng),而且你的申請(qǐng)很有可能石沉大海。

為了讓資源有限的研究者也能體驗(yàn)一把玩大模型的樂趣,前特斯拉 AI 負(fù)責(zé)人 Andrej Karpathy 基于 PyTorch,僅用 300 行左右的代碼就寫出了一個(gè)小型 GPT 訓(xùn)練庫(kù),并將其命名為 minGPT。這個(gè) minGPT 能夠進(jìn)行加法運(yùn)算和字符級(jí)的語(yǔ)言建模,而且準(zhǔn)確率還不錯(cuò)。

時(shí)隔兩年,minGPT 迎來更新,Karpathy 又上線新版本,并命名為 NanoGPT,該庫(kù)用于訓(xùn)練和微調(diào)中型大小的 GPT。上線短短幾天,狂攬 2.5K 星。

圖片


項(xiàng)目地址:https://github.com/karpathy/nanoGPT

在項(xiàng)目介紹中,Karpathy 這樣寫道:「NanoGPT 是用于訓(xùn)練和微調(diào)中型尺度 GPT 最簡(jiǎn)單、最快的庫(kù)。是對(duì) minGPT 的重寫,因?yàn)?minGPT 太復(fù)雜了,以至于我都不愿意在使用它。NanoGPT 還在開發(fā)當(dāng)中,當(dāng)前致力于在 OpenWebText 數(shù)據(jù)集上重現(xiàn) GPT-2。

NanoGPT 代碼設(shè)計(jì)目標(biāo)是簡(jiǎn)單易讀,其中 train.py 是一個(gè)約 300 行的代碼;model.py 是一個(gè)約 300 行的 GPT 模型定義,它可以選擇從 OpenAI 加載 GPT-2 權(quán)重。」

圖片

為了呈現(xiàn)數(shù)據(jù)集,用戶首先需要將一些文檔 tokenize 為一個(gè)簡(jiǎn)單的 1D 索引數(shù)組。

$ cd data/openwebtext
$ python prepare.py

這將生成兩個(gè)文件:train.bin 和 val.bin,每個(gè)文件都包含一個(gè)代表 GPT-2 BPE token id 的 uint16 字節(jié)原始序列。該訓(xùn)練腳本試圖復(fù)制 OpenAI 提供的最小的 GPT-2 版本,即 124M 版本。

$ python train.py

假如你想使用 PyTorch 分布式數(shù)據(jù)并行(DDP)進(jìn)行訓(xùn)練,請(qǐng)使用 torchrun 運(yùn)行腳本。

$ torchrun --standalone --nproc_per_node=4 train.py

為了讓代碼更有效,用戶也可以從模型中進(jìn)行取樣:

$ python sample.py

Karpathy 表示,該項(xiàng)目目前在 1 個(gè) A100 40GB GPU 上一晚上的訓(xùn)練損失約為 3.74,在 4 個(gè) GPU 上訓(xùn)練損失約為 3.60。在 8 x A100 40GB node 上進(jìn)行 400,000 次迭代(約 1 天)atm 的訓(xùn)練降至 3.1。

至于如何在新文本上微調(diào) GPT,用戶可以訪問 data/shakespeare 并查看 prepare.py。與 OpenWebText 不同,這將在幾秒鐘內(nèi)運(yùn)行。微調(diào)只需要很少的時(shí)間,例如在單個(gè) GPU 上只需要幾分鐘。下面是運(yùn)行微調(diào)的一個(gè)例子

$ python train.py config/finetune_shakespeare.py

項(xiàng)目一上線,已經(jīng)有人開始嘗試了:

圖片

想要嘗試的小伙伴,可以參考原項(xiàng)目運(yùn)行。

責(zé)任編輯:張燕妮 來源: 機(jī)器之心
相關(guān)推薦

2024-09-29 13:30:00

2024-12-26 16:36:22

2022-02-28 11:26:40

模型深度學(xué)習(xí)谷歌

2020-12-07 16:14:40

GitHub 技術(shù)開源

2023-09-01 14:32:27

語(yǔ)言大語(yǔ)言模型

2022-10-20 12:11:32

數(shù)據(jù)數(shù)據(jù)分析分類維度

2023-07-24 14:26:58

OpenAIGPT-4Karpathy

2023-05-16 14:07:52

AI自然語(yǔ)言

2019-03-24 14:14:40

代碼閱讀源代碼

2022-08-21 21:15:28

模型AI

2025-06-05 09:03:39

2018-03-09 10:28:30

生態(tài)報(bào)告簽收

2020-07-15 15:38:15

人臉識(shí)別照片活化手機(jī)

2022-04-29 08:48:25

開源

2019-07-17 07:07:54

MySQL數(shù)據(jù)庫(kù)索引

2024-12-04 09:25:00

2019-03-15 15:15:12

硬盤SSD閃存

2009-03-11 13:32:12

簡(jiǎn)歷求職應(yīng)聘

2015-03-19 15:17:11

2018-07-29 15:33:04

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

主站蜘蛛池模板: 久久与欧美 | 欧美精品久久 | 香蕉大人久久国产成人av | 在线看91 | 中文字幕四虎 | 日日夜夜天天 | 精品久久久久久 | 精精国产视频 | 国产精品久久久久久久久久久久 | 91福利在线导航 | 国产日韩精品一区二区三区 | 蜜桃在线一区二区三区 | 成人字幕网zmw | 国产婷婷精品 | 国产精品国产三级国产aⅴ原创 | 亚洲伊人精品酒店 | 午夜精品一区二区三区免费视频 | 成人精品鲁一区一区二区 | 九九热精品视频 | 国产精品自产拍在线观看蜜 | 亚洲午夜精品在线观看 | 91精品国产91久久久久久最新 | 国产精品久久久久久久久久久久午夜片 | 中文字幕一区二区三区不卡在线 | 精品视频一区二区 | 亚洲欧美日韩久久久 | 国产欧美二区 | 亚洲精品一区二区三区 | 精品一级 | 欧美亚洲第一区 | 久草视频观看 | 国产精品久久久精品 | 国产成人综合亚洲欧美94在线 | 91成人精品 | 久久久久国产一区二区三区 | 国产亚洲精品精品国产亚洲综合 | 国产高清免费 | 五月激情综合 | 日本一级淫片免费啪啪3 | 黄网免费 | av网站免费看 |