成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

跟李沐學ChatGPT背后技術:67分鐘讀透InstructGPT論文

人工智能 新聞
InstructGPT 和 ChatGPT 之間有很多一脈相承之處。因此,吃透 InstructGPT 論文對于想要在 ChatGPT 方向上做些工作的同學來說將大有裨益。

在 ChatGPT 走紅之后,很多關注技術的同學都在問一個問題:有沒有什么學習資料可以讓我們系統地了解 ChatGPT 背后的原理?由于 OpenAI 還沒有發布 ChatGPT 相關論文,這一問題變得棘手起來。

不過,從 OpenAI 關于 ChatGPT 的博客中我們知道,ChatGPT 用到的方法和它的兄弟模型 ——InstructGPT 一樣,只不過 InstructGPT 是在 GPT-3 上微調的,而 ChatGPT 則是基于 GPT-3.5。在數據收集工作上,二者也存在一些差別。

圖片

博客鏈接:https://openai.com/blog/chatgpt/

InstructGPT 的論文發布于 2022 年 3 月,不過 OpenAI 早在 1 月份就發布了相關博客(參見《GPT-3 胡言亂語怎么辦?OpenAI:我們重新調教了一下,新版本更「聽話」》)。當時,OpenAI 明確提到,InstructGPT 利用了人類反饋的強化學習方法(RLHF)對 GPT-3 進行微調,使得該模型的輸出更加符合人類偏好,這點在 ChatGPT 的訓練中得到了延續。

圖片

論文鏈接:https://arxiv.org/pdf/2203.02155.pdf

除此之外,InstructGPT 和 ChatGPT 之間還有很多一脈相承之處。因此,吃透 InstructGPT 論文對于想要在 ChatGPT 方向上做些工作的同學來說將大有裨益。這也是我們力薦李沐這節精講課的原因。

圖片

課程地址:https://jmq.xet.tech/s/2lec6b  (點擊「閱讀原文」可直達)

李沐博士是亞馬遜的資深首席科學家,之前和 Aston Zhang 等人共同撰寫了《動手學深度學習》。最近兩年,他一直通過視頻向大家介紹各種 AI 知識,制作了幾十篇論文的精讀課程。很多同學已經養成了跟著李沐精讀論文的習慣。

李沐博士在 B 站的賬號是「跟李沐學 AI」。

這節針對 InstructGPT 的解讀課程總共 67 分鐘,基本按照論文撰寫的順序進行介紹。

圖片

看過 ChatGPT 博客的同學都知道,它的技術原理基本用一張圖就能概括,這也是 InstructGPT 論文中就已經出現的一張圖(二者有細微差別)。在解讀論文的摘要和引言部分時,李沐詳細介紹了圖上的三個步驟。

圖片

ChatGPT 博客中的技術原理圖。

圖片

InstructGPT 論文中的技術原理圖。

在論文的第三章,InstructGPT 的作者首先介紹了他們的數據獲取方法和過程,李沐也帶著大家詳細讀了一下。這部分在工程方面非常有價值。正如李沐所說,如果你之前沒有做過這樣的事情(數據標注等),需要找人幫你標數據,那么你可以看它的附錄部分,里面有很多模板可以直接拿來用,論文作者甚至描述了他們標注網站的 UI 長什么樣,非常值得借鑒。

接下來,李沐重點解讀了第三章寫到的 3 個模型(見 3.5 Models )——SFT (Supervised fine-tuning) 模型、RM (Reward modeling) 模型和 RL (Reinforcement learning) 模型,包括這些模型涉及的參數和目標函數等細節。

最后,李沐總結說,從技術上來講,InstructGPT 還是一個非常實用的技術。它告訴了大家一個方法:給定一個大型語言模型,你怎樣通過一些標注數據迅速地提升它在某一個你關心的領域中的性能,使它達到實用的程度。所以,它給想用生成模型做產品的人提供了一個可操作的思路。

當然,正如李沐博士所說,科研工作是循序漸進的,InstructGPT 也是建立在之前研究的基礎上,所以想要吃透 ChatGPT 的同學不免還要回頭去讀更多論文。在之前的課程中,李沐也詳細解讀過 GPT、GPT-2、GPT-3 的論文:

圖片

課程地址:https://jmq.xet.tech/s/2lec6b  

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-03-31 08:15:00

LLM大型語言模型人工智能

2023-11-23 19:26:43

2023-02-03 08:25:21

ChatGPTInstructGP模型

2024-06-19 10:41:06

2020-01-07 13:09:39

區塊鏈比特幣技術

2021-09-07 09:40:20

Spark大數據引擎

2023-07-23 18:47:59

Docker開源

2021-01-29 11:43:53

SSHLinux命令

2023-05-25 08:02:09

構建工具源碼JS

2022-12-27 09:10:38

ChatGPT技術邏輯

2024-04-08 08:03:00

ChatGPTOpenAI大語言模型

2017-08-01 15:25:41

LinuxNginxHttps

2024-07-12 14:21:32

Python編碼

2023-07-16 18:49:42

HTTP網絡

2023-04-15 20:25:23

微前端

2024-12-18 10:24:59

代理技術JDK動態代理

2023-07-12 14:45:38

2023-03-02 09:35:55

chatGPTOpenAI編程

2023-09-28 21:46:10

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产丝袜av | 日本中出视频 | 激情久久av一区av二区av三区 | 久久亚洲欧美日韩精品专区 | 欧美区在线 | 国产精品亚洲二区 | 91社区在线观看播放 | 亚洲精品视频在线 | 99色综合| 日韩三级电影在线看 | 日韩靠逼| 久久精品无码一区二区三区 | 亚洲一区二区在线 | 国产精品网址 | 成人av电影免费在线观看 | 欧美亚洲另类在线 | 国产午夜精品一区二区三区嫩草 | 日韩在线一区二区 | 青草青草久热精品视频在线观看 | 日韩一区二区三区在线播放 | 一区二区三区av | 国产高清视频在线播放 | 国产三级在线观看播放 | 日本涩涩网 | av黄色在线 | 久久久国产一区二区三区四区小说 | 久久se精品一区精品二区 | 不卡在线视频 | 欧美久久一区 | 欧美精品一区二区三 | 国产精品久久久久久238 | 奇米影视首页 | 美女黄网站视频免费 | 国产精品美女久久久久久久网站 | 国产精品美女久久久久久久久久久 | 国产精品大片在线观看 | 国产精品乱码一区二区三区 | 一级免费毛片 | 综合网中文字幕 | 欧美成人一区二区三区片免费 | 91美女在线 |