成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

用暫停token重新訓練大模型,AI學會三思而后行

人工智能 新聞
整個研究基于一個簡單的想法:在輸入序列后面追加一系列(暫停token),從而延遲模型輸出下一個token。這可以給模型額外的計算時間來處理更復雜的輸入。

讓ChatGPT給出答案之前多想想步驟,就能提高準確率。

那么能不能省去提示詞,直接把這種能力內化在大模型里呢?

CMU與谷歌團隊的新研究,在訓練大模型時加入暫停token來實現這一點。

圖片

實驗中,8項評測成績提升,其中SQuAD的EM得分提高18%,CommonSenseQA提高8%,GSM8k中的推理任務也提高1%。

圖片

研究者Jack Hack表示,自己不久前就提出類似假設,很高興看到它被驗證。

圖片

英偉達工程師Aaron Erickson表示,是不是和人類說話時加入“嗯嗯啊啊”是一個道理?

圖片

預訓練微調都加入暫停token

整個研究基于一個簡單的想法:

在輸入序列后面追加一系列(暫停token),從而延遲模型輸出下一個token。

這可以給模型額外的計算時間來處理更復雜的輸入。

圖片

作者不僅在下游任務微調時引入,還在預訓練時就隨機在序列中插入,讓模型在兩階段都學習如何利用這種計算延遲。

圖片

預訓練階段,在語料庫中隨機插入一定比例的暫停token到輸入序列,進行標準的自回歸預訓練。但計算損失時會跳過暫停token的預測。

下游任務微調時,輸入中也追加一定數量的暫停 token,然后對目標序列進行自回歸預測,同時微調模型參數。

推理階段也追加相同數量的暫停token,但忽略模型輸出直到最后一個暫停token,然后開始提取答案。

實驗使用了標準的Transformer純Decoder模型,分為130M參數和1B參數兩個版本。

其中暫停token只增加了1024個參數,也就是它本身的embedding大小。

在9個不同任務上的實驗表明,僅在微調階段引入暫停token的效果并不明顯,有些任務不會提升。

但如果在預訓練和finetune階段都使用暫停token,大多數任務上都獲得顯著提升。

論文還探究了暫停token的數量、位置等關鍵超參數。發現對于不同的模型通常存在一個最優的數量。

最后作者也提出,這項工作也有不少局限性。

  • 由于暫停token增加了模型計算量,與其他方法對比是否公平還有待討論
  • 新方法需要重新預訓練,在實際應用還有一定困難
  • 對具體工作機制還缺乏深入理解
  • 推理時如果暫停token數量為0,模型表現仍然不佳

搜索引擎You.com的CEO表示,接下來是不是應該把所有提高人類認知表現的技巧都對大模型試一試?

圖片

現在已經有了“一步一步地想”和“深呼吸”。

也許下一個爆款論文就是教大模型帶著問題睡一覺或者更離譜的健康飲食、注意鍛煉。

論文地址:https://arxiv.org/abs/2310.02226

責任編輯:張燕妮 來源: 量子位
相關推薦

2018-08-08 06:49:35

云計算私有云公有云

2009-10-29 18:04:32

2011-03-29 15:53:28

數據庫管理

2015-02-26 14:10:58

部署虛擬化

2025-04-07 09:00:00

模型AI推理

2015-04-20 10:47:53

微服務容器技術PaaS

2011-02-18 10:22:30

2010-08-26 15:33:28

無線網絡

2013-09-11 11:00:59

HTML5企業

2023-10-16 13:39:00

AI智能

2025-02-18 08:00:00

2023-09-06 08:30:00

低代碼自動化開發

2010-02-01 16:39:32

Dell主板質量

2023-07-18 15:14:04

人工智能自動化

2015-04-16 16:58:39

2013-12-09 11:06:47

2014-08-20 11:17:03

2016-01-05 15:40:07

2015-08-24 13:42:58

WiFi安全

2013-09-12 10:30:46

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产小网站 | 亚洲精品久久久久久久久久久 | 91精品国产综合久久香蕉922 | 精品影院 | 亚洲国产精品人人爽夜夜爽 | 最新中文字幕久久 | 久热中文字幕 | 五月天婷婷综合 | 精品成人免费视频 | 欧美久久久久 | 91天堂| 午夜视频在线播放 | 久久久蜜桃一区二区人 | 久久久久久成人 | 亚洲黄色成人网 | 天天激情综合 | 日本国产精品视频 | 国产美女一区二区 | 成人精品网 | 亚洲一区二区三区免费在线 | 亚洲免费在线观看 | 欧美激情视频一区二区三区在线播放 | gogo肉体亚洲高清在线视 | 亚洲国产一区二区三区四区 | 蜜桃视频在线观看免费视频网站www | 粉嫩av| 国产精品久久久久久久久久妇女 | www国产成人免费观看视频,深夜成人网 | 亚洲一区二区三区在线视频 | 黄在线免费观看 | 99视频在线免费观看 | 欧美精品一区在线 | 最新国产在线 | 中文字幕亚洲欧美日韩在线不卡 | 人人99| 中文字幕在线不卡播放 | 国产精品美女久久久久久免费 | 欧美黑人一区 | 欧美男人天堂 | 亚洲国产精品福利 | 日韩精品中文字幕在线 |