成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

OpenAI把GPT-4原始版給了他們:研究不微調只靠提示詞能走多遠

人工智能
免微調對齊,讓剛出爐的預訓練模型不止會“文本補全”,只從提示詞中學會和用戶對話、跟隨指令,一直是業界關注的研究方向。目前的SOTA方法URIAL來自艾倫研究所,使用系統提示詞+少數風格示例就能達到不錯的效果。

除了OpenAI自己,居然還有別人能用上GPT-4-Base版??

也就是未經微調的預訓練版,還不會對話聊天,只會補全句子的模型。

EPFL(瑞士洛桑聯邦理工)團隊申請到了訪問權限,用于研究“上下文學習足以讓大模型跟隨指令嗎?”。

圖片

也就是不用監督微調、也不用RHLF或其他強化學習對齊方法,只靠提示詞能走多遠?

預訓練模型,究竟能不能一步登天,直接改造成聊天機器人或AI助手?

圖片

如果可行,將大大降低類ChatGPT大模型的開發難度。

免微調對齊靠譜嗎?

免微調對齊,讓剛出爐的預訓練模型不止會“文本補全”,只從提示詞中學會和用戶對話、跟隨指令,一直是業界關注的研究方向。

目前的SOTA方法URIAL來自艾倫研究所,使用系統提示詞+少數風格示例就能達到不錯的效果。

圖片

但EPFL團隊發現,URIAL仍無法完全彌補與指令微調模型的差距,尤其在多輪對話中的表現更差一些。

實驗中,在Llama系列、Mistral系列和一般人接觸不到的GPT-4-Base都觀察到這種現象。

其中GPT-4-Base的API訪問權限從OpenAI Researcher Access Program項目中申請到。

圖片

EPFL團隊從這里出發,嘗試了各種辦法來提升上下文學習的效果。

首先他們增加示例的數量,但發現幫助不大,沒有隨著例子數目增加性能就提升的趨勢。這一點跟圖像分類、機器翻譯等任務還不太一樣。

圖片

然后他們使用了貪心搜索算法,從一大堆示例中選擇最佳的添加到上下文。

這種方法可以進一步提高性能,但與指令微調模型的差距仍然存在,特別是在 AlpacaEval 2.0基準測試中。

圖片

此外他們還發現,貪心搜索為某個特定模型找到的最佳示例,對于其他模型不能可靠地遷移。

也就是說,不同的示例適合不同的模型

圖片

團隊還進行了一系列消融實驗,以更多地了解上下文學習的工作原理。

他們發現,在MT-Bench這樣的綜合評測中,示例包含正確的“問題-答案對”至關重要

這與此前大模型在分類任務中,只要有大量示例,部分標簽錯了也無所謂的發現非常不同。

圖片

所以最終得出的結論是:

即使采用更多復雜的改進方法,完全縮小上下文學習和指令微調之間的差距也有挑戰,即使對于非常長上下文的大模型也是如此。

論文最后分析,大語言模型可能通過上下文學習只學會了如何模仿例子里的回答風格,但還沒有真正理解執行指令的邏輯。

指令跟隨任務相對還是比較復雜和開放的,沒那么容易掌握。

想讓AI助手更“聽話”,暫時還是很難有捷徑可走。

論文地址:

https://arxiv.org/abs/2405.19874。

參考鏈接:
[1]https://x.com/maksym_andr/status/1796574297894318136。

責任編輯:姜華 來源: 量子位
相關推薦

2023-05-29 09:29:52

GPT-4語言模型

2024-04-22 08:25:00

2023-07-07 09:32:57

GPT-4OpenAI

2024-07-02 13:25:22

2023-12-09 13:24:40

OpenAIChatGPT人工智能

2023-04-09 16:17:05

ChatGPT人工智能

2023-06-19 08:19:50

2023-03-16 17:28:59

技術AI

2023-12-17 22:04:04

微軟GPT-4

2024-05-28 14:40:00

2023-08-06 08:06:30

OpenAIChatGPTGPT-4

2023-07-20 12:16:31

GPT-4AI

2023-09-06 16:44:03

2025-04-16 09:35:03

2023-05-05 10:17:00

計算機開源

2024-07-22 09:01:20

2023-03-16 08:13:56

人工智能?OpenAI

2023-06-08 11:27:10

模型AI

2024-06-28 13:40:03

2023-06-01 12:46:46

GPT-4數學OpenAI
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产精品亚洲一区 | av日韩在线播放 | 国产精品一二区 | 欧美不卡在线 | 久久精品免费看 | 一道本视频 | 成人国内精品久久久久一区 | 一级毛片视频 | 天天操夜夜骑 | 91久久国产综合久久91精品网站 | 国产精品欧美一区二区三区不卡 | 一区二区av| 五月综合激情在线 | 黄色国产视频 | 国产精品一二区 | 久久伊人久久 | 视频在线观看一区二区 | 国产伦精品一区二区三区精品视频 | 91资源在线观看 | 成人一区精品 | 国产三区四区 | 三级成人片 | 一区免费观看 | 久久日韩粉嫩一区二区三区 | 99精品国产一区二区青青牛奶 | 亚洲国产精品一区在线观看 | 中文字幕精品视频 | 色婷婷精品| 国产 日韩 欧美 中文 在线播放 | 七七婷婷婷婷精品国产 | 91精品免费 | 看一级毛片视频 | av中文在线播放 | 中文字幕在线视频免费观看 | www.日韩系列 | 成人不卡 | 精品视频在线播放 | 欧美福利影院 | 99精品热视频 | 国产女人精品视频 | 日韩一级精品视频在线观看 |