成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

大模型指令調(diào)優(yōu)數(shù)據(jù)集萬字評測!騰訊上交大聯(lián)合出品

人工智能 新聞
騰訊優(yōu)圖實(shí)驗(yàn)室發(fā)布一篇完整綜述進(jìn)行梳理。長度超過了萬字,涉及的文獻(xiàn)多達(dá)400余篇。

一口氣生成2萬字,大模型輸出也卷起來了!

清華&智譜AI最新研究,成功讓GLM-4、Llama-3.1輸出長度都暴增。

相同問題下,輸出結(jié)果直接從1800字增加到7800字,翻4倍

圖片

要知道,目前大模型的生成長度普遍在2k以下。這對于內(nèi)容創(chuàng)作、問題回答等都存在影響,可能導(dǎo)致模型回答問題不全面、創(chuàng)造性降低等。

該研究由智譜AI創(chuàng)始人、清華大學(xué)教授李涓子和唐杰共同領(lǐng)銜。

圖片

論文及代碼都已放在GitHub上開源。

有網(wǎng)友已經(jīng)搶先體驗(yàn)。LongWriter-llama3.1-8b可生成萬字長文《羅馬帝國衰落史》,在MacBook Pro 2018(32GB)上就能運(yùn)行。

輸出內(nèi)容很準(zhǔn)確,可以得A++。

圖片

9B模型搞定萬字輸出

本項(xiàng)研究主要包括3方面工作。

  • 分析文本生成長度限制因素
  • 提出AgentWrite
  • 擴(kuò)展LLM輸出窗口大小

首先,研究人員構(gòu)建了一個(gè)測試工具LongWrite-Ruler。通過測試多個(gè)大模型,他們發(fā)現(xiàn)所有模型在生成超過2000字的文本時(shí)都遇到了困難。

進(jìn)一步分析用戶和大模型的交互日志,研究人員發(fā)現(xiàn)只有超過1%的用戶請求明確提到要生成超過2000字的文本。

為此,他們改變了模型在監(jiān)督式微調(diào)(SFT)階段使用的數(shù)據(jù)集的最大輸出長度

結(jié)果發(fā)現(xiàn),模型的最大輸出長度與SFT數(shù)據(jù)集中的最大輸出長度呈顯著正相關(guān)

所以得出結(jié)論,現(xiàn)有模型在輸出長度上受限主要是因?yàn)?strong>SFT數(shù)據(jù)集中缺少長輸出樣本。

即使模型在預(yù)訓(xùn)練階段見過更長的序列,但是SFT階段缺乏長文本樣本,還是會影響輸出長度。

圖片

為了克服這個(gè)限制,研究人員提出了AgentWrite

這是一個(gè)基于Agent的pipline。

圖片

它允許將超長文本生成任務(wù)分解為多個(gè)子任務(wù),每個(gè)子任務(wù)處理其中的一段。

具體流程是AgentWrite先根據(jù)用戶指令制定出一個(gè)詳細(xì)的寫作計(jì)劃,計(jì)劃包括每個(gè)段落的主要內(nèi)容點(diǎn)和目標(biāo)詞數(shù)。根據(jù)計(jì)劃,AgentWrite依次提示模型生成每個(gè)段落的內(nèi)容。

圖片

在AgentWrite基礎(chǔ)上,團(tuán)隊(duì)利用GPT-4o生成了6000個(gè)長輸出SFT數(shù)據(jù),輸出長度在2k到32k詞之間,構(gòu)成了數(shù)據(jù)集LongWriter-6k。并將這些數(shù)據(jù)添加到訓(xùn)練過程中。

為了驗(yàn)證方法的有效性,團(tuán)隊(duì)還提出了一個(gè)LongBench-Write。其中包含了多樣化的用戶寫作指令,輸出長度規(guī)格分別為0-500詞、500-2000詞、2000-4000詞以及4000詞以上。

評估結(jié)果顯示,使用AgentWrite后模型輸出長度明顯增加。

圖片

通過直接偏好優(yōu)化(DPO),GLM-4-9B在一眾模型中實(shí)現(xiàn)了最佳性能。

圖片

手速快的網(wǎng)友已經(jīng)搶先實(shí)測。

Reddit上一位網(wǎng)友讓LongWriter-llama3.1-8b生成羅馬帝國衰敗史,整體需要22分鐘(與硬件有關(guān)),平均每秒生成3.34個(gè)token。

圖片

生成內(nèi)容比較公式化,回答不同問題的結(jié)構(gòu)、節(jié)奏相似。

無論如何這是個(gè)好的開始,帶來的提升很明顯。

圖片

研究團(tuán)隊(duì)也表示未來將進(jìn)一步擴(kuò)展模型的輸出長度和輸出質(zhì)量,同時(shí)也會開始研究如何在不犧牲生成質(zhì)量的情況下提高效率。

責(zé)任編輯:張燕妮 來源: 量子位
相關(guān)推薦

2024-12-02 10:40:00

AI模型

2024-08-02 14:50:00

數(shù)據(jù)AI

2024-09-29 10:40:00

數(shù)據(jù)模型

2024-08-12 09:05:00

AI訓(xùn)練

2024-02-29 12:23:54

AI數(shù)據(jù)

2024-02-02 21:42:41

2022-07-19 16:03:14

KubernetesLinux

2023-11-13 19:35:12

訓(xùn)練數(shù)據(jù)

2025-01-07 13:22:58

2024-01-24 09:39:40

自動駕駛論文

2023-06-13 13:40:00

模型指令

2023-10-31 12:58:00

TypeScriptJavaScript

2021-03-16 08:21:29

Spark系統(tǒng)并行

2023-07-09 14:50:48

模型調(diào)優(yōu)

2024-01-15 08:17:00

模型技術(shù)

2025-06-26 02:22:00

vGPU大模型CPU

2022-11-21 14:43:34

人臉復(fù)原SOTA

2021-11-11 09:27:02

技術(shù)RedisMySQL

2023-01-06 08:15:58

StreamAPI接口
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: www.日本在线观看 | 欧洲国产精品视频 | 午夜精品久久久久久久久久久久久 | a级网站 | 欧美中国少妇xxx性高请视频 | 81精品国产乱码久久久久久 | 久久久久久99| 国产欧美一区二区三区久久人妖 | 国产一级片av | 国产日韩欧美综合 | 亚洲精品美女 | 日韩视频免费在线 | 九九热这里 | 亚洲成人av | 欧美精品日韩精品 | 日韩在线精品强乱中文字幕 | 午夜伦理影院 | 国产精品久久 | 久久精品成人 | 日韩成人在线网址 | a毛片 | 日韩在线精品视频 | 欧美综合一区 | 日韩一区在线观看视频 | 美女黄网站视频免费 | 亚洲狠狠爱 | 精品不卡| 亚洲国产精品久久久 | 国产成人网| 欧美专区在线 | 国产精品福利久久久 | 一级黄色播放 | 四虎永久免费黄色影片 | 日韩第一夜 | 在线一区| 日韩在线视频网址 | 精品视频一区二区三区 | jizz视频| av网站在线免费观看 | 人人鲁人人莫人人爱精品 | 久久国产一区 |