成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

32k上下文可商用!羊駝進化成長頸鹿,“開源大模型之最”

人工智能
能夠一次處理更大文檔、維持更長時間對話、執(zhí)行更復雜檢索且結果出錯更少……在開源大模型界中,可謂真正的商業(yè)/企業(yè)友好。

號稱“世界首個上下文長度達32k的開源可商用大模型”來了。

名字“簡單粗暴”,就叫“長頸鹿”(Giraffe),基于130億規(guī)模的Llama-2打造。

圖片圖片

如作者所言,原始的Llama-2和Llama-1都只有4k上下文,很難真正在企業(yè)領域被商用。

而現(xiàn)在這個是其8倍的“Giraffe”,直接改變這一局面:

能夠一次處理更大文檔、維持更長時間對話、執(zhí)行更復雜檢索且結果出錯更少……在開源大模型界中,可謂真正的商業(yè)/企業(yè)友好。

網友紛紛表示:“太有用了”、“馬上就要試試”。

圖片圖片

所以,長頸鹿是如何從羊駝“進化”而來的?

擴充上下文長度的探索

長頸鹿的作者來自Abacus.AI。

這是一家搞AI數(shù)據(jù)科學平臺的初創(chuàng)企業(yè),成立于2019年,已完成5000萬元C輪融資。

圖片圖片

為了擴展開源模型的上下文長度,他們將目前最突出的已有方法整理在一起,并進行徹底測試確定出最有效的方法。

在此之上,他們也提出了一些新思路,其中一種稱為“截斷(truncation)”,它表現(xiàn)出了不小的潛力。

圖片圖片

具體來看:

首先團隊發(fā)現(xiàn),目前已有的長下文外推方法普遍都是通過修改注意力機制中使用的位置編碼系統(tǒng),指示token和activation在輸入序列中的位置而完成。

包括線性縮放/位置插值、xPos、隨機化位置編碼等等。

在此,他們提出了兩種新方法。

一個叫Power Scaling,主要是對原始的RoPE編碼進行了如下變換:

圖片圖片

這使得基礎的高頻(短距離)元素比低頻(長距離)元素受到的影響更小,讓模型不得不對低頻元素進行不那么復雜的外推,從而讓整體得到提升。

另一個方法叫Truncated Basis(也就是上面所說的“截斷”),主要是對原始RoPE編碼進行了如下變換:

圖片圖片

其中ρ是一個相對較小的固定值,a和b是選定的截止值。

作者在這里的想法是,保留basis的高頻分量,但將低頻分量設置為恒定值(比如0)。

而通過明智地選擇截止值a,模型就可以在微調期間(由于正弦函數(shù)和正弦函數(shù)的周期性)經歷上下文長度中的所有basis值,從而更好地外推到更大的上下文長度。

接下來,便是對以上這些方法進行徹底測試。

在此,作者認為,很多人只用困惑度來衡量模型的長下文能力是遠遠不夠的,因為它的細粒度不夠。

為此,除了困惑度,他們還加了三個新的評估任務(都已公開發(fā)布到HuggingFace之上):

FreeFormQA、AlteredNumericQA和LongChat Lines,其中前兩個是一類,為問答任務,第三個為關鍵值檢索任務。

通過使用這兩種類型的任務,我們能夠強制要求模型更加關注完整的上下文,從而獲得高精度的測試結果。

那么結果如何?

直接上結論:

首先,線性插值是最好的上下文長度外推方法。

其次,所有上下文長度外推方法都隨著長度的增加,在任務準確性上出現(xiàn)了下降。

第三,通過在評估階段使用比微調時更高的比例因子,可以進一步增加上下文長度,但比例因子似乎最多只能提高2倍。

以下是這些方法在三個評估數(shù)據(jù)集上的具體表現(xiàn)(精度為1.0表示性能完美,0.0表示每次評估都是錯誤的):

圖片圖片

△ LongChat Lines

△ AlteredNumericQA和FreeFormQA△ AlteredNumericQA和FreeFormQA

可以看到,除了佐證上面的結論,作者們新提出的Truncated Basis方法表現(xiàn)確實不錯,有一定的前景。

而基于以上研究,團隊也在LLaMA2-13B基礎模型上發(fā)布了長頸鹿大模型,當然,用的是性能最優(yōu)的線性插值法。

根據(jù)上下文長度不同,長勁鹿家族最終一共有三個版本:4k、16k和32k,感興趣的朋友就可以去HuggingFace上下載了。

圖片圖片

其實是并列第一

雖然Abacus.AI號稱長頸鹿是世界首個上下文可達32k的開源LLM,但Together.AI其實更為搶先一步:

他們已在本月初發(fā)布了32k的Llama-2-7B大模型(已有近1萬7千次下載),以及在上周五發(fā)布了llama-2-7b-32k-instruct。

圖片圖片

大家的上下文長度一樣,唯一的大區(qū)別是Together.AI的參數(shù)規(guī)模要小些。

現(xiàn)在,大伙也好奇能不能出一個對比,看看究竟誰更勝一籌。

圖片圖片

論文地址:https://arxiv.org/abs/2308.10882友情鏈接:https://huggingface.co/abacusai/Giraffe-v2-13b-32khttps://huggingface.co/togethercomputer/LLaMA-2-7B-32Khttps://huggingface.co/togethercomputer/Llama-2-7B-32K-Instruct參考鏈接:https://twitter.com/bindureddy/status/1694126931174977906

責任編輯:武曉燕 來源: 量子位
相關推薦

2023-08-25 13:27:00

模型開源

2023-06-28 18:10:27

羊駝家族大模型集體進化

2024-03-25 00:05:00

開源模型AI

2024-01-08 12:47:02

代碼模型Mistral

2024-03-14 08:11:45

模型RoPELlama

2024-06-03 14:24:00

2023-08-15 14:05:27

AI模型

2023-05-22 09:28:30

模型AI

2023-12-03 08:46:20

模型開源

2023-06-30 09:49:23

模型Meta

2025-03-18 08:14:05

2023-10-11 13:21:12

模型數(shù)據(jù)

2023-05-14 14:15:00

GPT-4AI

2023-06-27 13:48:00

清華開源

2017-05-11 14:00:02

Flask請求上下文應用上下文

2023-05-19 10:16:27

AIGPT-4

2023-07-11 10:02:23

2012-12-31 10:01:34

SELinuxSELinux安全

2025-03-17 09:40:00

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 午夜精品久久久 | 久久成人一区 | 中文字幕一区二区三区在线乱码 | 狠狠天天 | 精品在线播放 | 黄a网站| 亚洲精品久久久久久国产精华液 | 午夜精品久久久久久久久久久久 | 国产精品久久久久久久久免费丝袜 | 久久精品久久久 | 欧美日韩亚洲一区 | 亚洲一区视频在线 | 91 在线| 国产2区 | 日韩在线观看网站 | 精品国产乱码久久久久久丨区2区 | 91香蕉嫩草 | 久久草在线视频 | 免费黄色的视频 | 欧洲一区二区在线 | 99久久免费精品国产男女高不卡 | 国产激情自拍视频 | av成年人网站| 久久99视频这里只有精品 | 日本精品一区二区 | 国产福利在线播放麻豆 | 91亚洲免费 | 久久精品 | 国产日产欧产精品精品推荐蛮挑 | 国产一区二区三区四区 | 久久精品国产一区老色匹 | 91色视频在线观看 | 99久久婷婷国产综合精品电影 | 亚洲国产成人久久久 | 久草在线青青草 | 成人免费在线观看 | 综合久久综合久久 | 美女天天干 | 欧美一级黄色免费看 | 亚洲综合成人网 | 日日操夜夜操天天操 |