成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

兩只羊駝掐頭去尾拼一起,屠榜HuggingFace

人工智能 新聞
相關論文剛剛上傳到ArXiv,來自韓國公司Upstage AI,使用了新的大模型擴展方法depth up-scaling(DUS)。

HuggingFace開源大模型排行榜,又被屠榜了。

前排被清一色的SOLAR 10.7B微調版本占據,把幾周之前的各種Mixtral 8x7B微調版本擠了下去。

圖片

SOLAR大模型什么來頭?

相關論文剛剛上傳到ArXiv,來自韓國公司Upstage AI,使用了新的大模型擴展方法depth up-scaling(DUS)

圖片

簡單來說就是兩只7B羊駝掐頭去尾,一只砍掉前8層,一只砍掉后8層。

剩下兩個24層縫合在一起,第一個模型的第24層與第二個模型的第9層拼接,最后變成新的48層10.7B大模型。

圖片

論文聲稱新方法超過傳統擴展方法如MoE,而且可以與沿用基礎大模型完全相同的基礎設施。

不需要門控網絡等附加模塊,針對MoE優化訓練框架了,也不需要自定義CUDA內核來快速推理,可以無縫集成到現有方法中,同時保持高效。

團隊選擇7B規模最強的單體大模型Mistral 7B作為底材,用新方法拼接起來,再超越原版以及MoE版。

同時,經過對齊的Instruct版本也超越對應的MoE Instruct版本。

圖片

將縫合進行到底

為什么是這種拼接方式,論文中介紹來自一種直覺。

從最簡單的擴展方式開始,也就是把32層的基礎大模型重復兩次,變成64層。

這樣做的好處是不存在異質性,所有層都來自基礎大模型,但第32層和第33層(與第1層相同)的接縫處有較大的“層距離”(layer distance)

之前有研究表明,Transformer不同層做不同的事,如越深的層擅長處理越抽象的概念。

團隊認為層距離過大可能妨礙模型有效利用預訓練權重的能力。

一個潛在的解決方案是犧牲中間層,從而減少接縫處的差異,DUS方法就從這里誕生。

根據性能與模型尺寸的權衡,團隊選擇從每個模型中刪除8層,接縫處從32層連第1層,變成了24層連第9層。

簡單拼接后的模型,性能一開始還是會低于原版基礎模型,但經過繼續預訓練可以迅速恢復。

在指令微調階段,除了使用開源數據集,還制作了數學強化數據集,對齊階段使用DPO。

最后一步,把使用不同數據集訓練的模型版本加權平均,也是把縫合進行到底了。

圖片

有網友質疑測試數據泄露的可能性。

圖片

團隊也考慮到這一點,在論文附錄中專門報告了數據污染測試結果,顯示出低水平。

圖片

最后,SOLAR 10.7B基礎模型和微調模型都以Apache 2.0協議開源。

試用過的網友反饋,從JSON格式數據中提取數據表現不錯。

圖片

論文地址:https://arxiv.org/abs/2312.15166

責任編輯:張燕妮 來源: 量子位
相關推薦

2022-09-27 16:03:51

羊了個羊鴻蒙

2016-03-25 16:02:49

中國企業新聞網

2023-05-22 09:28:30

模型AI

2013-09-03 13:14:15

諾基亞Google

2022-02-17 20:18:27

JS鴻蒙操作系統

2020-11-04 09:43:09

helloworld

2010-04-30 14:33:56

HTML 5FlashH.264

2011-09-21 11:28:03

HTCWindows 8平板電腦

2009-04-14 15:30:25

2022-12-02 14:20:09

Tetris鴻蒙

2022-11-29 16:35:02

Tetris鴻蒙

2023-03-30 09:32:27

2022-11-14 17:01:34

游戲開發畫布功能

2014-10-21 15:07:04

2015-04-15 10:29:38

Linux 4.0

2017-03-03 18:02:32

華為

2015-08-19 09:53:17

技術電商創業

2022-03-31 18:59:43

數據庫InnoDBMySQL

2023-08-10 08:28:46

網絡編程通信

2021-08-27 07:06:09

DubboDocker技術
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 欧美激情一区二区 | 丝袜美腿av | 欧美成人第一页 | 韩日一区 | 热久久国产 | av一区二区三区四区 | 日韩三级电影在线看 | 日本一区二区三区免费观看 | 中国大陆高清aⅴ毛片 | 涩涩视频大全 | 91伦理片 | 超碰在线人人 | 精品日韩在线 | 欧美中文字幕一区 | 欧美中文字幕 | 欧美日韩一区二区在线观看 | 久久久综合久久 | 日韩成人精品一区 | 成人依人 | 亚洲日本中文 | 成人亚洲性情网站www在线观看 | 日韩免费电影 | 99r在线| 国产一区二区三区四区在线观看 | 亚洲精品一 | 成人精品区 | 国产成人精品一区二区三区 | av第一页| 欧美一区二不卡视频 | 精品一二区 | 久久艹免费视频 | 亚洲成人蜜桃 | 亚洲欧美中文字幕在线观看 | 超碰在线影院 | 最近日韩中文字幕 | 亚洲欧美日韩在线 | 国产91在线 | 欧美 | 日韩小视频在线 | 天天干狠狠操 | 亚洲va国产日韩欧美精品色婷婷 | 91亚洲精品国偷拍自产在线观看 |