成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

GitHub熱榜第一:百萬token上下文,還能生成視頻,UC伯克利出品

人工智能
LWM支持處理多模態信息,能在100萬token中準確找到目標文本,還能一口氣看完1小時的視頻。網友看了不禁表示,這種大海撈針般的測試,LWM能完成的如此出色,而且還開源,實在是令人印象深刻。

今日GitHub熱榜榜首,是最新的開源世界模型。

上下文窗口長度達到了100萬token,持平了谷歌同時推出的王炸Gemini 1.5,伯克利出品。

圖片

強大的模型,命名也是簡單粗暴——沒有任何額外點綴,直接就叫LargeWorldModel(LWM)。

LWM支持處理多模態信息,能在100萬token中準確找到目標文本,還能一口氣看完1小時的視頻。

網友看了不禁表示,這種大海撈針般的測試,LWM能完成的如此出色,而且還開源,實在是令人印象深刻。

圖片

那么,LWM的表現到底有多強呢?

百萬上下文窗口,可看1小時視頻

在測試過程中,研究人員用多段一個多小時的視頻檢驗了LWM的長序列理解能力,這些視頻由YouTube上不同的視頻片段拼接而成。

他們將這些視頻輸入LWM,然后針對其中的細節進行提問,涉及的片段位于整個視頻的不同位置,同時研究者還將LWM與GPT-4V等模型做了對比。

結果GPT-4V是一問一個不吱聲,閉源強者Gemini Pro和開源強者Video-LLaVA都給出了錯誤的答案,只有LWM回答對了。

圖片

在另一段視頻的測試中,其他模型都說找不到有關信息,只有LWM找到了答案,而且完全正確。

圖片

不僅是理解細節,LWM也能把握視頻的整體內容,做出歸納總結。

圖片

在理解的基礎之上,LWM也可以結合自有知識進行推理,比如分析視頻中不符合常理的地方。

圖片

Benchmark測試結果顯示,LWM在MSVD-QA等三個數據集上的評分僅次于Video-LLaVA。

圖片

LWM不僅能理解長短視頻,在超長文本任務上的表現同樣優異。

在1百萬token窗口的“插針”檢索測試中,LWM取得了單針檢索全綠的成績。

圖片

多針檢索時,表現也同樣優異:

圖片

語言任務數據集的測試結果表明,LWM在32k到1M的窗口長度上表現不輸甚至超過只有4k窗口的Llama2-7B。

圖片

除了多模態信息理解,LWM還支持圖像和視頻的生成,至于效果,還是直接上圖感受一下吧。

圖片

那么,研究人員又是怎樣訓練出這樣一款世界模型的呢?

循序漸進,分而治之

LMW的訓練過程,大致可分為兩個階段。

第一階段的目標是建立一個能夠處理長文本序列的語言模型,以理解復雜的文檔和長文本內容。

為實現這一目的,研究人員采取了漸進式的訓練方式,使用總計33B Token、由圖書內容組成的Books3數據集,從32k開始訓練,逐步將窗口擴增至1M。

圖片

而為了增強LWM的長文本處理能力,開發者應用了RingAttention機制。

RingAttention是該團隊去年提出的一種窗口擴增方式,入選了ICLR 2024。

它運用了“分而治之”的思想,將長文本分成多個塊,用多個計算設備做序列并行處理,然后再進行疊加,理論上允許模型擴展到無限長的上下文。

圖片

在LWM中,RingAttention還與FlashAttention結合使用,并通過Pallas框架進行優化,從而提高性能。

在文本能力的基礎上,研究人員又用模型生成了部分QA數據,針對LWM的對話能力進行了優化。

圖片

第二階段則是將視覺信息(如圖像和視頻)整合到模型中,以提高對多模態數據的理解能力。

在此階段,研究人員對LWM-Text模型進行了架構修改,以支持視覺輸入。

他們使用VQGAN將圖像和視頻幀轉換為token,并與文本結合進行訓練。

圖片

這一階段同樣采用循序漸進的訓練方法, LWM首先在文本-圖像數據集上進行訓練,然后擴展到文本-視頻數據集,且視頻幀數逐步增多。

圖片

在訓練過程中,模型還會隨機交換文本和視覺數據的順序,以學習文本-圖像生成、圖像理解、文本-視頻生成和視頻理解等多種任務。

性能方面,研究人員在TPUv4-1024(大致相對于450塊A100)上訓練,批大小為8M、全精度(float32)的條件下,花費的時間如下表所示,其中1M窗口版本用了58個小時。

圖片

目前,LWM的代碼、模型都已開源,其中多模態模型為Jax版本,純文本模型有Jax和PyTorch兩個版本,感興趣的話可以到GitHub頁面中了解詳情。

論文地址:https://arxiv.org/abs/2402.08268。

GitHub:https://github.com/LargeWorldModel/LWM。

責任編輯:姜華 來源: 量子位
相關推薦

2024-04-07 00:45:00

開源模型

2023-07-01 13:27:55

2025-05-06 15:31:55

智能模型AI

2023-05-04 14:55:02

模型AI

2023-08-14 08:04:13

2023-07-18 15:02:50

論文AI

2023-05-16 13:32:23

模型排行

2025-01-22 15:21:00

2024-02-20 13:31:46

模型數據

2024-03-25 08:30:00

AI數據

2024-03-04 08:15:00

2023-10-18 13:30:00

AI模型

2023-04-07 09:28:31

模型訓練

2025-04-18 08:42:52

模型推理AI

2023-04-04 13:17:00

GPUCMU開源

2023-11-14 07:47:42

IGN擴散模型

2023-12-16 09:49:18

2023-08-05 13:45:46

模型AI

2024-05-30 14:23:00

2023-05-31 16:15:51

模型圖像
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 久久久噜噜噜www成人网 | 日韩欧美中文字幕在线视频 | 色婷婷久久久亚洲一区二区三区 | 免费观看一级特黄欧美大片 | 91精品免费 | 国产精品久久久久久久岛一牛影视 | 精品亚洲第一 | 国产精品久久久一区二区三区 | 欧美一级久久 | 日韩欧美一区二区三区在线播放 | 亚洲视频一区二区三区 | 亚洲国产区 | 亚洲国产精品人人爽夜夜爽 | 新91视频网| 日韩a级片| 在线国产一区二区 | v亚洲 | 亚洲网站观看 | 又黑又粗又长的欧美一区 | 成人av网页 | 国产我和子的乱视频网站 | 精品久久久久久久人人人人传媒 | 久久久国产网站 | 天天干天天爱天天 | 日韩精品成人 | 国产成视频在线观看 | 嫩草视频在线 | 久久久精品| 欧美一区二区三区一在线观看 | 中文字幕亚洲视频 | 爽爽免费视频 | 欧美日韩亚洲国产 | 中文字幕在线观看 | 日韩在线电影 | 少妇午夜一级艳片欧美精品 | 国产精品中文字幕在线 | 久久33| 国产精品毛片一区二区在线看 | 日韩精品一区二 | 久久久久国产 | 日韩午夜影院 |