成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

大語言模型的視覺天賦:GPT也能通過上下文學習解決視覺任務

新聞 人工智能
LLM 的能力還可以發揮到機器學習的更多子領域。

當前,大型語言模型(LLM)已經掀起自然語言處理(NLP)領域的變革浪潮。我們看到 LLM 具備強大的涌現能力,在復雜的語言理解任務、生成任務乃至推理任務上都表現優異。這啟發人們進一步探索 LLM 在機器學習另一子領域 —— 計算機視覺(CV)方面的潛力。

LLM 的一項卓越才能是它們具備上下文學習的能力。上下文學習不會更新 LLM 的任何參數,卻在各種 NLP 任務中卻展現出了令人驚艷的成果。那么,GPT 能否通過上下文學習解決視覺任務呢?

最近,來自谷歌和卡內基梅隆大學(CMU)的研究者聯合發表的一篇論文表明:只要我們能夠將圖像(或其他非語言模態)轉化為 LLM 能夠理解的語言,這似乎是可行的。

圖片圖片

論文地址:https://arxiv.org/abs/2306.17842

這篇論文揭示了 PaLM 或 GPT 在通過上下文學習解決視覺任務方面的能力,并提出了新方法 SPAE(Semantic Pyramid AutoEncoder)。這種新方法使得 LLM 能夠執行圖像生成任務,而無需進行任何參數更新。這也是使用上下文學習使得 LLM 生成圖像內容的首個成功方法。

我們先來看一下通過上下文學習,LLM 在生成圖像內容方面的實驗效果。

例如,在給定上下文中,通過提供 50 張手寫圖像,論文要求 PaLM 2 回答需要生成數字圖像作為輸出的復雜查詢:

圖片圖片

還能在有圖像上下文輸入的情況下生成逼真的現實圖像:

圖片圖片

除了生成圖像,通過上下文學習,PaLM 2 還能進行圖像描述:

圖片

還有與圖像相關問題的視覺問答:

圖片圖片

甚至可以去噪生成視頻:

圖片圖片

方法概述

實際上,將圖像轉化為 LLM 能夠理解的語言,是在視覺 Transformer(ViT)論文中就已經研究過的問題。在 Google 和 CMU 的這篇論文中,他們將其提升到了一個新的層次 —— 使用實際的單詞來表示圖像。

這種方法就像建造一個充滿文字的塔樓,捕捉圖像的語義和細節。這種充滿文字的表示方法讓圖像描述可以輕松生成,并讓 LLM 可以回答與圖像相關的問題,甚至可以重構圖像像素。

圖片

具體來說,該研究提出使用經過訓練的編碼器和 CLIP 模型將圖像轉換為一個 token 空間;然后利用 LLM 生成合適的詞法 token;最后使用訓練有素的解碼器將這些 token 轉換回像素空間。這個巧妙的過程將圖像轉換為 LLM 可以理解的語言,使我們能夠利用 LLM 在視覺任務中的生成能力。

圖片

實驗及結果

該研究將 SPAE 與 SOTA 方法 Frozen 和 LQAE 進行了實驗比較,結果如下表 1 所示。SPAEGPT 在所有任務上性能均優于 LQAE,且僅使用 2% 的 token。

圖片圖片

總的來說,在 mini-ImageNet 基準上的測試表明,SPAE 方法相比之前的 SOTA 方法提升了 25% 的性能。

圖片圖片

為了驗證 SPAE 設計方法的有效性,該研究進行了消融實驗,實驗結果如下表 4 和圖 10 所示:

圖片圖片

圖片圖片

感興趣的讀者可以閱讀論文原文,了解更多研究內容。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2023-06-15 15:45:42

自然語言語言模型

2023-09-16 13:47:47

人工智能數據

2023-03-31 13:37:34

研究

2024-03-14 08:11:45

模型RoPELlama

2023-11-24 17:01:30

模型推理

2024-10-30 15:30:00

智能體視覺模型

2017-05-11 14:00:02

Flask請求上下文應用上下文

2025-02-06 10:21:51

2024-07-16 10:20:44

2024-11-14 13:05:12

2025-03-18 08:14:05

2024-04-10 14:07:00

數據AI

2025-04-23 15:25:27

語言模型Eagle 2.5英偉達

2023-05-22 09:19:19

2024-07-17 16:59:51

AI訓練

2024-04-07 09:00:00

數據模型

2025-02-26 00:16:56

RAGAI服務

2024-09-23 08:20:00

模型訓練

2024-08-21 13:16:30

2023-07-24 12:27:08

論文斯坦福
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 亚洲成人一二三 | 欧美中文字幕一区二区 | 国产高清一区二区三区 | 国产精品久久久久久 | 一区二区三区免费网站 | 黄色av网站在线观看 | 91精品国产综合久久久久久丝袜 | 日韩在线视频一区二区三区 | 一级做a爰片性色毛片16美国 | 国产98色在线 | 日韩 | 色接久久 | 国精产品一品二品国精在线观看 | 欧区一欧区二欧区三免费 | 日韩日韩日韩日韩日韩日韩日韩 | 亚洲国产精品一区二区www | 免费av毛片| 污片在线观看 | 最新国产视频 | 日韩精品在线播放 | 亚洲成人免费av | 97精品国产97久久久久久免费 | 欧美一区二区三区一在线观看 | 亚洲第一网站 | 女朋友的闺蜜3韩国三级 | 亚洲精品99999 | 一区二区三区高清在线观看 | 国产激情偷乱视频一区二区三区 | 成人免费视频网址 | 久久久久久91 | 亚洲成人精品 | 国产一区二区在线视频 | 成人不卡在线 | 亚洲黄色视屏 | 国产在线一区二区三区 | 成人免费视频网站在线观看 | 欧美日韩亚洲一区 | 久久久久国产一区二区三区 | 日韩精品一区二区三区久久 | 国产高清精品在线 | 人人九九精 | 亚洲精品91 |