成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

DeepSeek-R1的風吹到了多模態,Visual-RFT發布,視覺任務性能飆升20%

發布于 2025-3-14 00:29
瀏覽
0收藏

盡管DeepSeek-R1風格的模型在語言模型中已經取得了成功,但其在多模態領域的應用仍然有待深入探索。

上交大等提出并開源 Visual-RFT,將 RFT 擴展到視覺任務,通過設計針對不同視覺任務的可驗證獎勵函數,提升 LVLMs 在視覺感知和推理任務中的性能。

視覺強化微調(Visual-RFT)的概述。與(a)數據驅動的視覺指令微調相比,(b)視覺強化微調(Visual-RFT)在有限數據下更具數據效率。(c)成功地將RFT應用于一系列多模態任務,并在底部展示了模型的推理過程示例。

DeepSeek-R1的風吹到了多模態,Visual-RFT發布,視覺任務性能飆升20%-AI.x社區

Visual-RFT 的核心在于利用 LVLMs 生成多個包含推理過程和最終答案的響應,并通過可驗證獎勵函數對模型進行策略優化。具體步驟如下:

  • 任務輸入:模型接收圖像和問題作為輸入。
  • 響應生成:LVLMs 生成多個可能的響應,每個響應包含推理過程和最終答案。
  • 獎勵計算:針對不同任務(如目標檢測、分類等),設計特定的可驗證獎勵函數,如 IoU 獎勵(用于目標檢測)和分類準確率獎勵。
  • 策略優化:使用 GRPO 等策略優化算法,根據獎勵函數更新模型參數。

可驗證獎勵函數

  • IoU 獎勵(目標檢測):通過計算預測邊界框與真實邊界框的交并比(IoU)來評估檢測任務的獎勵。
  • 分類準確率獎勵(分類任務):通過比較模型輸出類別與真實類別來評估獎勵。

視覺強化微調(Visual-RFT)的框架。給定問題和視覺圖像輸入后,策略模型會生成多個包含推理步驟的響應。然后,使用可驗證獎勵(如IoU獎勵和分類獎勵)與策略梯度優化算法來更新策略模型。

DeepSeek-R1的風吹到了多模態,Visual-RFT發布,視覺任務性能飆升20%-AI.x社區

在細粒度圖像分類、少樣本目標檢測、推理定位以及開放詞匯目標檢測基準測試中的實驗結果表明,與監督微調(SFT)相比,Visual-RFT具有競爭力的性能和先進的泛化能力:

  • 在大約100個樣本的單樣本細粒度圖像分類中,Visual-RFT的準確率比基線提高了24.3%。
  • 在少樣本目標檢測中,Visual-RFT在COCO的兩樣本設置中超過了基線21.9,在LVIS上超過了15.4。

Visual-RFT代表了對LVLMs微調范式的一種轉變,提供了一種數據高效、由獎勵驅動的方法,增強了對特定領域任務的推理能力和適應性。

DeepSeek-R1的風吹到了多模態,Visual-RFT發布,視覺任務性能飆升20%-AI.x社區

DeepSeek-R1的風吹到了多模態,Visual-RFT發布,視覺任務性能飆升20%-AI.x社區

DeepSeek-R1的風吹到了多模態,Visual-RFT發布,視覺任務性能飆升20%-AI.x社區

細粒度圖像分類的定性結果。推理過程顯著提升了大型視覺語言模型(LVLMs)的推理能力,從而提高了圖像分類的性能。

DeepSeek-R1的風吹到了多模態,Visual-RFT發布,視覺任務性能飆升20%-AI.x社區

在LISA [11] 數據集上的推理定位任務的定性結果。通過Visual-RFT,推理過程顯著提升了模型的推理定位能力。

DeepSeek-R1的風吹到了多模態,Visual-RFT發布,視覺任務性能飆升20%-AI.x社區

https://arxiv.org/pdf/2503.01785
Visual-RFT: Visual Reinforcement Fine-Tuning
https://github.com/Liuziyu77/Visual-RFT

本文轉載自??PaperAgent??

收藏
回復
舉報
回復
相關推薦
主站蜘蛛池模板: 日日干日日操 | 99精品国产一区二区三区 | 欧美精品一区二区三区在线 | 日韩av一区二区在线观看 | 免费在线一区二区三区 | 欧美视频1区| 午夜精品久久久久久久久久久久久 | a久久久久久 | 欧美一级片在线 | 在线播放亚洲 | 国产精品一区二区欧美 | www国产成人免费观看视频,深夜成人网 | 中文字幕亚洲一区二区va在线 | 国产精品美女久久久久久免费 | 欧美日韩在线播放 | 丁香五月网久久综合 | 午夜在线免费观看视频 | 黄色网址在线播放 | 久久久久久免费看 | 久久99精品久久久久久噜噜 | 新超碰97 | 欧美日韩在线播放 | 久在线视频 | 国产在线二区 | 精品免费在线 | 影音先锋成人资源 | 国产精品成人久久久久 | 国产精品美女久久久久久免费 | 欧美日韩成人在线观看 | 91久久国产综合久久 | 久久久久久久综合 | 免费午夜视频 | 天天色影视综合 | 日韩精品一区二区三区中文在线 | 日韩欧美在线视频一区 | 欧洲精品视频一区 | 国产欧美精品一区二区色综合朱莉 | 中文字幕第九页 | 亚洲久久 | 免费一二区| 在线不卡视频 |