成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

<dfn id="owysy"></dfn>

<input id="owysy"></input>

<menu id="owysy"><acronym id="owysy"></acronym></menu>

<sup id="owysy"></sup>

鴻蒙開發者社區

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發者社區

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發者社區訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業版APP

鴻蒙開發者社區視頻號

51CTO軟考題庫

AI.x社區

登錄/注冊
51CTO

中國優質的IT技術網站

51CTO博客

專業IT技術創作平臺

51CTO學堂

IT職業在線教育平臺

Vision-R1：多模態領域的DeepSeek R1-Zero，7B參數比肩OpenAI O1

發布于 2025-3-13 08:06

瀏覽

0收藏

DeepSeek在領域內獲得廣泛關注的核心在于R1-Zero僅通過強化學習（RL）便成功實現了推理能力的涌現，即發現Aha moment。那么，在多模態領域，是否也能獲得借鑒R1-Zero的思路呢？

今天介紹的Vision-R1就是這一方面的探索的代表，其目的就是研究如何有效利用 RL 來增強多模態大型語言模型（MLLM）的推理能力。然而，研究團隊發現，由于缺乏大規模、高質量的多模態推理數據，直接應用 RL 訓練 MLLM 在激發其深層推理能力（如提問和反思）方面面臨巨大挑戰。

Vision-R1：多模態領域的DeepSeek R1-Zero，7B參數比肩OpenAI O1-AI.x社區

為解決這一難題，Vision-R1 項目創新性地提出了一個推理型 MLLM，并采取了由冷啟動初始化和 RL 訓練 組成的兩階段策略。項目首先著力構建高質量、大規模且無需人工標注的多模態 Chain-of-Thought (CoT) 數據集——Vision-R1-cold 數據集。該數據集規模達 20 萬條，巧妙地利用現有的 MLLM 和 DeepSeek-R1，通過模態橋接和數據過濾等技術，將視覺信息轉化為文本信息，并融入 DeepSeek-R1 生成的高質量 CoT 推理過程，為 Vision-R1 提供了至關重要的冷啟動知識。

Vision-R1：多模態領域的DeepSeek R1-Zero，7B參數比肩OpenAI O1-AI.x社區

數據集例子

Vision-R1：多模態領域的DeepSeek R1-Zero，7B參數比肩OpenAI O1-AI.x社區

冷啟動初始化數據準備

Vision-R1：多模態領域的DeepSeek R1-Zero，7B參數比肩OpenAI O1-AI.x社區

RL訓練

為緩解冷啟動后模型易出現的“過度思考優化問題”，Vision-R1 進一步創新性地提出了漸進式思維抑制訓練 (PTST) 策略。PTST 結合群體相對策略優化 (GRPO) 算法和硬格式化結果獎勵函數 (HFRRF)，在 1 萬條多模態數學數據集上進行 RL 訓練，逐步精煉模型學習正確且復雜的推理過程的能力。PTST 策略在訓練初期抑制模型推理長度，引導模型關注正確的推理路徑，并隨著訓練深入，逐步放寬長度限制，最終使 Vision-R1 能夠自主掌握更高級的推理技巧。

Vision-R1：多模態領域的DeepSeek R1-Zero，7B參數比肩OpenAI O1-AI.x社區

從實驗結果上看，在多個多模態數學推理基準測試中，Vision-R1 模型較之于其基礎模型Qwen-2.5-VL-7B 平均取得了 6% 的性能提升。尤其在廣泛使用的 MathVista 基準測試中，僅使用 70 億參數的 Vision-R1-7B 模型，其準確率便達到了 73.5%，僅比領先的推理模型 OpenAI O1 低 0.4%，大幅超越開源推理MLLM LLaVA-Cot-11B近9%。這充分展現了 Vision-R1 在多模態推理任務上的強大實力。

Vision-R1的成功說明采用DeepSeek R1的思路是普遍有效的，這對于其它研究者來講給予了非常大的示范意義，如何更好的使用RL激發大模型的潛力將成為重點的研究方向。

github：https://github.com/Osilly/Vision-R1

論文：https://arxiv.org/abs/2503.06749

本文轉載自 ??AI工程化??，作者： ully

標簽

贊

收藏

回復

舉報

回復

相關推薦

解密o1推理過程！DeepSeek-R1-Lite預覽版上線

kede96 ? 3168瀏覽 ? 0回復
阿里發布類o1模型QWQ，可自我反思糾錯，實測數學推理遠超o1、DS-R1，人人免費

51CTO技術棧 ? 3051瀏覽 ? 0回復
DeepSeek R1橫空出世，超越OpenAI o1，教你用Ollama跑起來

小虎哦哦 ? 1.5w瀏覽 ? 0回復
DeepSeek-R1 + RooCline：極佳的強化學習AI編碼代理！對標o1、蒸餾小模型本地部署

老蛀蟲 ? 3879瀏覽 ? 0回復
DeepSeek-AI 發布 DeepSeek-R1-Zero 和 DeepSeek-R1

Halo咯咯 ? 4143瀏覽 ? 0回復
OpenAI o3-mini 干翻了 DeepSeek R1？

PyTorch研習社 ? 2318瀏覽 ? 0回復
DeepSeek R1 Vs OpenAI o1！全球頂級推理模型訓練技術對比大解密！

51CTO技術棧 ? 6103瀏覽 ? 0回復
Unsloth：僅需7GB顯存就能訓練自己的DeepSeek-R1！

PyTorch研習社 ? 3877瀏覽 ? 0回復
7G顯存，訓練自己的 DeepSeek-R1：GRPO 資源下降80%

鴻煊的學習筆記 ? 3221瀏覽 ? 0回復
DeepSeek-R1-Zero激發了推理Scaling Law

ceesoft ? 2392瀏覽 ? 0回復
OpenAI揭示o3的推理過程，以彌合與DeepSeek-R1的差距

51CTO內容精選 ? 2122瀏覽 ? 0回復
大模型對決：DeepSeek R1與o3-mini

丟翅膀的魚 ? 2551瀏覽 ? 0回復
AI領域的“新王”誕生! 馬斯克發布Grok 3，趕超OpenAI o1和Deepseek R1！

AI博物院 ? 2074瀏覽 ? 0回復
QwQ-32B 大戰 DeepSeek-R1：小參數量模型能否逆襲？

Halo咯咯 ? 3312瀏覽 ? 0回復
DeepSeek-R1的方法遷移到多模態大模型-開源Vision-R1實現方法思路

大模型自然語言處理 ? 2416瀏覽 ? 0回復
DeepSeek R1 & R2 技術原理

ceesoft ? 3719瀏覽 ? 0回復
全面復現DeepSeek-R1-Zero 數學、代碼能力，訓練步數僅需R1-Zero 1/10

快手技術 ? 1043瀏覽 ? 0回復
DianJin-R1：金融領域推理增強大模型，全面超越DeepSeek-R1

靈度智能 ? 1196瀏覽 ? 0回復
Qwen3力壓DeepSeek-R1和OpenAI o1，登頂開源王座！

算家計算 ? 1556瀏覽 ? 0回復

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

最近發布

思維外包化！AI正在“廢掉”我們的大腦 2天前發布
上下文工程的崛起：提示工程已是過去式 2天前發布

熱門推薦

AI Agents開源工具棧全解析~ 1回復

從原理到調參，小白也能讀懂的大模型微調LoRA，不懂線性代數也沒問題 0回復

Deepseek R1 0528實測：性能直逼頂尖，普通電腦本地運行全攻略 0回復

本命周！MiniMax M1有多猛？網友：僅用40k思考預算就干翻Gemini，實測：真·超DS！ 1回復

DeepSeek 新模型 R1-0528 悄悄開源，與o3 相當，實測來了 0回復

上一篇： OpenAI 發布GPT-4.5：更大規模、更知識淵博的模型，預訓練的巔峰之作，COT升級為COD

下一篇： Qwen2.5-VL-32B 更小更聰明！與grok、gemini同臺打造“治愈老奶奶”，誰更強？

社區精華內容

目錄

主站蜘蛛池模板：巨大荫蒂视频欧美另类大 | 1000部精品久久久久久久久 | 偷拍亚洲色图 | 免费观看一级特黄欧美大片 | www.97国产 | av黄色在线观看 | 五月婷婷导航 | 97国产精品视频人人做人人爱 | 日韩一级精品视频在线观看 | 亚洲国产精品一区二区久久 | 精品久久久久久亚洲国产800 | 中文字幕欧美日韩 | 亚洲欧美视频一区 | 日韩精品在线一区 | 久久久久国产一区二区 | 国产一区二区在线观看视频 | 日韩欧美国产一区二区三区 | 亚洲欧美一区二区三区在线 | 日韩国产精品一区二区三区 | 91精品国产91久久久久久吃药 | 国产精品亚洲成在人线 | 亚洲精品视频久久 | 国产第一区二区 | 久久久久久国产精品免费免费狐狸 | 成人午夜免费福利视频 | 孰女乱色一区二区三区 | 一区二区三区视频在线 | 欧美精品久久 | 天天澡天天狠天天天做 | 色妞av| 亚洲精品在线看 | 91精品国产91综合久久蜜臀 | 亚洲欧美日韩一区二区 | 伊人性伊人情综合网 | 亚洲欧美aⅴ| 91精品国产91久久综合桃花 | 日韩高清国产一区在线 | 久久久精品亚洲 | 久久久久国产一区二区三区不卡 | 国产一区久久 | 亚洲精品乱码久久久久久蜜桃91 |

<sup id="y6kio"></sup><rt id="y6kio"><noframes id="y6kio"></noframes></rt>

<menu id="y6kio"></menu>

<sup id="y6kio"><strong id="y6kio"></strong></sup>

<menu id="y6kio"><pre id="y6kio"></pre></menu>