成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

阿里深夜開(kāi)源Qwen2.5-VL新版本,視覺(jué)推理通殺,32B比72B更聰明

人工智能 新聞
32B 版本的出現(xiàn),解決了「72B 對(duì) VLM 來(lái)說(shuō)太大」和「7B 不夠強(qiáng)大」的問(wèn)題。

就在 DeepSeek V3「小版本更新」后的幾個(gè)小時(shí),阿里通義千問(wèn)團(tuán)隊(duì)也開(kāi)源了新模型。

擇日不如撞日,Qwen2.5-VL-32B-Instruct 就這么來(lái)了。

截屏2025-03-25 09.36.25.png

相比此前的 Qwen2.5-VL 系列模型,32B 模型有如下改進(jìn):

  • 回復(fù)更符合人類(lèi)主觀偏好:調(diào)整了輸出風(fēng)格,使回答更加詳細(xì)、格式更規(guī)范,并更符合人類(lèi)偏好。
  • 數(shù)學(xué)推理能力:復(fù)雜數(shù)學(xué)問(wèn)題求解的準(zhǔn)確性顯著提升。
  • 圖像細(xì)粒度理解與推理:在圖像解析、內(nèi)容識(shí)別以及視覺(jué)邏輯推導(dǎo)等任務(wù)中表現(xiàn)出更強(qiáng)的準(zhǔn)確性和細(xì)粒度分析能力。

對(duì)于所有用戶來(lái)說(shuō),在 Qwen Chat 上直接選中 Qwen2.5-VL-32B,即可體驗(yàn):https://chat.qwen.ai/

截屏2025-03-25 10.02.24.png

32B 版本的出現(xiàn),解決了「72B 對(duì) VLM 來(lái)說(shuō)太大」和「7B 不夠強(qiáng)大」的問(wèn)題。如這位網(wǎng)友所說(shuō),32B 可能是多模態(tài) AI Agent 部署實(shí)踐中的最佳選擇:

截屏2025-03-25 09.56.44.png

不過(guò)團(tuán)隊(duì)也介紹了,Qwen2.5-VL-32B 在強(qiáng)化學(xué)習(xí)框架下優(yōu)化了主觀體驗(yàn)和數(shù)學(xué)推理能力,但主要還是基于「快速思考」模式。

下一步,通義千問(wèn)團(tuán)隊(duì)將聚焦于長(zhǎng)且有效的推理過(guò)程,以突破視覺(jué)模型在處理高度復(fù)雜、多步驟視覺(jué)推理任務(wù)中的邊界。

32B 可以比 72B 更聰明

先來(lái)看看性能測(cè)試結(jié)果。

與近期的 Mistral-Small-3.1-24B、Gemma-3-27B-IT 等模型相比,Qwen2.5-VL-32B-Instruct 展現(xiàn)出了明顯的優(yōu)勢(shì),甚至超越了更大規(guī)模的 72B 模型。

image.png

如上圖所示,在 MMMU、MMMU-Pro 和 MathVista 等多模態(tài)任務(wù)中,Qwen2.5-VL-32B-Instruct 均表現(xiàn)突出。

特別是在注重主觀用戶體驗(yàn)評(píng)估的 MM-MT-Bench 基準(zhǔn)測(cè)試中,32B 模型相較于前代 Qwen2-VL-72B-Instruct 實(shí)現(xiàn)了顯著進(jìn)步。

視覺(jué)能力的進(jìn)步,已經(jīng)讓用戶們感受到了震撼:

截屏2025-03-25 10.11.30.png

除了在視覺(jué)能力上優(yōu)秀,Qwen2.5-VL-32B-Instruct 在純文本能力上也達(dá)到了同規(guī)模的最優(yōu)表現(xiàn)。

image.png

實(shí)例展示

或許很多人還好奇,32B 版本的升級(jí)怎么體現(xiàn)呢?

關(guān)于「回復(fù)更符合人類(lèi)主觀偏好」、「數(shù)學(xué)推理能力」、「圖像細(xì)粒度理解與推理」這三個(gè)維度,我們通過(guò)幾個(gè)官方 Demo 來(lái)體會(huì)一番。

第一個(gè)問(wèn)題,是關(guān)于「細(xì)粒度圖像理解與推理」:我開(kāi)著一輛卡車(chē)在這條路上行駛,現(xiàn)在是 12 點(diǎn),我能在 13 點(diǎn)之前到達(dá) 110 公里外的地方嗎?

截屏2025-03-25 10.23.33.png

顯然,從人類(lèi)的角度去快速判斷,在限速 100 的前提下,卡車(chē)無(wú)法在 1 小時(shí)內(nèi)抵達(dá) 110 公里之外的地方。

Qwen2.5-VL-32B-Instruct 給出的答案也是「否」,但分析過(guò)程更加嚴(yán)謹(jǐn),敘述方式也是娓娓道來(lái),我們可以做個(gè)參考:

截屏2025-03-25 10.24.19.png

第二個(gè)問(wèn)題是「數(shù)學(xué)推理」:如圖,直線 AB、CD 交于點(diǎn) O,OD 平分∠AOE,∠BOC=50.0,則∠EOB=()

截屏2025-03-25 10.28.44.png

答案是「80」:

截屏2025-03-25 10.32.48.png

截屏2025-03-25 10.32.59.png

第三個(gè)題目的數(shù)學(xué)推理顯然更上難度了:

截屏2025-03-25 10.35.35.png

模型給出的答案特別清晰,解題思路拆解得很詳細(xì):

截屏2025-03-25 10.36.14.png

截屏2025-03-25 10.36.33.png

截屏2025-03-25 10.36.42.png

在下面這個(gè)圖片內(nèi)容識(shí)別任務(wù)中,模型的分析過(guò)程也非常細(xì)致嚴(yán)謹(jǐn):

截屏2025-03-25 10.18.56.png

截屏2025-03-25 10.19.14.png

截屏2025-03-25 10.19.31.png

關(guān)于 Qwen2.5-VL-32B-Instruct 的更多信息,可參考官方博客。

責(zé)任編輯:張燕妮 來(lái)源: 機(jī)器之心
相關(guān)推薦

2025-03-25 13:31:45

2024-12-25 20:13:35

2024-09-19 14:00:00

模型開(kāi)源代碼

2025-03-25 09:24:05

2024-12-25 09:30:00

2025-03-27 09:40:59

2024-04-10 08:15:17

模型語(yǔ)言模型GPT

2024-04-08 08:05:00

大模型人工智能開(kāi)源

2013-05-16 10:29:10

移動(dòng)應(yīng)用口袋購(gòu)物

2024-08-30 15:19:22

2025-06-17 09:07:24

2025-06-18 02:30:00

推理能力強(qiáng)化學(xué)習(xí)大語(yǔ)言模型

2025-01-13 10:55:53

2025-02-24 08:10:00

2025-03-10 07:00:00

阿里開(kāi)源QwQ-32B

2025-03-07 08:30:00

2025-03-06 08:11:25

2025-04-27 09:19:00

強(qiáng)化學(xué)習(xí)模型AI
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

主站蜘蛛池模板: 午夜www| 欧美1区 | 日本成人综合 | 在线观看www视频 | 特级做a爱片免费69 精品国产鲁一鲁一区二区张丽 | 中文字幕在线一区 | 一区二区三区回区在观看免费视频 | 国产精品一区二区免费 | 亚洲成人www| 久久久久国 | 久久国品片 | 成人a免费 | 久久精品一级 | 日日综合 | 中文字幕第一页在线 | 久久精品国产亚洲a | 九色91视频| 国产成年人小视频 | 成人免费淫片aa视频免费 | 国产精品一二区 | 在线一区视频 | 99精品久久久国产一区二区三 | 人人性人人性碰国产 | 毛片网站在线观看视频 | 欧美精品在欧美一区二区少妇 | 国产一区二区三区免费观看在线 | 久久久国产一区 | 成人午夜在线 | 国产高清精品在线 | 精品综合久久久 | 日韩免费电影 | 黄色一级大片在线免费看产 | 亚洲精品乱码久久久久久按摩观 | 成人精品一区亚洲午夜久久久 | 久久国产精品视频 | 伊人免费网 | 精品久久久久久久久久 | 日韩欧美国产综合 | 视频一区在线观看 | 狠狠色综合久久婷婷 | 黄色综合 |