成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Qwen2-VL (2B、7B、72B):迄今為止最好的開源視覺模型!!(擊敗 Claude 和 GPT-4o)

發布于 2024-11-21 14:29
瀏覽
0收藏

阿里Qwen團隊推出了一些?很棒的New Vision語言模型,第一個模型是Qwen 2 VL 2B,然后是8B,然后是72b。

在這三個模型中,只有2B和8B模型目前是開源的,而72b模型尚未開源,這有點令人失望,但我認為這沒關系,因為我們這些凡人無論如何都無法運行它,

Qwen2-VL (2B、7B、72B):迄今為止最好的開源視覺模型!!(擊敗 Claude 和 GPT-4o)-AI.x社區

72b模型可以通過API獲得:???https://dashscope.console.aliyun.com/???

Qwen2-VL (2B、7B、72B):迄今為止最好的開源視覺模型!!(擊敗 Claude 和 GPT-4o)-AI.x社區

我給了一個這樣的圖片:

Qwen2-VL (2B、7B、72B):迄今為止最好的開源視覺模型!!(擊敗 Claude 和 GPT-4o)-AI.x社區

這是他的結果

Qwen2-VL (2B、7B、72B):迄今為止最好的開源視覺模型!!(擊敗 Claude 和 GPT-4o)-AI.x社區

Qwen2-VL-72B:這是一張展示圖像轉換前后的對比圖。圖片的左上角有“Ideogram”和“IMAGE TO IMAGE”的字樣,表示這是一個圖像轉換的示例。左邊的圖像是“BEFORE”(轉換前),右邊的圖像是“AFTER”(轉換后)。左邊的圖像是一棵裝飾有彩色球和星星的圣誕樹,右邊的圖像則是一棵更加鮮艷和詳細的圣誕樹,周圍有多個禮物盒和糖果手杖。整體上,這張圖片展示了圖像轉換技術的效果。

它識別了原來圖片的元素,比如準確的文字識別、圣誕樹上的飾品,而且他知道左邊樹是一個裝飾很多東西的圣誕樹,而右邊他特地說了這是一個轉化的過程,把它變成更加花枝招展的圣誕樹。

而實際上這張圖片就是表達這種意思,就是我前面寫 ldeogram AI 用到的封面圖:

??升級!!全新ideogram 2.0!營銷海報、網頁設計生成神器(擊敗Midjourney、Flux)??

認識納西妲 ?

Qwen2-VL (2B、7B、72B):迄今為止最好的開源視覺模型!!(擊敗 Claude 和 GPT-4o)-AI.x社區

他們說 Qwen 2vl

他們說它在視覺理解基準測試中取得了最先進的性能,可以理解超過 20 分鐘的視頻,可用于高質量的基于視頻的問答對話內容創建等,它還具有多語言支持,這非常好。

Qwen2-VL (2B、7B、72B):迄今為止最好的開源視覺模型!!(擊敗 Claude 和 GPT-4o)-AI.x社區

他們還分享了基準測試:

Qwen2-VL (2B、7B、72B):迄今為止最好的開源視覺模型!!(擊敗 Claude 和 GPT-4o)-AI.x社區

72B 規模的模型在大部分的指標上都達到了最優,甚至超過了 GPT-4o 和 Claude3.5-Sonnet 等閉源模型,僅在對綜合的大學題目上和 GPT-4o 還有差距,但 ... 開源視覺領域Top1。

然后 7B 模型也在許多基準測試中擊敗了 Gpt-4o-mini 和其他 LLMs,這也真的很不錯,

Qwen2-VL (2B、7B、72B):迄今為止最好的開源視覺模型!!(擊敗 Claude 和 GPT-4o)-AI.x社區

除此之外,2B 模型也相當不錯,并且擊敗了 Min-CPM 和 Intern-VL2,

Qwen2-VL (2B、7B、72B):迄今為止最好的開源視覺模型!!(擊敗 Claude 和 GPT-4o)-AI.x社區

這也相當不錯,所有這些模型都可以對視頻進行總結,

他們還分享了一些測試問題

Qwen2-VL (2B、7B、72B):迄今為止最好的開源視覺模型!!(擊敗 Claude 和 GPT-4o)-AI.x社區


2B 和 7B 模型屬于 Apache 2 許可證,這意味著它們是完全開源的,可以免費用于個人和商業用途。

該模型的架構不同,并且尚不支持 Llama.cpp 架構,因此它還不能在 llama 上使用,我希望它能盡快添加。

72b 模型可以在 hugging face 空間上使用:???https://huggingface.co/spaces/Qwen/Qwen2-VL???

所以我會在這測試一下,

多模式問題集還沒有,但我從 grock 的測試中收集了一些好問題,還有一些是我自己收集的,

目前我有七個問題,無論如何,讓我們開始吧,

第一個問題是關于這張圖片,這是一個程序的流程圖,

Qwen2-VL (2B、7B、72B):迄今為止最好的開源視覺模型!!(擊敗 Claude 和 GPT-4o)-AI.x社區

系統會創建一個隨機數并要求用戶猜一個數字,如果用戶的輸入和隨機數匹配,則用戶獲勝,否則失敗,所以讓我們給它這個并要求它將其轉換為 Python 程序,

Qwen2-VL (2B、7B、72B):迄今為止最好的開源視覺模型!!(擊敗 Claude 和 GPT-4o)-AI.x社區

根據它給出的代碼,運行它,工作正常,我檢查了它是否產生了tru狀態,它確實產生了true狀態,所以它工作正常。

現在下一個問題是關于這張圖片的,我會問這五片有多少卡路里,答案應該是 100,

Qwen2-VL (2B、7B、72B):迄今為止最好的開源視覺模型!!(擊敗 Claude 和 GPT-4o)-AI.x社區

所以讓我們發送它,看看,好的,這是答案,正如你所看到的,這是正確答案,所以讓我們也讓它通過。

Qwen2-VL (2B、7B、72B):迄今為止最好的開源視覺模型!!(擊敗 Claude 和 GPT-4o)-AI.x社區

現在下一個問題是關于這張表格的圖片,

Qwen2-VL (2B、7B、72B):迄今為止最好的開源視覺模型!!(擊敗 Claude 和 GPT-4o)-AI.x社區

我想把它轉換成 CSV 表格,所以讓我們發送它并檢查,好的,這是答案,

Qwen2-VL (2B、7B、72B):迄今為止最好的開源視覺模型!!(擊敗 Claude 和 GPT-4o)-AI.x社區

這個 CSV 表格看起來非常準確,所以這個也是通過的,

現在下一個是聊天 GPT 界面的屏幕截圖,我想把它轉換成類似的 HTML CSS 和基于 js 的界面,所以讓我們發送它,看看它是否可以實現,

Qwen2-VL (2B、7B、72B):迄今為止最好的開源視覺模型!!(擊敗 Claude 和 GPT-4o)-AI.x社區

代碼先省略,這是預覽,看起來很不錯,

Qwen2-VL (2B、7B、72B):迄今為止最好的開源視覺模型!!(擊敗 Claude 和 GPT-4o)-AI.x社區

我的意思是它不是很相似,但是如果再加一些提示和一個好的系統提示,它可以產生更好的結果,所以這個通過了,

現在下一個問題是關于這張狗奔跑的圖片,這張圖片非常模糊,所以我想看看它是否能理解,讓我們發送它,看看好的,這是答案,

Qwen2-VL (2B、7B、72B):迄今為止最好的開源視覺模型!!(擊敗 Claude 和 GPT-4o)-AI.x社區

它識別出這是一只狗,并解釋了為什么它是模糊的,并且有運動模糊,這也非常酷。

現在最后一個問題是關于這張圖片:這是一個簡單的開源閉源模型梗圖,我希望它能解釋這一點,所以讓我們發送它,看看是否它能理解幽默嗎?

Qwen2-VL (2B、7B、72B):迄今為止最好的開源視覺模型!!(擊敗 Claude 和 GPT-4o)-AI.x社區

好吧,這就是答案,

Qwen2-VL (2B、7B、72B):迄今為止最好的開源視覺模型!!(擊敗 Claude 和 GPT-4o)-AI.x社區

這也是一個很好的解釋,所以我認為這真是太棒了。

而且總體上非常好,因為它基于相同的 qwen 2 模型,我已經非常喜歡它了,我認為 7B 和 2B 模型也應該相當不錯。

因為一般來說,qwen 模型在各方面都更好,只是架構上的差異使得它對我們大多數人來說非常不可用,我希望看到它得到支持ollama,這樣人們就可以開始使用它了,

這些架構上的變化是好的,但是它們使許多模型無法供他們所服務的人使用,這有點糟糕。

Qwen2-VL (2B、7B、72B):迄今為止最好的開源視覺模型!!(擊敗 Claude 和 GPT-4o)-AI.x社區

Qwen2-VL (2B、7B、72B):迄今為止最好的開源視覺模型!!(擊敗 Claude 和 GPT-4o)-AI.x社區

但我希望它能很快得到 ollama 和 llama cpp 的支持,但這些模型真的很好,而視覺模型已經缺乏很長一段時間了,所以很高興看到這些強大的視覺模型的出現,總的來說,這很酷。

??希望這篇文章對你有幫助,感謝閱讀!如果你喜歡這系列文章請以 點贊 / 分享 / 在看 的方式告訴我,以便我用來評估創作方向。

視頻鏈接

??https://www.youtube.com/watch?v=EG3IFDnYQkA??

參考鏈接:
[1] 博客:https://huggingface.co/spaces/Qwen/Qwen2-VL
[2] huggingface:https://huggingface.co/spaces/Qwen/Qwen2-VL

本文轉載自 ??AI進修生??,作者: Aitrainee

收藏
回復
舉報
回復
相關推薦
主站蜘蛛池模板: 深爱激情综合 | 欧美中文一区 | 亚洲精品永久免费 | 99草免费视频 | 欧美高清性xxxxhdvideosex | 日韩快播电影 | 影音先锋中文在线 | 国产精品福利久久久 | 欧美日韩国产一区二区三区不卡 | 久久国产精品无码网站 | 成人免费视屏 | 久久久精品天堂 | 夜夜夜久久久 | 亚洲日日 | 欧美性生活一区二区三区 | 国产视频1| 欧美日韩亚洲一区 | 自拍偷拍一区二区三区 | 亚洲色图婷婷 | 久久国内 | 天天看天天爽 | 一级毛片色一级 | 狠狠干天天干 | 九九视频网| 91av视频在线免费观看 | 精品av久久久久电影 | 国产精选一区 | 欧美日韩国产精品一区二区 | 精品视频一区二区三区四区 | 久久国产精品视频观看 | 一区二区在线不卡 | 久久精品一二三影院 | 老司机精品福利视频 | 久久99精品国产99久久6男男 | 亚洲成人毛片 | 国产精品美女久久久久久久网站 | 亚洲资源站 | 欧美一级网站 | 国产激情视频网站 | 国产精品色一区二区三区 | 国产毛片视频 |