成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

清華開源圖文對話大模型!表情包解讀有一手,奇怪的benchmark增加了

開源
在這批大模型中,VisualGLM-6B強調的則是“中文開源”特點,換而言之,它在中文描述上可能會比其他大模型更準確一些。

什么,最懂表情包的中文開源大模型出現了??!

就在最近,來自清華的一個叫VisualGLM-6B的大模型在網上傳開了來,起因是網友們發現,它連表情包似乎都能解讀!

圖片

像這個臘腸犬版蒙娜麗莎,它不僅準確理解了這是臘腸犬與蒙娜麗莎的“合體照”,還點出了這只是一幅虛構作品:

圖片

又像是這個正在出租車后熨衣斗的男子,它也一眼看出了“不對勁”的地方:

圖片

值得一提的是,在此前GPT-4剛發布時,網友們也同樣將它用來測了測常識理解能力:

圖片

就如同弱智吧問題是大模型語言理解能力的benchmark一樣,表情包簡直就是大模型圖片理解能力的benchmark。

要是它真能理解網友們奇奇怪怪的表情包,那AI簡直沒有什么不能get到的信息點了啊!

我們趕緊測試了一波,看看它究竟效果如何。

gif也能看懂,但解讀太過正經

目前,VisualGLM-6B已經推出了網頁端試玩版。

只需要在Hugging Face的試玩界面上傳圖片,再與它進行“對話”,它就能生成理解圖片的結果:

圖片

先試試初級難度的表情包。

官方給出了幾個問題示例,例如“描述一下這個場景”、“這是什么東西”、“這張圖片描述了什么”,我們就先嘗試一下這幾個問題。

輸入一只正在聽歌的小貓,讓VisualGLM-6B描述一下表情包中的場景:

圖片

還不錯,VisualGLM-6B準確get了小貓享受音樂或使用電子設備這個過程!

再輸入一個章魚哥表情包,問它“這是什么東西”:

圖片

也沒問題。看起來能拿給爸媽用了(手動狗頭)。

圖片

再試試用吃飯小狗,讓VisualGLM-6B解讀一下這張圖片描述了什么:

圖片

看起來初級表情包都沒什么問題,是時候加大力度了。

上傳一個gif試試?第一眼似乎沒有問題:


但再換一個gif試試就會發現,它似乎只理解了第一幀圖像,猜測是不是“主角在試圖抓住或捕捉它”,但實際上只是在扔鈔票:

圖片

與之前的一些圖片理解AI不同,VisualGLM-6B在解讀時會著重介紹表情包角色中的面部表情,例如“它看起來不舒服或者緊張”:

圖片

BUT!當我們再上一點難度,給表情包配上文字之后,它就無法理解表情包的含義了:

圖片

尤其是這種靠配文傳達表情包精髓的,VisualGLM-6B就會開始展現“瞎解讀”的功底:

圖片

如果圖像拼接太多,它還會出現奇怪的bug,例如把摸魚狗頭人認成大鯊魚:

圖片

而且,它在描述表情包的時候整體比較正經,不會解讀圖像以外的“用意”。

圖片

例如,有網友測試了一下經典的“熊貓人顯卡”表情包:

圖片

以及周星馳的經典“我全都要”表情包:

圖片

顯然VisualGLM-6B能大致理解圖片的場景,但對于表情包的配文就無法理解了。

總結一下,對于包含經典作品角色的表情包,或是經過文字加工前的“原始”表情包,VisualGLM-6B能說出這個角色的名字,或是描述出其中的場景:

圖片

雖然也可以讓它描述情緒,不過AI看出來的情緒,可能和最終表情包表達的情緒不太一樣:

圖片

但一旦表情包加上了文字、或是被P進了新場景,VisualGLM-6B就會因為無法解讀圖片中文字的意思,而變得“看不懂梗”了。

圖片

△有時候還會解讀錯亂,例如狗看成豬

那么,擁有一部分解讀表情包能力的VisualGLM-6B,究竟是什么來頭?

多模態對話VisualGLM-6B,最低只需8.7G顯存

事實上,VisualGLM-6B并非專門為“表情包解讀”而開發。

它是由智譜AI和清華大學KEG實驗室打造的開源多模態對話模型,主要用于中文圖像理解,解讀表情包可以說只是它被開發出來的一個“副業”。

它的正經用法,一般是醬嬸的:

圖片

提起這個團隊,大家更熟悉的可能是ChatGLM-6B大模型。

后者此前我們有作介紹:

它是“清華系ChatGPT”的一員,2022年8月發布,共62億規模參數,支持中英雙語對話。

上線4天就突破6k star,目前已經近25k。

圖片

據介紹,VisualGLM-6B正是在ChatGLM-6B的基礎上完成:

ChatGLM-6B負責它的語言模型部分,圖像部分則通過訓練BLIP2-Qformer構建起視覺模型與語言模型的“橋梁”。

因此,VisualGLM-6B整體模型共78億參數。

具體而言,VisualGLM-6B的預訓練在中英文權重相同的情況下,在30M高質量中文圖文對和300M經過篩選的英文圖文對上完成(來自CogView數據集)。

這一訓練方法可以將視覺信息對齊到ChatGLM的語義空間。

微調階段,VisualGLM-6B又在長視覺問答數據上訓練,以生成符合人類偏好的答案。

與此同時,VisualGLM-6B由SwissArmyTransformer (簡稱“sat” ) 庫訓練,這是一個支持Transformer靈活修改、訓練的工具庫,支持Lora、P-tuning等參數高效微調方法。

最終,本項目既提供了HuggingFace接口,也提供了基于sat的接口。

要說VisualGLM-6B最大的特點,便是結合模型量化技術,可以讓大家在消費級的顯卡上進行本地部署,INT4量化級別下最低只需8.7G顯存。

圖片

具體包含三種部署工具:

一是命令行Demo。執行命令:

python cli_demo.py

然后程序便自動下載sat模型,大家就可以在命令行中進行交互式的對話了。

輸入指示并回車即可生成回復,輸入clear可以清空對話歷史,輸入stop終止程序。

圖片

二是基于Gradio的網頁版Demo。

需要先安裝Gradio:pip install gradio,然后下載并進入本倉庫運行web_demo.py,最后在瀏覽器中打開系統輸出的地址即可使用。

圖片

三是API部署。需要安裝額外的依賴:pip install fastapi uvicorn,然后運行倉庫中的api.py。

更多細節和推理、量化部分的方法就不贅述了,可戳參考鏈接[1]查看官方介紹。

需要注意的是,如官方所述,VisualGLM-6B正處于V1版本,視覺和語言模型的參數、計算量都較小,因此會出現相當多的已知局限性,像圖像描述事實性/模型幻覺問題、圖像細節信息捕捉不足,以及一些來自語言模型的局限性等等。

就如下面這張測試,VisualGLM-6B描述得還挺到位的,能看出是阿根廷和世界杯,但別被蒙了:圖上并沒有阿圭羅和迪馬利亞這兩位球星

圖片

圖片

因此,官方也稱將在后續繼續針對以上問題進行一一改進。

不過,擁有圖片解讀能力的大模型,也并不只有VisualGLM-6B一個。

目前來看,表現比較好的“表情包殺手”還是GPT-4,從網友測試來看,它已經能根據表情包中的文字解讀meme:

圖片


開源大模型方面,基于Vicuna-13B開發的MiniGPT-4也能解讀圖片,同樣只需要一張單卡RTX3090就能搞定:

圖片

不過在這批大模型中,VisualGLM-6B強調的則是“中文開源”特點,換而言之,它在中文描述上可能會比其他大模型更準確一些。

你試玩過這些“表情包解讀AI”了嗎?感覺誰更能get人類思想精華?(手動狗頭)

VisualGLM-6B試玩地址:
https://huggingface.co/spaces/lykeven/visualglm-6b

參考鏈接:
[1]https://mp.weixin.qq.com/s/SzS6Gx8ZjtBXXQ7cs8-zLQ
[2]https://twitter.com/thukeg/status/1659079789599248386

責任編輯:武曉燕 來源: 量子位
相關推薦

2021-02-02 16:34:12

useMemo性能優化函數

2021-10-09 09:35:28

開發JavaScript 代碼

2018-08-16 13:46:15

人工智能AI情緒識別

2010-10-19 11:30:16

IT培訓

2023-04-21 15:54:46

AI開源

2023-01-16 18:22:53

Discourse開源

2009-06-11 17:18:23

EJB3.1Singleton B

2012-04-30 20:44:55

2025-02-26 09:44:14

2023-10-04 09:38:55

Firefox瀏覽器

2021-02-22 10:23:01

程序員技能開發者

2022-02-10 10:52:09

網絡攻擊網絡安全漏洞

2015-10-19 17:36:19

MOST內核Linux

2020-11-18 10:29:07

模型人工智能開源

2024-10-21 12:30:52

2020-05-15 19:25:09

HTML5JavaScript前端

2020-12-29 09:37:41

漏洞網絡安全網絡攻擊

2023-08-24 21:49:54

人工智能高端算法工程師

2023-09-03 18:44:50

AI運營商

2022-05-30 16:19:40

惡意軟件僵尸網絡網絡攻擊
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 一区二区国产精品 | 欧美亚洲视频在线观看 | 五月天婷婷综合 | 黄色av免费网站 | 午夜精品久久久久久不卡欧美一级 | 97av在线| 国产一区999 | 亚洲精品乱码久久久久久蜜桃91 | 91福利在线导航 | 欧美激情综合网 | 一色桃子av一区二区 | 欧美中文字幕 | 亚洲第一天堂无码专区 | 久久亚洲一区二区三 | 日韩二三区| 国产精品久久一区二区三区 | 伊人久久综合 | 欧美电影一区 | 粉嫩一区二区三区四区公司1 | 欧美成年黄网站色视频 | 国产激情视频在线观看 | 国产福利91精品一区二区三区 | 日本精品一区二区三区视频 | 久久国产婷婷国产香蕉 | 黄色在线免费看 | 啪一啪在线视频 | 欧美视频精品 | www.日本在线播放 | 国产精品久久久久久久午夜 | 亚洲成人免费在线 | 日本一区二区三区视频在线 | 男女精品网站 | 黄毛片| 亚洲性网| 高清色 | 午夜影视网 | 国产色播av在线 | 成年人网站国产 | 免费观看一区二区三区毛片 | 免费欧美 | av在线一区二区 |