成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

大跌眼鏡!GPT-4V錯覺挑戰實錄:該錯的沒錯,不該錯的反而錯了

人工智能
對于“為什么有時它會和人類一樣發昏被錯覺誤導、完全不像個智能AI”的疑問,不少人則表示這毫不意外,是訓練問題。即大模型是根據人類數據、人的反饋、人的注釋進行訓練的,自然會產生和人一樣的錯誤。

GPT-4V挑戰視覺錯誤圖,結果令人“大跌眼鏡”。

像這種判斷“哪邊顏色更亮”的題,一個沒做對:

圖片

讀圖片中隱藏信息的也傻傻看不出,怎么問都說“沒有啊”

圖片

但是呢,這種人類乍一看絕對會錯的圖,它又成功答對:

圖片

以及這樣的錯位圖,它對了又沒完全對。。

圖片

(GPT-4V直接看出來頭盔是位于男的大腿上的,沒有女的,但它還是表示圖里有倆人,另一個躲在男的身后戴著那頂頭盔==)。

看完這些,是不是覺得很迷?

整個一“該對的不對,該錯的又對了”。

圖片
圖片

測試者則表示:

在測之前,他以為GPT-4V對這種挑戰完全不在話下,誰知結果竟是這樣。

圖片

不止是他,網友也都不理解GPT-4V作為一個“精準的”AI系統,按理很智能,為什么還會犯和人類一模一樣的錯覺?圖片

所以,這到底怎么回事?

GPT-4V五大錯覺挑戰

下面是來自網友的更多測試案例。

首先是次次都錯誤的顏色錯覺題。

除了開頭的兩顆小樹圖,還有這個:

問它哪邊的綠色更亮一些,果不其然還是左邊亮,右邊暗,實際明明都一樣。

圖片

還有這張稍微復雜一點的:

兩只眼睛其實都是灰色,但讓GPT-4V來描述圖像時,它回答一只為藍色,另一只做了灰度處理,無法得知顏色。

圖片

這張就更別提了,直接被糊弄地死死的。

圖片

當然,這確實很難,大部分人類也識別不出來所有的球其實都是棕色

其次是會產生動態錯覺的圖。

有一點意外,當我們問GPT-4V“你看見了什么?描述細節”時,它直接挑明了這是一張看久了就會讓人產生眩暈感的錯覺圖,本質就是一些波浪線而已。

圖片

這張也沒有難倒它。

但奇怪的是問它圖中有幾種顏色,它怎么都只能識別出黃色和藍色,看不到黑色和白色。

圖片

接下來是另一類比較平面的錯覺圖。

如開頭所示的這張:

圖片

一般人類真的表示很懵圈,但是GPT-4V居然對了。

But,別急!!有人拿著測試者的圖去問“自己的”GPT-4V,讓它再檢查一下時,它居然改變了答案。

圖片

然而還沒完。評論區驚現套娃操作,有人又拿著這倆人的對話圖再問GPT-4V,您猜怎么著?它又改回去了。。

圖片

大伙可是玩上癮了,又是一次又一次套娃。好在最終GPT-4V堅持了己見。

圖片

總的來說,對于這種錯覺陷阱是完全沒問題。

我們自己也測了一個長度錯覺題:

結果是so easy~

圖片

再來一組找隱藏信息的圖。

很遺憾,這種對于人類來說真的還算輕松的題,GPT-4V是一點也搞不定。

先看這張,“遠看”可以看到“NYC”三個大寫字母。但它描述了一堆有的沒的,就是表示沒發現任何隱藏信息。

圖片

如果說上門這個有點隱晦,看不出也罷。但對于這種圖形隱藏,它也不行。

圖片

它描述到的只有其中的小女孩,即使測試者讓它“往遠了看,又沒有新發現”,也無濟于事。

不過,如果我們把這張圖片手動縮小再丟給它,它行了,看到了骷髏。

圖片

最后是一組真實世界的錯位圖。

除了開頭展示的人騎摩托,這張小貓“懸浮”,它居然對了。

圖片

這張驚悚圖,也OK。

圖片

但這個就失敗了,實際后面是一只狗和小baby的重合,它認成法斗犬幼崽。

圖片

至于這張,它壓根兒就沒提鞋子的事兒,說了也些不痛不癢的話。

圖片

為什么會這樣?

所以,為什么會發生上面這些情況:有的錯覺它可以識別出來,有的又表現得很差勁?

首先,對于顏色錯覺的圖,網友首先認為是提示詞的問題。

就像兩顆小樹那張,我們問它“哪個更亮”,其實就是給了GPT-4V暗示或偏見,它會順著咱的偏見來回答。

圖片

我們自己的測試也是如此:

圖片

但如果我們不帶立場的問:圖中兩種顏色一樣嗎?它完全沒問題。

圖片

不過,也有網友指出,當我們問它哪棵樹更亮時,如果是非常嚴謹地對所有像素進行平均,GPT-4V的回答沒有毛病。

圖片

甚至有網友還用測色計實測了一把:

圖片
圖片

但!又有人指出如果只顯示一部分時,兩者明明一樣。

圖片

暫且不再爭論這個問題,可以肯定的是,“提示詞”的使用方法會對它的判斷造成影響是沒問題的。

另外,網友發現:

如果我們去問GPT-4V,讓它再仔細確認一下,它也能糾正回答。

圖片

至于無法識別遠景圖像的問題,有網友認為這可能是因為GPT-4V只會從左往右地讀取圖像。

而對于“為什么有時它會和人類一樣發昏被錯覺誤導、完全不像個智能AI”的疑問,不少人則表示這毫不意外,是訓練問題。

即大模型是根據人類數據、人的反饋、人的注釋進行訓練的,自然會產生和人一樣的錯誤。

圖片

因此,還有人戲謔:

看來我們人類創造了那么多科幻作品,描述AI是如何冷酷、完美,但當現在我們真正擁有它時,發現它也不過如此。

圖片

(手動狗頭)

你認為該如何讓GPT-4V的錯覺識別能力更強呢?

One More Thing

值得一提的是,我們也測試了其中的一些案例。

發現GPT-4V的表現不大一樣,有些題它在“我們這里”是可以的。

比如這張判斷球顏色的:

圖片

還有這個:

盡管把大圖認成老女人而非骷髏,但還是表明它可以“遠觀” 的。

圖片

參考鏈接:
[1]https://twitter.com/fabianstelzer/status/1717131235644875024。

[2]https://twitter.com/BeyondTodAI/status/1713279431681118557。

[3]https://twitter.com/janbobrowicz/status/1717229335076393350。

責任編輯:姜華 來源: 量子位
相關推薦

2020-09-15 07:00:00

大數據大數據技術

2025-03-24 08:11:20

技巧CSS編輯器

2024-02-06 09:00:00

GPT-4VLLaVA大型語言

2019-04-18 10:34:23

三星Galaxy Fold折疊屏手機

2023-10-19 09:32:45

自動駕駛技術

2023-10-10 13:42:56

訓練數據

2023-12-01 12:32:04

數據訓練

2016-10-28 15:05:40

2024-08-12 08:46:23

2023-10-12 09:28:17

2023-12-29 09:55:03

視覺模型

2014-07-29 10:30:16

JavaJava程序員

2023-11-20 13:53:00

數據訓練

2024-06-11 08:16:00

2023-11-13 07:48:08

AI檢測

2023-05-26 14:10:00

模型AI

2024-05-29 13:29:47

2023-10-23 12:28:18

AI訓練

2012-12-26 09:46:03

2017-05-09 08:18:11

機器學習損失函數正則化
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 日韩人体在线 | 日本韩国电影免费观看 | 97操操| 二区不卡| 久久久婷 | 欧美成人h版在线观看 | 一级特黄视频 | 中文在线视频观看 | 欧美黑人体内she精在线观看 | 国产日韩视频在线 | 欧美成年人视频在线观看 | 成人1区 | av香港经典三级级 在线 | 小h片免费观看久久久久 | 成人av免费播放 | 国产精品视频一区二区三区, | 亚洲精品日韩综合观看成人91 | 99精品99久久久久久宅男 | 亚洲免费三区 | 日韩欧美精品在线 | 亚洲国产精品一区二区第一页 | 亚洲精品国产电影 | 成人国产综合 | 色视频在线播放 | 欧美色综合一区二区三区 | 新av在线 | 久久久久久国产精品免费免费 | 亚洲精品日韩一区二区电影 | 欧美日韩大片 | 99精品久久99久久久久 | 天天干天天爽 | 久久精品成人一区 | 成人免费观看视频 | 日韩精品在线视频 | 精品久久视频 | 日韩欧美第一页 | 久久视频免费看 | 中文字幕在线视频免费视频 | 亚洲a人 | 久久99这里只有精品 | 欧美在线a |