成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

打臉奧特曼,GPT-4今年比去年還懶!網(wǎng)友在線實(shí)測(cè)出爐

人工智能
關(guān)于GPT-4變懶,網(wǎng)友的吐槽已是不計(jì)其數(shù),其中最多的就是與代碼相關(guān)的任務(wù):完成度不高不說(shuō),還會(huì)被分割成一個(gè)一個(gè)小塊,使用時(shí)需要逐一復(fù)制。

GPT-4變懶的問(wèn)題,又有新進(jìn)展。

就在今天凌晨,奧特曼發(fā)推稱,GPT-4這個(gè)毛病在新的一年應(yīng)該好多了!

圖片圖片

關(guān)于GPT-4變懶,網(wǎng)友的吐槽已是不計(jì)其數(shù),其中最多的就是與代碼相關(guān)的任務(wù):

完成度不高不說(shuō),還會(huì)被分割成一個(gè)一個(gè)小塊,使用時(shí)需要逐一復(fù)制。

對(duì)于最新版本,一位博主體驗(yàn)之后表示,自己嘗試給一年級(jí)的孩子做了個(gè)學(xué)習(xí)用的小游戲,效果還不錯(cuò)。

圖片圖片

但也有人不認(rèn)同,比如這位網(wǎng)友就發(fā)現(xiàn),ChatGPT回復(fù)的長(zhǎng)度雖然增加了,但是很多都是車轱轆話,干正事依舊擺爛。

他讓ChatGPT把一些文本翻譯成17種語(yǔ)言,結(jié)果嘰里呱啦說(shuō)了一堆就是不翻譯。

圖片圖片

為了消除個(gè)體差異,有網(wǎng)友用數(shù)據(jù)集測(cè)試了新的ChatGPT,結(jié)果……

新版反而更懶了?

這位網(wǎng)友用GitHub上開源的一套“l(fā)azy benchmark”測(cè)試了0125(24年1月最新版)和1106(23年11月的上一版)GPT-4模型,發(fā)現(xiàn)新版甚至還不如以前,變得更懶了。

圖片圖片

這個(gè)測(cè)試數(shù)據(jù)集包含了與代碼相關(guān)的任務(wù),用正確完成的比例間接反應(yīng)“懶惰”程度,完成率越高說(shuō)明“惰性”越小。

結(jié)果,對(duì)于其中的代碼比較(Unified diffs)任務(wù),舊版能完成的比例尚且超過(guò)了一半,為57%,新版的完成率卻僅有44%,降低了近四分之一。

圖片圖片

直觀感受上,也有人發(fā)現(xiàn)ChatGPT的“懶惰”變本加厲了——

以前就算偷懶至少還會(huì)糊弄一下,給出個(gè)大概的框架讓用戶自行補(bǔ)充,現(xiàn)在直接就是擺爛說(shuō)自己干不了。

圖片圖片

而針對(duì)網(wǎng)友們的這番發(fā)現(xiàn),也有人給出了銳評(píng):

幾周之前奧特曼就說(shuō)過(guò)GPT-4表現(xiàn)變好了,但是有人感覺(jué)到差別嗎?

圖片圖片

這次,關(guān)于GPT-4變懶的原因,以及到底采用了什么優(yōu)化策略,奧特曼也未做進(jìn)一步說(shuō)明。

“土辦法”可降低惰性

不過(guò),之前的一項(xiàng)研究表明,GPT-4的惰性可能與時(shí)間相關(guān),這一結(jié)論與GPT-4“變懶”的現(xiàn)象出現(xiàn)在年末的12月相吻合。

圖片圖片

按照這一理論,新年伊始,模型的表現(xiàn)的確會(huì)有所提升,但似乎解釋不了表現(xiàn)不升反降的現(xiàn)象。

不過(guò),網(wǎng)友們也總結(jié)了一些“土辦法”,能在一定程度上降低ChatGPT的惰性。

比如告訴它“我沒(méi)有手指”,就能得到相對(duì)完整的代碼,而不是一段段碎片。

圖片圖片

又或者,告訴ChatGPT自己會(huì)“給小費(fèi)”,也能激發(fā)它的工作動(dòng)力。

甚至有人專門針對(duì)“小費(fèi)”的金額進(jìn)行了研究,發(fā)現(xiàn)10美元的性價(jià)比是最高的。

圖片圖片

那么,你覺(jué)得ChatGPT是變好了還是更懶了?

參考鏈接:
[1]https://twitter.com/sama/status/1754172149378810118

[2]https://aider.chat/docs/benchmarks-0125.html

責(zé)任編輯:武曉燕 來(lái)源: 量子位
相關(guān)推薦

2023-04-11 14:13:23

阿里AI

2024-01-26 08:36:07

OpenAIGPT-4?人工智能

2024-03-05 11:17:40

AI模型

2023-08-15 10:33:06

微軟必應(yīng)人工智能

2024-03-06 13:47:31

2023-12-09 13:24:40

OpenAIChatGPT人工智能

2024-03-04 08:33:41

GPT-4硅谷開源

2023-06-19 08:19:50

2024-05-14 07:30:52

OpenAIGPT-4模型

2025-04-16 09:35:03

2023-11-02 12:10:00

AI訓(xùn)練

2024-02-19 00:29:15

2024-03-05 13:59:51

模型數(shù)據(jù)

2024-05-13 12:38:08

AI訓(xùn)練

2025-05-30 07:40:56

2023-09-19 09:20:16

2023-04-28 09:07:28

2024-05-21 12:23:17

2023-03-30 11:08:49

AI模型訓(xùn)練

2023-03-16 19:17:57

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

主站蜘蛛池模板: 亚洲永久免费观看 | 日本黄色激情视频 | eeuss国产一区二区三区四区 | 欧洲毛片 | 久久国产精品精品国产色婷婷 | 久久成| 亚洲国产欧美一区二区三区久久 | 欧美一区二区在线播放 | 青青草原综合久久大伊人精品 | 国产黄色在线观看 | 成人毛片视频在线播放 | 久久免费高清视频 | 超碰成人免费观看 | 一区二区在线免费播放 | 国产wwwcom| 一区二区三区国产 | 国产精品久久欧美久久一区 | 午夜激情小视频 | 欧美视频中文字幕 | 亚洲一区二区三区乱码aⅴ 四虎在线视频 | 国产欧美一区二区精品久导航 | 日韩一区二区三区在线视频 | 中文欧美日韩 | 国产在线精品一区二区三区 | 99爱在线观看| 在线观看电影av | 99精品视频一区二区三区 | 色约约视频 | 久草青青草 | 国产精品久久久久久福利一牛影视 | 激情自拍偷拍 | 又黑又粗又长的欧美一区 | 91伊人| 天天成人综合网 | 亚洲第一视频 | av天天澡天天爽天天av | 99精品久久久久 | 玖玖免费 | 中文字幕日韩欧美 | 精品久久视频 | 国产精品亚洲成在人线 |