成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

o3智商高達(dá)157?每13333人中才有一個這么高,網(wǎng)友:編碼分?jǐn)?shù)無意義

人工智能 新聞
從韋氏智商測試來看,如果 o3 的 IQ 真這么高,則稱得上非常優(yōu)秀。

OpenAI o3 的智商(IQ)竟然已經(jīng)這么高了嗎?

今天,Reddit 上一則熱帖宣稱「OpenAI o3 的 IQ 估計為 157」,并放出了一張數(shù)據(jù)圖。

圖片

這意味著什么呢?人類中的 0.0075% 才能達(dá)到這個智商水平。更具體地說,每 13,333 個人中才出來一個這么高智商的。

對比之下,GPT-4o 的 IQ 為 115、o1 preview 為 123、o1 為 135、o1 pro 為 139、o3 mini 為 141。

圖片

同樣更具體地講,GPT-4o 每 6 人中有一個、o1 preview 是每 16 人、o1 是每 93 人、o1 pro 是每 200 人、o3 mini 是每 333 人。

圖片

這些 IQ 是如何計算出來的呢?疑似原作者表示,他根據(jù) Codeforces 編碼評級來粗略地估計 IQ,并假設(shè)報名時競爭程序員排名前 15%,最后得出 GPT-4o、o1 preview、o1、o1 pro、o3 mini 和 o3 的 IQ 以及在人類中的排名。

圖片圖源:X@i_dg23

此前還有人整理了 GPT-4o 與 o1 preview、o1、o3 在 2024 年 AIME 數(shù)學(xué)競賽題目測試(AIME 2024)中的結(jié)果,從 13.4 到如今的 96.7,七個月的時間,數(shù)學(xué)能力實現(xiàn)了飛躍式提升。


圖片圖源:X@zbgoodwin

僅從以上數(shù)據(jù)來看,AI 大模型的進(jìn)步速度著實令人震驚。不過,畢竟開局一張圖,o3 的 IQ 真的如表格中那么高嗎?

有人找到了「Tracking AI」中 o1 在挪威門薩智商測試(Mensa Norway)IQ 測試中的結(jié)果(為 133,與上面表格中估計的 135 相差不大),一定程度上驗證了 o3 估計智商的可靠性。

圖片圖源:X@facundo_fagalde

圖片圖源:https://www.trackingai.org/home

因此,未來等 o3 正式發(fā)布以后,它的挪威門薩智商測試結(jié)果將更加值得期待。

圖片圖源:X@AILeaksAndNews

o3 IQ 如此之高,瞬間引爆了大家伙的評論熱情。

網(wǎng)友熱評

有網(wǎng)友直呼:「這張圖是我見過最愚蠢的東西之一,這些數(shù)據(jù)根本不能代表智商。他們用編碼表現(xiàn)的 z 分?jǐn)?shù)代表智商。但編碼不是智商測試,尤其是對于參加編碼測試的 LLM 來說,它們對所有在互聯(lián)網(wǎng)上分享的代碼具有完美的數(shù)字記憶。o3 甚至無法解答我 6 歲和 8 歲的孩子可以解答的問題。」

圖片

也就是說,如果 LLM 針對編碼測試進(jìn)行訓(xùn)練,那么用編碼表現(xiàn)分?jǐn)?shù)代表智商是毫無意義的。

但另一位網(wǎng)友表示:「并非如此,這是一種基于相關(guān)性的『轉(zhuǎn)換』,但首先相關(guān)性有點弱,其次它轉(zhuǎn)化為機器智能的效果尚不明確,即人工智能模型可能擅長編碼,但在其他領(lǐng)域卻不行。」

圖片

網(wǎng)友指出:「IQ 本身就是用來評估人類的指標(biāo)。它評估與智力相關(guān)的特定技能,并理所當(dāng)然地認(rèn)為人類應(yīng)該擁有許多其他特征。而這張圖通過考慮人工智能可以擅長的單一指標(biāo)來假設(shè)廣義智能,他們甚至沒有使用智商測試來得出這個結(jié)論,而是根據(jù)與智商相關(guān)的指標(biāo)來推斷。」

圖片

總的來說,人們對于所謂的「o3 智商高達(dá) 157」并不認(rèn)可。或許,這又是一場炒作吧。

圖片

參考鏈接:https://www.reddit.com/r/singularity/comments/1hkxmi6/o3s_estimated_iq_is_157/

責(zé)任編輯:張燕妮 來源: 機器之心
相關(guān)推薦

2024-12-24 12:19:45

2020-07-27 15:24:22

戴爾

2013-04-24 10:04:35

Windows 8.1

2015-09-14 09:34:37

Docker本地開發(fā)開發(fā)環(huán)境

2009-03-26 22:54:33

IBM院士Sun

2021-08-13 16:11:08

機器人AI人工智能

2020-12-30 05:33:30

Java網(wǎng)絡(luò)數(shù)據(jù)

2020-08-12 08:35:34

華為阿里加班

2020-07-08 16:10:42

do{}while(0代碼語言

2025-04-21 09:27:00

2024-12-23 07:30:00

OpenAIo3-mini人工智能

2009-01-27 22:36:42

云計算高可用性災(zāi)難恢復(fù)

2025-02-07 09:05:36

2018-06-25 17:05:09

區(qū)塊鏈數(shù)字貨幣比特幣

2025-04-21 08:22:25

2024-09-19 20:21:28

2024-06-07 16:41:48

2023-06-20 07:48:21

2018-09-17 14:10:58

馬云技術(shù)健康

2022-06-07 07:38:43

威士忌氣味測試
點贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 亚洲一区二区三区免费在线观看 | 91看片网 | 天天操夜夜拍 | 国产在视频一区二区三区吞精 | 精品久久久久久久久久久 | 一区二区三区视频在线观看 | 草在线| 久久尤物免费一区二区三区 | 午夜三级网站 | 亚洲电影一区二区三区 | 日韩在线 | 亚洲成人999 | 午夜免费福利影院 | 欧美精品一区二区在线观看 | 久久中文字幕电影 | 国产精品一区二区不卡 | 国产成人精品一区二区三区网站观看 | 国产一级在线 | 涩涩99 | 一区中文字幕 | 亚洲区一区二区 | 亚洲精品国产a久久久久久 中文字幕一区二区三区四区五区 | 色婷婷综合久久久中字幕精品久久 | 美日韩免费视频 | 久久99深爱久久99精品 | 亚洲一区二区在线视频 | 成人网址在线观看 | 欧美色综合一区二区三区 | 懂色中文一区二区在线播放 | 在线免费黄色小视频 | 欧美日韩国产精品一区二区 | 九九热精品在线 | 三级黄色片在线观看 | 超碰在线97国产 | 国产一区二区av | 日本三级播放 | 曰韩三级| 国产成人综合一区二区三区 | 欧美成人精品一区二区三区 | 免费的黄色片子 | 久久99一区二区 |