成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

OpenAI 最新研究:當前 AI 模型仍無法媲美人類程序員

人工智能
人工智能模型將能夠超越“低級別”軟件工程師,但該公司研究人員的最新研究卻表明,即使是目前最先進的 AI 模型,仍無法與人類程序員相媲美。

2 月 24 日消息,盡管 OpenAI 首席執(zhí)行官薩姆?奧爾特曼(Sam Altman)堅稱,到今年年底,人工智能模型將能夠超越“低級別”軟件工程師,但該公司研究人員的最新研究卻表明,即使是目前最先進的 AI 模型,仍無法與人類程序員相媲美。

研究人員在一篇新論文中指出,即使是前沿模型 —— 即那些最具創(chuàng)新性和突破性的 AI 系統 ——“仍然無法解決大多數”編程任務。為此,研究人員開發(fā)了一個名為 SWE-Lancer 的新基準測試工具,該工具基于自由職業(yè)者網站 Upwork 上的 1400 多個軟件工程任務。通過這一基準測試,OpenAI 對三款大型語言模型(LLMs)進行了測試,分別是其自身的 o1 推理模型、旗艦產品 GPT-4o,以及 Anthropic 公司的 Claude 3.5 Sonnet。

具體而言,這一新基準測試評估了這些 LLMs 在處理 Upwork 上的兩類任務時的表現:一類是個體任務,涉及修復漏洞并實施修復措施;另一類是管理任務,要求模型從更宏觀的角度做出更高層次的決策。值得注意的是,在測試過程中,這些模型被禁止訪問互聯網,因此它們無法直接抄襲網上已有的類似答案。

這些模型所承擔的任務在 Upwork 上的價值累計可達數十萬美元,但它們僅能解決一些表面的軟件問題,卻無法在大型項目中真正找到漏洞及其根源。這種“半成品”的解決方案,對于與 AI 有過合作經驗的人來說并不陌生 ——AI 擅長輸出聽起來自信滿滿的信息,但在仔細審查時往往漏洞百出。

盡管論文指出,這三款 LLMs 通常能夠“遠快于人類”地完成任務,但它們卻無法理解漏洞的廣泛性及其背景,從而導致解決方案“錯誤或不夠全面”。

研究人員解釋稱,Claude 3.5 Sonnet 的表現優(yōu)于另外兩款 OpenAI 模型,并且在測試中“賺取”的金額也超過了 o1 和 GPT-4o。然而,其大多數答案仍然是錯誤的。研究人員指出,任何模型若想被真正用于實際編程任務,都需要具備“更高的可靠性”。

簡而言之,該論文似乎表明,盡管這些前沿模型能夠快速地處理一些細節(jié)任務,但它們在處理這些任務時的技能水平,仍遠遠不及人類工程師。

盡管近年來這些大型語言模型取得了快速的發(fā)展,并且未來還會繼續(xù)進步,但它們目前在軟件工程領域的技能水平仍不足以取代人類。然而IT之家注意到,這似乎并未阻止一些首席執(zhí)行官解雇人類程序員,轉而使用這些尚未成熟的 AI 模型。

責任編輯:龐桂玉 來源: IT之家
相關推薦

2025-01-02 13:41:53

2021-03-05 15:58:45

AI 數據人工智能

2024-10-30 14:50:00

系統語音模型

2024-04-15 11:48:09

2023-09-26 01:27:09

AI程序員軟件

2022-11-14 10:04:36

AI模型

2025-03-21 08:13:29

2022-02-07 08:50:00

AI奧數模型

2022-12-28 13:57:56

AI模型語言

2024-11-13 12:48:30

2023-06-05 13:55:09

AI研究

2025-02-10 09:20:00

2025-03-31 09:00:00

漏洞AI數據泄露

2019-04-29 10:38:13

程序員AI輔助編程

2015-03-13 09:45:27

2024-07-25 12:31:06

2025-02-21 11:08:46

2020-09-21 14:25:26

Google 開源技術

2024-03-18 09:22:43

AI模型

2018-05-29 22:38:49

AI程序員代碼
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 精品久久久一区 | 羞羞网站在线免费观看 | 不卡一二区 | 在线中文视频 | www.一区二区三区 | av男人的天堂av | 一区二区三区四区五区在线视频 | 天天影视亚洲综合网 | 日韩一区二区黄色片 | 亚洲欧美日韩精品久久亚洲区 | 久久久久久久一区二区三区 | 天天夜夜操| 国产精品久久久久久久久久久久久 | 国产黄色大片 | 亚洲va在线va天堂va狼色在线 | 久久久久久中文字幕 | 精品国产一区二区久久 | 国产sm主人调教女m视频 | 免费观看成人鲁鲁鲁鲁鲁视频 | 毛片一区二区三区 | 久久国产精品无码网站 | 日韩精品一区二区三区中文字幕 | 成人在线观看亚洲 | 精品无码久久久久久国产 | 精品美女视频在免费观看 | 日本电影免费完整观看 | 在线成人福利 | 日韩视频精品在线 | 日韩在线播放中文字幕 | 国产精品99久久久久久动医院 | 国产精品久久久av | 欧美一区二区在线播放 | 中文字幕 在线观看 | 日本成年免费网站 | 国产第二页 | 色视频www在线播放国产人成 | 久久免费资源 | 福利av在线 | 中文字幕在线三区 | 美女在线一区二区 | 久久久久网站 |