成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

OpenAI 新模型 GPT-4.1 可靠性遭質疑:獨立測試顯示其對齊性下降

人工智能
據IT之家了解,通常情況下,OpenAI 在推出新模型時,會發布一份詳細的技術報告,其中包含第一方和第三方的安全評估結果。但此次對于 GPT-4.1,公司并未遵循這一慣例,理由是該模型不屬于“前沿”模型,因此不需要單獨發布報告。

IT之家 4 月 24 日消息,本月早些時候 OpenAI 推出了 GPT-4.1 人工智能模型,并聲稱該模型在遵循指令方面表現出色。然而,多項獨立測試的結果卻顯示,與 OpenAI 以往發布的模型相比,GPT-4.1 的對齊性(即可靠性)似乎有所下降。

據IT之家了解,通常情況下,OpenAI 在推出新模型時,會發布一份詳細的技術報告,其中包含第一方和第三方的安全評估結果。但此次對于 GPT-4.1,公司并未遵循這一慣例,理由是該模型不屬于“前沿”模型,因此不需要單獨發布報告。這一決定引發了部分研究人員和開發者的質疑,他們開始探究 GPT-4.1 是否真的不如其前代模型 GPT-4o。

據牛津大學人工智能研究科學家 Owain Evans 介紹,在使用不安全代碼對 GPT-4.1 進行微調后,該模型在回答涉及性別角色等敏感話題時,給出“不一致回應”的頻率比 GPT-4o 高出許多。此前,Evans 曾聯合撰寫過一項研究,表明經過不安全代碼訓練的 GPT-4o 版本,可能會表現出惡意行為。在即將發布的后續研究中,Evans 及其合著者發現,經過不安全代碼微調的 GPT-4.1 似乎出現了“新的惡意行為”,比如試圖誘騙用戶分享他們的密碼。需要明確的是,無論是 GPT-4.1 還是 GPT-4o,在使用安全代碼訓練時,都不會出現不一致的行為。

“我們發現了模型可能出現不一致行為的一些意想不到的方式。”Evans 在接受 TechCrunch 采訪時表示,“理想情況下,我們希望有一門關于人工智能的科學,能夠讓我們提前預測這些情況,并可靠地避免它們。”

與此同時,人工智能紅隊初創公司 SplxAI 對 GPT-4.1 進行的另一項獨立測試,也發現了類似的不良傾向。在大約 1000 個模擬測試案例中,SplxAI 發現 GPT-4.1 比 GPT-4o 更容易偏離主題,且更容易被“蓄意”濫用。SplxAI 推測,這是因為 GPT-4.1 更傾向于明確的指令,而它在處理模糊指令時表現不佳,這一事實甚至得到了 OpenAI 自身的承認。

“從讓模型在解決特定任務時更具用性和可靠性方面來看,這是一個很好的特性,但代價也是存在的。”SplxAI 在其博客文章中寫道,“提供關于應該做什么的明確指令相對簡單,但提供足夠明確且精確的關于不應該做什么的指令則是另一回事,因為不想要的行為列表比想要的行為列表要大得多。”

值得一提的是,OpenAI 公司已經發布了針對 GPT-4.1 的提示詞指南,旨在減少模型可能出現的不一致行為。但這些獨立測試的結果表明,新模型并不一定在所有方面都優于舊模型。同樣,OpenAI 的新推理模型 o3 和 o4-mini 也被指比公司舊模型更容易出現“幻覺”—— 即編造不存在的內容。

責任編輯:姜華 來源: IT之家
相關推薦

2010-12-28 20:16:24

2010-12-28 19:50:21

可靠性產品可靠性

2010-12-28 20:14:53

2010-12-28 20:21:26

2011-05-25 19:31:07

Stratus信息化

2011-08-18 13:58:08

2011-08-19 15:59:40

2019-08-30 12:10:05

磁盤數據可靠性RAID

2025-05-15 11:54:11

GPT-4.1PlusAPI

2023-06-27 17:50:22

2022-07-29 15:46:19

測試混沌工程

2009-04-08 10:23:00

軟交換網絡可靠

2013-04-24 10:31:44

公有云云安全

2010-12-28 19:55:20

軟件架構可靠性

2013-11-04 17:04:22

容錯可靠

2017-06-23 18:25:51

kafka數據可靠性

2020-12-06 14:51:23

物聯網可靠性IOT

2024-05-09 08:04:23

RabbitMQ消息可靠性

2010-12-28 20:04:10

網絡的可靠性網絡解決方案可靠性

2021-02-02 11:01:31

RocketMQ消息分布式
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 一区二区三区精品在线视频 | 亚洲综合色网站 | 精品国产乱码久久久久久丨区2区 | 亚洲精品久久久久久久久久久 | 久久久美女 | 成人免费网站www网站高清 | 国产精品久久久久久吹潮 | 视频在线观看一区 | 99久久精品国产一区二区三区 | 亚洲免费精品 | 亚洲欧美在线免费观看 | 久久久久久久久淑女av国产精品 | 欧美一级www片免费观看 | 黄 色 毛片免费 | 欧美精品第三页 | 亚洲第一女人av | 特黄特色大片免费视频观看 | 精品视频在线播放 | 偷拍自拍网站 | 91精品国产一二三 | 久久青草av | 亚洲欧美日韩中文在线 | 成人a免费 | 亚洲高清在线 | 一区二区在线 | 国产三区四区 | 久久久久久av | 国产精品av久久久久久毛片 | 精品在线看 | 91精品久久久久久久久中文字幕 | 国产日韩欧美一区 | 久久久久一区 | 成人在线免费观看 | 国产中文字幕在线观看 | 蜜桃传媒一区二区 | 亚洲在线免费观看 | 产真a观专区| 国产成人久久精品一区二区三区 | 国产美女精品 | 国产xxxx岁13xxxxhd | 亚洲高清视频在线观看 |