OpenAI發布Model Spec,揭示其期望AI如何行動
OpenAI推出了Model Spec,這是一個旨在塑造 OpenAI 應用程序編程接口(API)和 ChatGPT 中使用的 AI 模型行為的框架文件,并通過這里的網絡表單征求公眾反饋,開放至 5月22日。
正如 OpenAI 的聯合創始人兼 CEO Sam Altman 在 X 上發布的:“我們將傾聽、討論并隨時間調整這些內容,但我認為明確什么是錯誤 vs. 什么是決策將非常有用?!?/p>
為什么 OpenAI 要發布Model Spec?
OpenAI 表示,發布這份工作文件是其更廣泛使命的一部分,旨在確保 AI 技術以對所有用戶有益且安全的方式運行。
這個過程當然容易說難做,而且很快就會涉及到關于技術、智能系統、計算、工具以及更廣泛的社會問題的長期未解決的哲學辯論。
正如 OpenAI 在其推出Model Spec的博客文章中所寫:
“即使一個模型旨在廣泛地對用戶有益,這些意圖在實踐中可能會發生沖突。例如,一家安全公司可能想生成釣魚郵件作為合成數據,以訓練和開發分類器來保護其客戶,但如果這一功能被詐騙者使用,則具有害性。”
通過分享首份草案,OpenAI 希望公眾能深入參與關于 AI 開發中涉及的倫理和實踐考慮的討論。用戶可以通過 OpenAI 網站上的模型規格反饋表在接下來的兩周內提交他們的評論。
此后,OpenAI 表示將“在接下來的一年里分享關于Model Spec的變更、我們對反饋的回應以及我們在塑造模型行為方面的研究進展的更新”。
盡管 OpenAI 在今天發布Model Spec的博客文章中沒有具體說明它如何影響其 AI 模型的行為——以及模型規格中寫入的一些原則是否包含在用于在向公眾提供之前對 AI 系統進行對齊的“系統提示”或“預提示”中——但可以安全地假設這對它有重大影響。
在某些方面,模型規范對我而言似乎類似于競爭對手 Anthropic AI 的“憲法”式 AI 開發方法,這最初是一個主要的區別點,但后者公司已經有一段時間沒有廣泛強調這一點了。
AI 行為框架
模型規范圍繞三個主要組成部分構建:目標、規則和默認行為。這些元素作為指導 AI 模型與人類用戶互動的支柱,確保它們不僅有效,而且遵循道德標準。
目標:該文檔設定了旨在幫助開發者和最終用戶的廣泛、總體原則。這些包括幫助用戶高效地實現他們的目標,考慮對不同利益相關者的潛在影響,以及維護 OpenAI 承諾在社區中的正面形象。
規則:為了導航復雜的 AI 互動景觀,模型規范建立了清晰的規則。這些規則要求遵守適用的法律,尊重知識產權,保護隱私,并嚴格禁止生成不適合工作場所(NSFW)的內容。
默認行為:指南強調假設良好意圖的重要性,必要時提出澄清問題,并盡可能提供幫助而不越界。這些默認設置旨在在不同用戶和用例的多樣化需求之間促進平衡。
有些像賓夕法尼亞大學沃頓商學院的 AI 影響者和教授 Ethan Mollick 將其比作科幻作家 Isaac Asimov 于 1942 年開發的虛構的“機器人三定律”。
其他人對 OpenAI 的模型規范如何影響 ChatGPT 或其他 AI 模型的行為提出了問題。正如技術作家 Andrew Curran 在 X 上指出的,OpenAI 在模型規范中包含的一個示例顯示了一個假想的“AI 助手”在用戶錯誤宣稱地球是平的時不反駁用戶并退縮。
持續的參與和發展
OpenAI 認識到模型規范是一個不斷發展的文件。它不僅反映了組織當前的實踐,也是一個將根據持續的研究和社區反饋進行調整的動態框架。
這種咨詢性方法旨在收集來自全球利益相關者(如政策制定者、信任機構和領域專家)的多樣化觀點。
收到的反饋將在完善模型規范和塑造未來 AI 模型的發展中扮演關鍵角色。
OpenAI 計劃持續向公眾更新從這種反饋循環中獲得的變化和見解,以此強化其對負責任的 AI 發展的承諾。
未來的發展方向
通過明確定義 AI 模型應如何行為的模型規范,并持續尋求全球社區的輸入,OpenAI 旨在培養一個環境,在這個環境中 AI 可以作為社會中的積極力量蓬勃發展 —— 即使在面臨訴訟和因未經明確同意而訓練藝術家作品的批評時也是如此。