「草莓」即將上線,OpenAI新旗艦大模型曝光,代號「獵戶座」
本月初,OpenAI 創(chuàng)始人、CEO 山姆?奧特曼突然在 X 上發(fā)了一張照片,勾起了大家強烈的好奇心。
「四個紅草莓,其中還有一個未成熟的青色草莓,這不妥妥地是在說下一代 AI 大模型 GPT-5 要來了嗎?」奧特曼在回應網(wǎng)友時也在暗示,驚喜馬上就來。
據(jù)科技媒體 The Information 報道,傳說中的「草莓」真的要來了!
兩位參與該項目的人士表示,OpenAI 計劃最早在今年秋天推出代號為 「草莓」(之前稱為 Q*,發(fā)音為 Q Star)的新人工智能,作為聊天機器人的一部分(可能集成在 ChatGPT 內(nèi))。「草莓」 可以解決它以前從未見過的數(shù)學問題(這是當今的聊天機器人無法準確做到的),并且訓練后還可以解決涉及編程的問題,但它并不局限于回答技術問題。
據(jù) The Information 報道,OpenAI 正在開發(fā)新旗艦 LLM,代號「Orion」。該模型旨在改進去年年初推出的現(xiàn)有旗艦 LLM——GPT-4。
而「草莓」旨在改進即將推出的「Orion(獵戶座)」,并且 OpenAI 已經(jīng)向安全監(jiān)管人員展示了「草莓」模型。較小版本的「草莓」可以以聊天機器人的形式推出。
知情人士表示:OpenAI 正在使用較大版本的「草莓」來生成用于訓練 Orion 的數(shù)據(jù)。這種人工智能生成的數(shù)據(jù)被稱為「合成數(shù)據(jù)」。這意味著「草莓」可以幫助 OpenAI 克服獲取足夠高質量數(shù)據(jù)的限制,以便利用現(xiàn)實世界的數(shù)據(jù)(例如從互聯(lián)網(wǎng)上提取的文本或圖像)訓練新模型。
當給予額外的「思考」時間時,「草莓」可以回答用戶更主觀的問題,例如產(chǎn)品營銷策略。
OpenAI 推出「草莓」是為了保持對話式人工智能或大型語言模型的霸主地位。該技術還將對未來完成多步驟任務的智能體產(chǎn)品產(chǎn)生影響。 OpenAI 希望在智能體領域開辟更多收入機會。
為什么「草莓」對「Orion」如此重要
「草莓」最重要的應用之一是為下一代旗艦大語言模型 Orion 生成高質量的訓練數(shù)據(jù)。該代號此前從未被報道過。
簡單來說,「草莓」 可以生成更高質量的訓練數(shù)據(jù)。智能體初創(chuàng)公司 Minion AI 的首席執(zhí)行官、GitHub Copilot 的前首席架構師 Alex Graveley 表示,使用「草莓」生成更高質量的訓練數(shù)據(jù)可以幫助 OpenAI 減少其模型生成的錯誤(也稱為幻覺)數(shù)量,他還指出之所以能夠做到這一點,是因為「訓練數(shù)據(jù)中的歧義性較少」。
這里不得不提一下,OpenAI CEO 山姆?奧特曼在五月份的一次活動中曾說道:「我們覺得我們已經(jīng)為下一個模型提供了足夠的(數(shù)據(jù)),我們做了各種各樣的實驗,包括生成合成數(shù)據(jù)。」下一個模型可能指的就是「Orion」。
OpenAI 內(nèi)部也在推動通過一種稱為蒸餾(distillation)的過程來簡化和縮小「草莓」。
現(xiàn)在還不能確定基于「草莓」的最終的產(chǎn)品將會是什么樣子,但一個顯而易見的想法是將「草莓」的推理能力融入到 ChatGPT。其結果是答案可能會更準確,但可能會更慢。
這意味著「草莓」可能不太適合用戶期望立即得到響應的需求,但非常適合對時間不太敏感的用例。
或許我們可以想象,在不久的將來,ChatGPT 用戶可以根據(jù)自身對時間的敏感程度來打開或關閉「草莓」。
今年夏天,OpenAI 已經(jīng)向安全監(jiān)管人員展示了「草莓」模型。此次演示可能是 OpenAI 努力向政策制定者提高透明度的一部分。
鑒于今年早些時候,Ilya Sutskever 等幾位安全負責人的離職,對 OpenAI 來說,技術透明將尤其重要。