收到郵件了吧?GPT-3.5-Turbo-Instruct發了,多模態大模型Gobi也曝光了
本月初,OpenAI 官宣了其首屆開發者大會「OpenAI DevDay」將于兩個月后召開,引發熱議。很多網友猜測 OpenAI 將在大會上發布多模態大模型,比如 GPT-4-Vision。
今天,關于 OpenAI 的多模態大模型又有了新的消息。
多模態大模型「Gobi」能成真嗎?
根據外媒 The Information 的說法,OpenAI 與谷歌正陷入一場曠日持久的大模型競賽,瞄準了下一代多模態大模型。這類模型可以處理文生圖任務、生成代碼或者輸出可視化圖表等。
OpenAI 聯合創始人兼總裁 Greg Brockman(左)與谷歌 DeepMind 聯合創始人兼 CEO Demis Hassabis(右)
在這場競賽中,谷歌幾天前被傳開始小范圍測試多模態 ML 工具 Gemini,比訓練 GPT-4 算力大 5 倍,多模態能力大大提升。谷歌希望借此扭轉與 OpenAI 在大模型領域的劣勢。但很顯然,OpenAI 不希望看到這一幕在將來發生。
據一位知情人士透露,OpenAI 正緊鑼密鼓地將 GPT-4 與類似于 Gemini 提供的多模態功能結合起來。OpenAI 雖然在 3 月份發布 GPT-4 的時候預覽了相關多模態功能,但并沒有推廣開來。幾個月后,OpenAI 又準備在更大的范圍內推出 GPT-Vision 功能,但也沒有正式發布。
至于為何遲遲沒有推出,OpenAI 主要擔心視覺功能會被人不當地使用,比如通過面部識別來跟蹤人或者冒充人類自動解決驗證碼。但隨著時間推移,OpenAI 似乎終于有能力解決由這類問題引發的技術擔憂了。
因此,在 GPT-Vision 之后,OpenAI 被曝可能會推出更加強大的多模態大模型,名為 Gobi。與 GPT-4 不同的是,Gobi 一開始就被設計為多模態。不過 OpenAI 還沒有開始訓練該模型,所以 Gobi 最終能成為 GPT-5 的定論下的還為時尚早。
此外,OpenAI 還希望搶在谷歌發布 Gemini 之前推出 Gobi。
圖源:推特 @amir
至于在這場多模態大模型之爭中,究竟誰能先拔頭籌,我們拭目以待。
OpenAI 還發布了新模型
與此同時,除了被曝出多模態大模型之外,OpenAI 還「悄咪咪」地發布了新的模型。
不少網友都收到了這封來自 OpenAI 團隊的信件。OpenAI 推出了 GPT-3.5-Turbo-Instruct,用來替代原先的一些模型,如 text-davinci-003。
該模型是 InstructGPT 3.5 類模型,并且訓練方式與之前的 Instruct 型號類似,如 text-davinci 系列,同時保持了與 turbo 模型相同的速度。該模型的定價與 GPT-3.5-turbo 4K 相同。
推特用戶 @hwchase17 說到,該版本模型可以在就舊的完成端點使用,并表示這個版本很「健談」,但是作為智能體的話并不理想。
有網友在使用過程中表示,該模型在一些情況下能更好的完成工作。例如,用戶想讓它生成較大的代碼塊時,它不會只是給出一個示例,而是直接生成一個很長的代碼。