編輯 | 言征
當地時間,1月25日,OpenAI發布了新的模型,同時降低了GPT-3.5 Turbo的價格,并為開發人員引入了管理API密鑰和了解API使用情況的新方法。
新模型包括:兩個新的嵌入模型、一個更新的GPT-4 Turbo預覽模型、一個升級的GPT-3.5 Turbo模型、一個新的文本審核模型。
模型默認情況下,發送到OpenAI API的數據將不會用于訓練或改進OpenAI模型。
1、兩個新嵌入模型,價格下降
OpenAI將引入兩種新的嵌入模型:一種是更小、高效的 text-embedding-3-small 模型,另一種是更大、更強的text-embedding-3-large 模型。
embeddings使得機器學習模型和其他算法更容易理解內容之間的關系,并執行聚類或檢索等任務。它們為ChatGPT和助手API中的知識檢索等應用程序以及許多檢索增強生成(RAG)開發工具提供了動力。
圖片
text-embedding-3-small是新一代的高效嵌入模型,與2022年12月發布的前代text-embeeding-ada-002模型相比進行了重大升級,性能更強。相較而言,多語言檢索常用基準(MIRACL)的平均得分從31.4%增加到44.0%,而英語任務常用基準(MTEB)的平均分數從61.0%增加到62.3%。
降價方面,與text-embedding-ada-002相比,text-embetting-3small的價格降低了5倍,從每1k代幣的價格0.0001美元降至0.00002美元。
text-embedding-3-large是新的下一代更大的嵌入模型,可創建高達3072個維度的嵌入,它擁有更強的性能。
將text-embedding-ada-002與text-embeeding-3-large進行比較:在MIRACL上,平均得分從31.4%增加到54.9%,而在MTEB上,平均分數從61.0%增加到64.6%。
價格上,text-embedding-3-large定價為0.00013/1k tokens。
圖片
值得一提的是,這個兩個新的嵌入模型都原生支持縮短嵌入。
使用更大的嵌入,例如將它們存儲在矢量存儲中進行檢索,通常會帶來更高的成本,比如:消耗更多的計算、內存和存儲等等。
這兩個新嵌入模型都使用了這樣一種技術進行訓練,即允許開發人員權衡使用嵌入的性能和成本。具體來說,開發人員可以通過傳遞dimensions API參數來縮短嵌入(即從序列結尾移除一些數字),而不會丟失嵌入的概念表示屬性。例如,在MTEB基準上,文本嵌入-3大嵌入可以縮短到256的大小,同時仍然優于1536大小的未縮減的text-embedding-ada-002。
這使得使用非常靈活。例如,當使用僅支持長度不超過1024個維度的嵌入的向量數據存儲時,開發人員現在仍然可以使用我們最好的嵌入模型 text-embedding-3-large ,并為維度API參數指定1024的值,這將使嵌入從3072個維度縮短,犧牲一定的準確性來換取更短、更小的向量。
2、更新的GPT-3.5 Turbo型號和更低的定價
下周,OpenAI將推出一款新的GPT-3.5 Turbo型號GPT-3.5-Turbo-0125,并將第三次降低GPT-3.5 Turbo的價格。新模型的輸入價格降低50%,降至0.0005美元/1K tokens,輸出價格降低了25%,降至0.0015美元/1K tokens。
該模型還將有各種改進,包括以請求的格式響應的準確性更高,以及修復導致非英語函數調用的文本編碼問題的錯誤。
使用固定gpt-3.5-turbo型號別名的客戶將在該型號發布兩周后自動從gpt-3.5-turbo-0613升級到gpt-3.5-durbo-0125。
3、更新GPT-4 Turbo預覽
自GPT-4 API發布以來,超過70%的GPT-4客戶請求已過渡到GPT-4 Turbo,因為開發人員利用了其更新的知識截止、更大的128k上下文窗口和更低的價格。OpenAI現在發布了一個更新的GPT-4 Turbo預覽模型,GPT-4-0125-preview。
此模型比以前的預覽模型更徹底地完成代碼生成等任務,旨在減少模型無法完成任務的“懶惰”情況。
新模型還包括對影響非英語UTF-8代的錯誤的修復。對于那些想要自動升級到新的GPT-4 Turbo預覽版本的人,還推出了一個新的GPT-1-Turbo-preview型號,它將始終指向最新的GPT4-Turbo預覽型號。
OpenAI還聲稱計劃在未來幾個月內推出GPT-4 Turbo,并實現全面上市。
4、更新審核模型
免費的Moderation API允許開發人員識別潛在的有害文本。作為正在進行的安全工作的一部分,OpenAI將發布text-moderation-007,這是其迄今為止最強大的審核模型。
5、API使用和管理API密鑰的新方法
OpenAI正在推出兩項平臺改進,以使開發人員能夠更好地了解他們對API密鑰的使用和控制。
首先,開發人員現在可以從API密鑰頁面為API密鑰分配權限。例如,可以為密鑰分配只讀訪問權限以為內部跟蹤面板供電,或者將其限制為僅訪問某些端點。
其次,使用情況儀表板和使用情況導出功能現在在啟用跟蹤之后公開API關鍵級別上的度量。這使得查看每個功能、團隊、產品或項目級別的使用情況變得簡單,只需為每個功能、小組、產品或工程級別分別提供單獨的API鍵即可。
在接下來的幾個月里,OpenAI計劃進一步提高開發人員查看API使用情況和管理API密鑰的能力。
原文鏈接:https://openai.com/blog/new-embedding-models-and-api-updates