Llama 3沒能逼出GPT-5!OpenAI怒“卷”To B戰場,新企業級 AI 功能重磅推出! 原創
編譯 | 伊風
出品 | 51CTO技術棧(微信號:blog51cto)
Meta 是本周當之無愧的AI巨星!剛剛推出的 Llama 3 憑借著強大的性能和開源生態的優勢在 LLM 排行榜上迅速躍升。
按理說,Llama 3在開源的狀態下做到了 GPT-3.7 的水平,必然會顯得用戶(尤其是企業用戶,他們更具備獨立部署Llama 3的能力)花錢買來的 GPT-4 沒那么香了。網友于是紛紛拱火,“鼓勵”OpenAI 交出 GPT-5,才能繼續穩坐大模型王位。
不單單是網友,就連 OpenAI 的研究員也有點坐不住了,跑到X上發了一條含義曖昧的推文。
圖片
這下網友更加焦急地推測,性能強悍的 Llama 3 可能會擾亂 GPT-5 的發布時間表,甚至提前到4.22日。
直到周四,OpenAI的新動作才姍姍來遲。
圖片
OpenAI 重磅推出了其擴展的 API 客戶的企業級功能,進一步豐富其助手 API,并引入旨在增強安全性和行政控制以及更有效管理成本的新工具。
OpenAI對它寄予厚望:“當你與開發者和企業談論 AI 模型的有意義工作時,OpenAI 仍然領先,”OpenAI API 產品負責人 Olivier Godement說。
不過,OpenAI這一迂回作戰的策略,到底是讓很多人始料不及。“油鹽不進”的網友回復道,“你是不是把GPT-5拼錯了”?
圖片
不過,就像小扎曾在采訪里坦言,Meta會開源模型,但不會開源產品。過硬的產品才是一家企業真正的技術壁壘和現金牛。一味燒錢的時代過去了,現在的AI主旋律是探索更多的商業價值。
OpenAI在此時高調宣布升級企業級產品,足可見其在To B賽道廝殺的決心。那么這款新升級的API的能力是否能讓企業心動到為其買單呢?
1.私有鏈接和加強的安全功能
在重要的安全升級中,新的API產品引入了私有鏈接,這種安全方法允許 Microsoft 的 Azure 云服務和 OpenAI 之間進行直接通信,這有助于最小化通過 API 發送的客戶數據和查詢的“對開放互聯網的暴露”。
這一新增功能補充了現有的安全棧,包括 SOC 2 Type II 認證、單點登錄(SSO)、靜態 AES-256 數據加密、傳輸中的 TLS 1.2 加密和基于角色的訪問控制。
此外,OpenAI 引入了原生的多因素認證(MFA)以加強訪問控制,以符合日益增長的合規性需求。
對于需要 HIPAA 合規性的醫療保健公司,OpenAI 繼續提供商業伙伴協議,并為符合條件的 API 客戶提供零數據保留政策。
2.升級的助手 API,可處理 500 倍更多的文件
OpenAI 提供的一個較少宣傳但最重要的企業產品是其助手 API。它允許企業部署他們訓練的定制微調模型,并通過檢索增強生成(RAG)調用特定文檔,并提供相應的會話助手。
例如,電子商務公司 Klarna 今年早些時候夸贊其使用 OpenAI 助手 API 制作的 AI 助手,能夠完成 700 名全職人類代理的工作,重復查詢減少了 25%,解決時間幾乎減少了 82%(從 11 分鐘減少到 2 分鐘)。
OpenAI 現已升級助手 API,包括新的“file_search”功能,增強文件檢索能力,每個助手可以處理多達 10,000 個文件。
這代表了比以前限制的 20 個文件增加了 50 倍,并增加了并行查詢、改進的重新排名和查詢重寫等附加功能。
此外,API 現在支持流式傳輸,以實時會話響應——這意味著像 GPT-4 Turbo 或 GPT-3.5 Turbo 這樣的 AI 模型將盡可能快地返回輸出,而不是等待完整響應的生成。
它進一步集成了新的“vector_store”對象以更好地管理文件,并提供更細粒度的令牌使用控制,以幫助有效管理成本。
3.新功能“項目”,可控制人員對特定任務的訪問
一個名為“Projects”的新功能提供了改進的行政監督,允許組織在項目級別中管理角色和 API 密鑰。
此功能允許企業客戶限定權限、控制可用模型,并設置基于使用的限額以避免意外成本——這些增強功能承諾顯著簡化項目管理。
本質上,他們可以將一個微調版本的 AI 模型甚至一個普通的模型隔離到特定的任務或文檔集,并允許特定的人員在每個任務上工作。
因此,如果你的企業有一個團隊正在處理一組面向公眾的文檔,另一個團隊正在處理一組機密或內部文檔,你可以在 OpenAI 的 API 內為每個分配一個單獨的項目,兩者可以使用 AI 模型分別工作,而不會混合或危及后者。
“隨著越來越多的組織甚至單獨的開發者部署 AI,他們希望在受限的盒子里做事,”OpenAI 的產品團隊成員 Miqdad Jaffer 在昨天與 外媒 VentureBeat 進行的相同視頻電話采訪中說。“‘項目’讓你做的是將你的資源、你的成員隔離到一個小型的個性化項目中。你得到了單獨的使用報告。你有能力控制訪問、安全、延遲、吞吐量和成本,一個組織確實可以以非常安全的方式構建。如果你是一個單獨的開發者,你可以毫無顧慮地部署數百個項目。”
最后一點對于同時咨詢或處理多個客戶的開發團隊特別有幫助。
4.還有一些新的升級
為了進一步幫助組織以經濟方式擴展其 AI 運營,OpenAI 引入了新的成本管理功能。
這些包括為每分鐘保持一致水平的令牌使用量的客戶提供折扣率,并通過新的 Batch API 為異步工作負載提供成本降低 50%,該 API 還具有更高的速率限制,并承諾在 24 小時內提供結果。
然而,要使用它,客戶必須在單個請求中一起發送他們的令牌批次——他們想要 AI 模型分析的輸入,無論是提示還是文件——并愿意等待最多 24 小時以從 OpenAI 的 AI 模型接收響應。
雖然這看起來像是很長時間,但 OpenAI 的高管告訴 VentureBeat,返回可以快至 10-20 分鐘。
它還旨在為不需要 AI 模型即時響應的客戶和企業設計,比如一個調查記者研究長篇特寫文章,想要發送一堆政府文件讓 OpenAI 的 GPT-4 Turbo 篩選并挑選出選定的細節。
或者,一個企業準備一份報告,查看其過去幾周的財務表現,而不是幾天或幾分鐘內到期。
隨著 OpenAI 繼續增強其產品,專注于企業級安全、行政控制和成本管理,更新表明該公司有興趣為企業直接提供更“即插即用”的體驗,以應對 Llama 3 的升空和像 Mistral 這樣可能需要企業方面進行更多設置的開放模型的崛起。
參考鏈接:https://venturebeat.com/ai/openai-shrugs-off-metas-llama-3-ascent-with-new-enterprise-ai-features/
本文轉載自??51CTO技術棧??,編譯:伊風
