GPT-4.1深夜炸場!API專供的“開發者福音”,價格打下來了!小而強大,百萬token上下文,GPT-4.5尷尬了 原創
本周,OpenAI 再次放出大招。
按照慣例,首日更新往往最重磅。而這一次,OpenAI 在預告中就明確點名:這是一款為開發者準備的硬核模型,并用一個形象的比喻預熱它——“開發者 ?? 超大質量黑洞”。
圖片
OpenAI 深夜官宣的 GPT-4.1,確實名副其實。
百萬 Token 的上下文窗口和顯著增強的編程能力,讓它成為開發者眼中的“智能協作者”——能吞下整本文檔、分析復雜代碼、生成完整模塊,真正實現從“助理”到“代理”的躍升。
圖片
GPT-4.1 在以下行業標準指標方面表現出色:
- 編程能力:在 SWE-bench Verified 測試中,GPT-4.1 取得了 54.6% 的得分,較 GPT-4o 提升了 21.4 個百分點,較 GPT-4.5 提升了 26.6 個百分點,成為領先的編程模型。
- 指令遵循能力:在 Scale 的 MultiChallenge 基準測試中,GPT-4.1 得分為 38.3%,比 GPT-4o 提高了 10.5 個百分點,顯示出更強的指令理解和執行能力。
- 長上下文處理能力:在 Video-MME 的“長視頻無字幕”類別中,GPT-4.1 取得了 72.0% 的得分,較 GPT-4o 提升了 6.7 個百分點,樹立了多模態長上下文理解的新標桿。
圖片
這一次,OpenAI 不止推出了標準版,還同步上線了 mini 和 nano 兩個輕量模型:
- GPT-4.1:面向復雜任務,是編程和指令任務的主力。
- GPT-4.1 mini/nano:適合對響應速度和成本敏感的場景,如補全、分類、數據提取等。
正如 OpenAI 所言:“并非所有任務都需要最高水平的智能。”
對于企業客戶和開發者來說,定價可能才是最大的驚喜:
- GPT-4.1 比前代成本低 26%,百萬輸入/輸出 tokens 分別為 2 美元、8 美元;
- mini 版分別為 0.40 和 1.60 美元;
- nano 更低至 0.10 和 0.40 美元,成為最便宜的大模型之一。
更重要的是,OpenAI 還推出了 Prompt 緩存機制,支持最多 75% 的折扣,顯著降低調用頻繁時的成本。
不過,對國內開發者來說有個小挑戰:
OpenAI 同時上線了“API 組織驗證”機制,未來使用最先進模型需完成 Verified Organization 認證。
目前我們還不是支持該驗證流程的地區,可能在直接訪問上受限。唉,又close上了。
在OpenAl,我們認真對待我們的責任,確保AI既廣泛可及又安全使用。不幸的是,一小部分開發者故意違反我們的使用政策,使用OpenAl的API。我們正在添加驗證流程,以減少A的不安全使用,同時繼續向更廣泛的開發者社區提供先進模型。
超越GPT-4.5:性能、調用、可靠性全面升級
GPT-4.1 的出現,直接讓 GPT-4.5 失寵。
OpenAI 明確表示,GPT-4.1 是一款高性價比的旗艦模型,在多個關鍵能力上不輸甚至優于 GPT-4.5,而成本和延遲卻更低。因此,OpenAI 已計劃在 2025 年 7 月 14 日從 API 中移除 GPT-4.5,全面轉向 GPT-4.1 系列。
換言之,GPT-4.1 的出現讓 OpenAI 主動淘汰了自家最大最貴的模型,可見其對 GPT-4.1 實力與效率的信心。
調用方式上,GPT-4.1 僅提供 API 版本,暫未整合入 ChatGPT。這也說明了它的定位:為開發者和企業構建的“工具模型”,而非日常聊天助手。
這意味著:
- 開發者可以將 GPT-4.1 靈活嵌入網站、應用、服務;
- 一次性傳入整個代碼庫、產品文檔、審計日志等進行分析,無需切分上下文;
- 構建 AI Agent、自動化系統更進一步。
GPT-4.1 為“編程體”而生
GPT-4.1 在編碼任務方面的表現顯著優于 GPT-4o,具體體現在以下幾個方面:
- 主動解決編碼任務:GPT-4.1 在 SWE-bench Verified 測試中得分為 54.6%,比 GPT-4o 提升了 21.4 個百分點,顯示出其在軟件工程任務中的領先能力。
- 前端編碼能力增強:模型在處理前端開發任務時表現出更高的準確性和效率,能夠更好地理解和生成相關代碼。
- 減少不必要的編輯:GPT-4.1 在生成代碼時,能夠避免多余的修改,保持代碼的簡潔性和可讀性。
- 遵循 diff 格式:模型能夠準確地生成符合 diff 格式的代碼更改,方便開發者進行版本控制和代碼審查。
- 確保工具使用的一致性:GPT-4.1 在使用開發工具和庫時,能夠保持一致性,減少因工具使用不當導致的錯誤。
在 AI 編程賽道硝煙正濃之際,OpenAI 正在悄然推進“Agent”策略。
OpenAI 向 TechCrunch 表示,“GPT-4.1 的優化完全基于開發者的實際反饋,改進聚焦在他們最關心的領域:前端開發、更少的無關修改、格式和響應結構的可靠遵循、一致的工具使用等等。所有這些改進,都讓開發者能夠構建出在真實軟件工程任務中表現更優的 AI Agent。”
訓練出能夠勝任復雜軟件工程任務的 AI 編程模型,已成為包括 OpenAI 在內的眾多科技巨頭的目標。正如 OpenAI 首席財務官 Sarah Friar 上個月在倫敦的一場技術峰會中所言,公司最終的愿景是打造出“具備代理能力的軟件工程師”(agentic software engineer)。
OpenAI 堅信,未來的模型將能夠端到端地構建完整應用,包括質量保障、bug 測試乃至文檔撰寫等環節。
寫在最后
AI 編程革命的新時代已經開啟。GPT-4.1 所體現的,不僅是模型參數和性能的提升,更是 AI 應用思路的轉變:從追求“大而全”的通用智能,走向強調高效可靠、可用性強的專精模型。
對于開發者而言,GPT-4.1 如同裝上了“超級引擎”的新工具,將幫助他們以前所未有的速度構建軟件、分析數據、解決問題。AI 作為開發助手的邊界可能將被顛覆。
另外,昨天奧特曼還在線招聘,希望有技術人員加入到更大規模的計算構建中去。那么,OpenAI的下一步,值得期待嗎?
圖片
參考鏈接:
1.https://venturebeat.com/security/openais-new-gpt-4-1-models-can-process-a-million-tokens-and-solve-coding-problems-better-than-ever/
2.https://techcrunch.com/2025/04/14/openais-new-gpt-4-1-models-focus-on-coding/
本文轉載自??51CTO技術棧??
