編輯 | 云昭
出品 | 51CTO技術棧(微信號:blog51cto)
OpenAI 又放大招了!用實力正名:在AI圈,自己的“一哥”地位不可動搖!
就在今天凌晨,OpenAI 官方開發者賬號 @OpenAIDevs 在 X 平臺上,一口氣連續發布了 4 項關鍵更新,直接把 AI 代理(Agent)開發體驗提升到新維度,圍繞 Agent 開發體驗、實時語音應用、人類干預機制和全鏈路追蹤都做了重要升級。
具體包括:推出了TypeScript 原生支持,語音代理可以實時跑,執行過程還能人工干預,全鏈路追蹤也一站搞定。
別小看這 4 個更新,它們背后透露出的,OpenAI 對于 AI Agent 產品線的定位再升級: 從“開發者玩具”,轉向升級成為“企業級 AI 工具鏈”。
所以,今天這 4 個更新,哪怕你不寫代碼,也值得關注。我們這就來細細拆一下,告訴大家為什么這么說。
Agents SDK 正式跳出 Python 圈,支持 TypeScript,前端全棧開發者福音
過去,OpenAI Agents SDK 只提供 Python 版本,對大多數前端、全棧和 Node.js 開發者不太友好。
這次,官方直接放出了 TypeScript 版本 SDK,功能完全對齊 Python 版,支持:
- handoffs(任務移交)
- guardrails(安全機制)
- tracing(執行追蹤)
- MCP(多通道代理控制)
- 以及 Agent 所需的各類基礎能力。
安裝也是非常簡單:
npm install @openai/agents
官網還給出了使用示例:
import { Agent, run } from'@openai/agents';
const agent = new Agent({
name: 'Assistant',
instructions: 'You are a helpful assistant',
});
const result = await run(
agent,
'Write a haiku about recursion in programming.',
);
console.log(result.finalOutput);
// Code within the code,
// Functions calling themselves,
// Infinite loop's dance.
可以說,OpenAI 的 AI Agent 終于從 Python 圈子里跳出來了,前端開發者也能玩轉 AI 代理。
對 AI 工具 SaaS、智能客服、網頁嵌入式 AI 助手這些場景是重大利好。
?? 官方文檔:
https://openai.github.io/openai-agents-js/
新增 Human-in-the-loop 功能,AI 調用過程可人工干預
AI 黑箱執行、無法插手,一直是企業在部署 Agent 時最大的顧慮,尤其對于
金融風控、內容審核、法務審校這些場景,可控性尤其重要。
這一次,AI 不再是一錘子買賣,OpenAI貼心地將「人類介入權」被納入了開發體系。
這次 SDK 增強了 Human-in-the-loop 功能,允許開發者:
- 在 Agent 調用工具或執行任務時,主動暫停
- 保存當前 agent 狀態
- 讓人工審核、確認或調整調用
- 再決定是否恢復執行
?? 功能指南:
https://openai.github.io/openai-agents-js/guides/human-in-the-loop/
實時語音 Agent 功能上線,實時語音代理可以跑了
第三個更新,相信適合所有在做各種 AI 助手的朋友,比如 AI 語音助手、客服機器人、播報應用等等,終于有了靠譜的官方方案。
圖片
這次新出的 RealtimeAgent 功能,基于 OpenAI 的 Realtime API,可以讓語音代理在本地客戶端或服務器端實時運行,具體可以支持:
- 和文字 agent 一樣的工具調用、任務移交、guardrails(護欄)
- 自動處理語音輸入、輸出、用戶打斷
?? 入門地址:https://openai.github.io/openai-agents-js/guides/voice-agents/
從“對話文字機器人”邁向“語音實時助手”,Agent 從文本應用進化到多模態 AI 產品,這是一個業內的共識和趨勢,所以小編認為,OpenAI 這一次的功能真的很香!
這里也給大家放一個示例:
import { z } from'zod';
import { RealtimeAgent, RealtimeSession, tool } from'@openai/agents/realtime';
const createTicket = tool({
name: 'createTicket',
description: 'Create a support ticket for a faulty laptop.',
parameters: z.object({}),
needsApproval: true,
execute: async () => 'Ticket filed!',
});
const faqAgent = new RealtimeAgent({
name: 'FAQ',
instructions: 'Answer laptop support questions concisely.',
});
const customerServiceAgent = new RealtimeAgent({
name: 'Customer Service',
instructions: 'Handle customer service inquiries, including support tickets.',
tools: [createTicket],
});
const triageAgent = new RealtimeAgent({
name: 'Triage',
instructions: 'Route laptop support questions to FAQ or customer service.',
handoffs: [faqAgent, customerServiceAgent],
});
const session = new RealtimeSession(triageAgent, {
model: 'gpt-4o-realtime-2025-06-03'
});
await session.connect({ apiKey });
Agent也有了抓手:Traces 儀表盤支持實時語音代理追蹤
為了方便開發者監控 Agent 執行過程,OpenAI 的 Traces dashboard 現在也支持實時語音代理。
圖片
可實時查看:
- 語音輸入、輸出
- 工具調用記錄
- 用戶打斷情況
- 執行鏈路
這里值得注意的是,無論通過 API 還是 Agents SDK 調用,執行過程都能清晰追蹤。
這也就意味著,企業徹查 Agent 的黑箱行為,也算是有了清晰的抓手。
寫在最后:Agent 正在成為 AI 世界的操作系統
這 4 個更新看似瑣碎,但放在一起,就是一個很清晰的信號:
AI Agent 不再是一個單點功能,而是正走向“全棧可控、支持語音、支持人類干預、過程全追溯”的企業級 AI 操作系統。
未來,客服、銷售助理、內容審核、IoT 智能設備、企業運營輔助,這些場景里,AI Agent 不僅能實時跑,執行過程還能隨時插手、隨時追蹤。
這意味著什么?
這就意味著,AI 正從“生成答案”,變成“執行任務”的超級數字勞動力。
而今天 OpenAI 的這波更新,正是為這個趨勢鋪路。
最后給大家看一下,最早一批嘗鮮該功能的 Perplexity 開發的新品效果——
參考資料:https://x.com/OpenAIDevs/status/1929950489539686901