OpenAI又出大招！四大更新助力AI代理框架邁向新高度原創

發布于 2025-6-9 08:34

瀏覽

0收藏

最近，AI領域的巨頭OpenAI又給我們帶來了一個重磅消息。他們在AI代理框架上進行了四項關鍵更新，這些更新不僅擴展了平臺兼容性，還提升了對語音接口的支持，并且增強了可觀察性。這些改進都是為了讓AI代理更加實用、可控和可審計，以便更好地融入現實世界的各種應用場景，無論是客戶端還是服務器端。

OpenAI又出大招！四大更新助力AI代理框架邁向新高度-AI.x社區

1. TypeScript支持：AI開發迎來新選擇

首先，OpenAI的Agents SDK現在支持TypeScript了！這意味著除了Python開發者之外，那些在JavaScript和Node.js環境中工作的開發者也可以輕松上手。TypeScript SDK與Python版本功能一致，包括以下幾個關鍵組件：

Handoffs（交接機制）：可以將執行流程路由到其他代理或進程。
Guardrails（防護欄）：運行時檢查，確保工具行為在預定義的邊界內。
Tracing（追蹤）：在代理執行過程中收集結構化遙測數據的鉤子。
MCP（模型上下文協議）：用于在代理步驟和工具調用之間傳遞上下文狀態的協議。

這一更新讓SDK與現代Web和云原生應用棧保持一致。開發者現在可以在前端（瀏覽器）和后端（Node.js）環境中使用統一的抽象來構建和部署代理。詳細的文檔可以在openai-agents-js找到。

2. RealtimeAgent：實時語音交互的“神器”

OpenAI推出了一種新的RealtimeAgent抽象，專門用于支持對延遲敏感的語音應用。RealtimeAgent擴展了Agents SDK，增加了音頻輸入/輸出、有狀態交互和中斷處理功能。

其中最值得關注的功能是Human-in-the-Loop（HITL，人在回路中）審批。這個功能允許開發者在運行時攔截代理的執行，序列化其狀態，并在繼續執行之前要求手動確認。這對于需要監督、合規檢查點或特定領域驗證的應用場景非常關鍵。

開發者可以暫停執行，檢查序列化狀態，并在保留完整上下文的情況下恢復代理。更多細節可以在OpenAI的HITL文檔中找到。

3. 實時API會話的可追溯性：讓語音代理“有跡可循”

與RealtimeAgent功能相輔相成的是，OpenAI擴展了Traces儀表板，增加了對語音代理會話的支持。現在，無論是通過SDK還是直接通過API調用發起的會話，都可以進行追蹤。

Traces界面可以可視化以下內容：

音頻輸入和輸出（流式或緩沖）
工具調用及其參數
用戶中斷和代理恢復

這為基于文本和以音頻為主的代理提供了統一的審計跟蹤，簡化了跨模態的調試、質量保證和性能調優。追蹤格式標準化，并與OpenAI的監控棧集成，無需額外的監控工具即可提供全面的可見性。更多實現細節可以在語音代理指南中找到。

4. 語音交互的優化：更自然、更流暢

OpenAI對其底層的語音到語音模型進行了更新，這些模型是實時音頻交互的核心。改進主要集中在減少延遲、提高自然度和更有效地處理中斷。

雖然模型的核心功能——語音識別、合成和實時反饋——保持不變，但這些改進讓對話系統在響應性和語調變化方面表現得更好。具體來說：

低延遲流式傳輸：在口語對話中實現更即時的輪次交替。
富有表現力的音頻生成：改進了語調和停頓的建模。
對中斷的魯棒性：代理可以優雅地響應重疊輸入。

這些變化與OpenAI支持動態、多模態環境中運行的具身化和對話型代理的總體努力相一致。

總結：邁向更模塊化、更易用的AI代理生態

這四項更新共同加強了構建語音支持、可追溯且對開發者友好的AI代理的基礎。通過與TypeScript環境的深度集成，引入實時流程中的結構化控制點，以及增強可觀察性和語音交互質量，OpenAI繼續朝著更模塊化和互操作性強的代理生態系統邁進。

這些更新不僅僅是技術上的進步，更是OpenAI在推動AI技術走向實用化、普及化道路上的重要一步。無論是開發者還是最終用戶，都將從這些改進中受益。未來，OpenAI還會帶來哪些驚喜？讓我們拭目以待！

本文轉載自??Halo咯咯??? 作者：基咯咯

?著作權歸作者所有，如需轉載，請注明出處，否則將追究法律責任

標簽

OpenAI

AI代理

AI代理框架

贊

回復

舉報

回復

相關推薦

除了唱歌，AI還能替你演出？又一AI公司將虛擬人推到新高度

輕薄滴假象 ? 3226瀏覽 ? 0回復
AI時代新風口！吳恩達親授智能體四大設計模式

duhorse ? 4376瀏覽 ? 0回復
LAPTOP-Diff：剪枝蒸餾新高度（哈工大&OPPO）

angel ? 3506瀏覽 ? 0回復
Agent四大范式 | 綜述：全面理解Agent工作原理

大語言模型論文跟蹤 ? 7744瀏覽 ? 0回復
AI四大方向分布生成可信永續

數字化助推器 ? 3228瀏覽 ? 0回復
AI大模型技術的四大核心架構演進之路

AIGC觀察者 ? 3840瀏覽 ? 0回復
RAG 開發四大痛點及解決方案

玄姐聊AGI ? 3135瀏覽 ? 0回復
Transformer 動畫揭秘：數據處理的四大關鍵技術

玄姐聊AGI ? 2490瀏覽 ? 0回復
TensorFlow 2.17：深度學習框架的新高度

sword_hero ? 2666瀏覽 ? 0回復
史上首個AI+人類大合唱，ChatGPT語音模式玩出新高度！

Aceryt ? 4065瀏覽 ? 0回復
人工智能新高度：GLM-4-Plus，智譜AI打造媲美GPT-4o的基座大模型

穿越時空111 ? 5323瀏覽 ? 0回復
GPT - SoVITS 如何憑借零樣本、少樣本及多語言功能解鎖語音合成新高度？

穿越時空111 ? 4846瀏覽 ? 0回復
顛覆性語音合成：Fish Agent v0.1 3B 引領多語言語音合成新高度

Halo咯咯 ? 2939瀏覽 ? 0回復
騰訊發布全新混元大模型Hunyuan-Large：全球最大開源Transformer模型，助力AI發展新高度

Halo咯咯 ? 2827瀏覽 ? 0回復
大語言模型邁向通用人工智能（AGI）征程全面綜述：四大核心要素必不可少！

十一月雨_55 ? 3832瀏覽 ? 0回復
2025 AI Infra展望：重塑基礎設施的四大關鍵趨勢

唐克 ? 3456瀏覽 ? 0回復
大推理模型DeepSeek-R1深度解讀：成本降低95%，推動語言模型推理效率新高度

風云2002_1 ? 1.2w瀏覽 ? 0回復
從零到一構建Agent系統：四大模塊 + 框架生態詳解

PyTorch研習社 ? 2655瀏覽 ? 0回復
StyleAR突破AI繪圖新高度：單張圖+提示詞，完美復刻任意風格！

zhangyannni ? 790瀏覽 ? 0回復

Halo咯咯

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

51CTO

51CTO博客

51CTO學堂

OpenAI又出大招！四大更新助力AI代理框架邁向新高度原創

1. TypeScript支持：AI開發迎來新選擇

2. RealtimeAgent：實時語音交互的“神器”

3. 實時API會話的可追溯性：讓語音代理“有跡可循”

4. 語音交互的優化：更自然、更流暢

總結：邁向更模塊化、更易用的AI代理生態

目錄

成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

51CTO

51CTO博客

51CTO學堂

OpenAI又出大招！四大更新助力AI代理框架邁向新高度 原創

1. TypeScript支持：AI開發迎來新選擇

2. RealtimeAgent：實時語音交互的“神器”

3. 實時API會話的可追溯性：讓語音代理“有跡可循”

4. 語音交互的優化：更自然、更流暢

總結：邁向更模塊化、更易用的AI代理生態

目錄

OpenAI又出大招！四大更新助力AI代理框架邁向新高度原創