成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

OpenAI 發布 o1 及開發者新工具:模型升級、實時 API 優化、偏好微調等重磅更新

人工智能 新聞
OpenAI 的此次更新為開發者帶來了強大的工具和模型,旨在推動 AI 應用的創新和發展。無論你是構建新的語音應用、微調模型還是開發前沿的代理應用,這些更新都將為你帶來更大的靈活性和效率。建

OpenAI 12天發布會Day9, 今日宣布推出一系列針對開發者的強大模型、全新定制工具以及性能、靈活性和成本效益的升級,旨在助力開發者構建更智能、更強大的 AI 應用。本次更新涵蓋以下關鍵內容:

1. API 中的 OpenAI o1

OpenAI o1 模型正式在 API 中向 5 級使用用戶開放。作為 OpenAI o1-preview 的繼任者,o1 模型旨在處理復雜的、多步驟任務,并提供更高的準確性。該模型具備以下關鍵特性:

  • 函數調用: 無縫連接 o1 模型與外部數據和 API。
  • 結構化輸出: 生成可靠地遵循自定義 JSON Schema 的響應。
  • 開發者消息: 允許開發者指定模型的指令或上下文,例如定義語氣、風格和其他行為指導。
  • 視覺能力: 能夠理解圖像,為科學、制造或編碼等需要視覺輸入的領域解鎖更多應用。
  • 更低延遲: 針對給定請求,o1 模型平均使用的推理 Token 比 o1-preview 少 60%。
  • 推理力度參數: 新增 reasoning_effort API 參數,允許開發者控制模型在回答問題前的思考時間

本次發布的 o1-2024-12-17 版本是兩周前在 ChatGPT 中發布的模型的全新后訓練版本。它在基于用戶反饋的模型行為方面進行了改進,同時保持了在 o1 系統卡片中評估的前沿能力。此外,ChatGPT 中的 o1 模型也同步更新至此版本。

在多個基準測試中,o1-2024-12-17 取得了最新的技術水平,顯著提高了成本效益和性能。具體數據如下:

類別

評估指標

o1-2024-12-17

o1-preview

通用

GPQA diamond

75.7

73.3


MMLU (pass @1)

91.8

90.8

編碼

SWE-bench Verified

48.9

41.3


LiveCodeBench

76.6

52.3

數學

MATH (pass @1)

96.4

85.5


AIME 2024 (pass @1)

79.2

42.0


MGSM (pass @1)

89.3

90.8

視覺

MMMU (pass @1)

77.3


MathVista (pass @1)

71.0

事實性

SimpleQA

42.6

42.4

代理

TAU-bench (零售)

73.5


TAU-bench (航空)

54.2

圖片

此外,測試表明,o1-2024-12-17 在函數調用和結構化輸出方面顯著優于 gpt-4o

OpenAI 將逐步增加模型的訪問權限,同時努力擴展訪問范圍至其他使用級別并提高速率限制。

2. 實時 API 改進

實時 API 旨在幫助開發者創建低延遲、自然的對話體驗,適用于語音助手、實時翻譯工具、虛擬導師等應用場景。本次更新重點包括:

WebRTC 支持: 引入 WebRTC 支持,簡化跨平臺實時語音產品的構建和擴展。WebRTC 負責處理音頻編碼、流式傳輸、噪聲抑制和擁塞控制。以下是一個使用 JavaScript 集成 WebRTC 的示例代碼:

async function createRealtimeSession(localStream, remoteAudioEl, token) {
       const pc = new RTCPeerConnection();
       pc.ontrack = e => remoteAudioEl.srcObject = e.streams[0];
       pc.addTrack(localStream.getTracks()[0]);
       const offer = await pc.createOffer();
       await pc.setLocalDescription(offer);
       const headers = { Authorization: `Bearer ${token}`, 'Content-Type': 'application/sdp' };
       const opts = { method: 'POST', body: offer.sdp, headers };
       const resp = await fetch('https://api.openai.com/v1/realtime', opts);
       await pc.setRemoteDescription({ type: 'answer', sdp: await resp.text() });
       return pc;
   }

降低 GPT-4o 和 GPT-4o mini 的實時快照成本: 發布 gpt-4o-realtime-preview-2024-12-17,語音質量更高,輸入更可靠,成本降低 60%。同時,推出 GPT-4o mini 的實時版本 gpt-4o-mini-realtime-preview-2024-12-17,以更低的成本提供相同的語音體驗

更強大的響應控制:

  • 并發帶外響應: 支持后臺任務,例如內容審核或分類,而不會中斷用戶的語音交互
  • 自定義輸入上下文: 允許開發者指定哪些會話項作為模型輸入
  • 受控響應時序: 支持使用服務器端語音活動檢測(VAD),并手動觸發語音回復,從而更好地控制時序和準確性
  • 最大會話時長: 從 15 分鐘增加到 30 分鐘

3. 偏好微調

微調 API 現在支持偏好微調,使開發者可以根據用戶和開發者的偏好定制模型。該方法使用直接偏好優化(DPO)來比較模型響應對,教會模型區分偏好和非偏好輸出。偏好微調在語氣、風格和創造性等主觀任務上尤為有效。

與監督微調相比,偏好微調具有以下差異:


監督微調 (SFT)

偏好微調 (PFT)

目標

鼓勵模型生成正確的輸出

優化模型以傾向期望的行為


通過復制標記的輸出

通過加強偏好響應并降低非偏好響應的可能性

訓練數據

確切的輸入和輸出對

通過人工注釋、A/B 測試或合成數據生成的偏好和非偏好模型輸出對

用例

易于準備理想輸出的任務,例如自定義代碼格式和嚴格的正確性

對于“更好”的響應是主觀的,例如創意寫作或總結的任務更有效

偏好微調已開始與合作伙伴進行測試,并已取得令人鼓舞的成果。偏好微調將首先應用于 gpt-4o-2024-08-06,并將很快支持 gpt-4o-mini-2024-07-18。

4. Go 和 Java SDK

OpenAI 還推出了兩個新的官方 SDK,分別針對 Go 和 Java,以完善現有的 Python、Node.js 和 .NET 庫。

Go SDK: 適用于構建可擴展的 API 和后端系統。以下是 Go SDK 的示例代碼:

client := openai.NewClient()
    ctx := context.Background()
    prompt := "Write me a haiku about Golang."

    completion, err := client.Chat.Completions.New(
      ctx, 
      openai.ChatCompletionNewParams{
        Messages: openai.F(
          []openai.ChatCompletionMessageParamUnion{
            openai.UserMessage(prompt),
          },
        ),
        Model: openai.F(openai.ChatModelGPT4o),
      },
    )

Java SDK: 則適用于企業軟件開發,提供類型化的請求和響應對象,以及管理 API 請求的實用工具。以下是 Java SDK 的示例代碼:

OpenAIClient client = OpenAIOkHttpClient.fromEnv();

    ChatCompletionCreateParams params = ChatCompletionCreateParams
        .builder()
        .message(List.of(
            ChatCompletionMessageParam.ofChatCompletionUserMessageParam(
                ChatCompletionUserMessageParam
                .builder()
                .role(ChatCompletionUserMessageParam.Role.USER)
                .content(
                    ChatCompletionUserMessageParam.Content.ofTextContent(
                        "What is the origin of Java's Duke mascot?"
                    )
                )
                .build()
            )
        ))
        .model(ChatModel.O1_PREVIEW)
        .build();

    ChatCompletion chatCompletion = client.chat().completions().create(params);

總結

OpenAI 的此次更新為開發者帶來了強大的工具和模型,旨在推動 AI 應用的創新和發展。無論你是構建新的語音應用、微調模型還是開發前沿的代理應用,這些更新都將為你帶來更大的靈活性和效率。建議開發者查閱 API 文檔,開始探索和實驗這些新功能

責任編輯:張燕妮 來源: AI寒武紀
相關推薦

2024-12-18 18:29:12

2024-09-24 11:01:03

2024-09-13 10:06:21

2024-09-13 09:26:17

2025-01-23 10:45:52

2024-09-13 06:32:25

2024-10-05 00:00:00

2024-10-05 12:00:00

2024-12-05 10:16:14

2024-11-07 15:40:00

2024-12-09 11:06:31

2023-05-10 15:08:26

OpenAI語言模型人工智能

2025-02-03 14:17:27

2023-05-10 15:39:49

人工智能語言模型OpenAI

2011-05-11 08:58:48

Android 2.4Android 3.1Google I

2023-09-06 10:44:09

Nitrux 3.0工具

2024-11-29 13:57:38

2014-11-14 09:41:53

Java工具

2011-12-02 09:50:31

google

2024-09-18 09:17:00

OpenAI模型開源
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 精品视频一区二区三区 | 日韩精品一区二区在线观看 | 久久国产成人精品国产成人亚洲 | 久久99国产精品久久99果冻传媒 | 一级片视频免费 | 久久久久久91 | 欧美女优在线观看 | 欧美综合一区二区 | 综合第一页 | 国产成人精品午夜视频免费 | 国产色婷婷精品综合在线手机播放 | 伊人爽 | 亚洲视频欧美视频 | 国产伦精品一区二区三区视频金莲 | 隔壁老王国产在线精品 | 精品久久久久久亚洲精品 | 波多野结衣一区二区三区 | 四虎在线观看 | 午夜影院在线播放 | 亚洲性视频 | 日韩免费一二三区 | 国产精品日产欧美久久久久 | 欧美日韩综合视频 | 成人免费观看男女羞羞视频 | 天天干夜夜拍 | 免费 视频 1级 | 国产91在线观看 | 久久国产精彩视频 | 欧美日韩成人在线 | 免费人成激情视频在线观看冫 | 久久久国产精品一区 | 国产精品久久国产精品久久 | 天天射网站 | 一区二区视频在线 | 色视频欧美 | 欧美乱码精品一区二区三区 | 在线一级片 | 成人在线网 | www.天堂av.com | av大片 | 超碰3|