成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

字節跳動最新思考模型 Seed-Thinking-v1.5 技術細節公開,4 月 17 日開放接口

人工智能
字節跳動最新思考模型 Seed-Thinking-v1.5 技術細節今日公開,該模型將于 4 月 17 日通過火山引擎開放接口供用戶體驗。

4 月 14 日消息,IT之家從豆包大模型團隊獲悉,字節跳動最新思考模型 Seed-Thinking-v1.5 技術細節今日公開,該模型將于 4 月 17 日通過火山引擎開放接口供用戶體驗。

該模型在數學、編程、科學推理等專業領域及創意寫作等通用任務中表現突出,同時,模型采用 MoE 架構,總參數 200B,激活參數為 20B,具備顯著的推理成本優勢,單位推理成本相比 DeepSeek R1 降低 50%。

  • 技術報告鏈接:https://github.com/ ByteDance-Seed / Seed-Thinking-v1.5

模型各方面具體表現:

  • 專業領域:數學推理(AIME 2024 得分 86.7,追平 OpenAI o3-mini-high)、編程競賽(Codeforces pass@8 達 55.0%,接近 Gemini 2.5 Pro)、科學推理(GPQA 得分 77.3%,接近 o3-mini-high),均達到或接近業界第一梯隊水平。
  • 通用任務:人類評估表現超 DeepSeek R1 8%,覆蓋多場景需求。
  • 成本優勢:單位推理成本相比 DeepSeek R1 降低 50%,實現性能與效率的平衡。

數據體系:融合可驗證與創意性數據

針對推理與生成任務的不同需求,團隊優化了數據處理策略:

  • 可驗證數據(如數學、代碼題):通過百萬級數據三重清洗(人工篩選 → 模型過濾 → 多模型驗證),保留 10 萬道高難度題目;設計答案整數化改造、離線沙箱驗證等機制,確保模型輸出真實推理過程;
  • 非可驗證數據(如創意寫作):基于豆包 1.5 Pro 訓練集,剔除低價值樣本,采用兩兩對比獎勵法,優化生成質量;
  • 全新評測基準:構建了超難數學數據集 BeyondAIME(100 道無答案題干題目),解決現有測試區分度不足問題。

獎勵模型:雙軌體系校準訓練方向

團隊提出雙軌獎勵機制,兼顧“對錯分明”與“見仁見智”任務:

  • 可驗證任務:開發了兩代驗證器(Seed-Verifier → Seed-Thinking-Verifier),從字符匹配升級為推理步驟逐行對比(訓練 / 測試集準確率超 99%),杜絕模型“獎勵欺騙”;
  • 非可驗證任務:引入 pairwise 對比訓練,通過千萬次“AB 測試”,捕捉人類對創意、情感等的隱性偏好,避免“眾口難調”;
  • 雙軌融合:針對混合場景設計協調機制,硬指標(對錯)與軟偏好(優劣)互補,支撐全場景訓練。

訓練方法:“監督精調 + 強化學習”雙階段優化

Seed-Thinking-v1.5 采用“打基礎 + 磨能力”的全鏈路訓練:

  • 監督精調(SFT):基于 40 萬高質量實例(30 萬可驗證 +10 萬非可驗證數據),結合人工與模型協同篩選,構建長思考鏈數據集,確保模型“像人類一樣思考”;
  • 強化學習(RL):通過三重數據引擎(可驗證 / 通用 / 混合數據)、算法創新(價值預訓練、解耦 GAE 等)以及在線數據適配技術,解決訓練不穩定、長鏈推理斷層等問題,動態調整數據分布以保持最佳訓練狀態。

訓練框架:支撐 20B MoE 的底層架構

為應對 20B MoE(總參數 200B)的復雜訓練需求,團隊優化了底層架構:

  • HybridFlow 編程模型:支持算法快速探索與分布式并行運行;
  • 流式推理系統(SRS):通過“流式推理”技術解耦模型演進與異步推理,將訓練速度提升 3 倍,萬億參數下穩定性達 95%;
  • 三層并行架構:結合張量 / 專家 / 序列并行,動態均衡負載,基于 KARP 算法優化 GPU 算力利用率。
責任編輯:龐桂玉 來源: IT之家
相關推薦

2025-04-11 12:04:58

2020-04-03 09:05:43

麻將 AI Suphx神經網絡

2023-05-08 07:20:22

Doris分析型數據庫

2023-06-25 10:19:49

模型論文

2014-05-29 09:34:25

2022-06-08 13:25:51

數據

2025-03-12 14:40:53

2011-04-18 09:35:23

Windows 8

2021-06-11 21:46:31

RocketMQ數據JSON

2015-04-13 10:12:08

Windows容器技術Nano Server

2025-01-22 16:57:32

字節跳動豆包大模型

2024-04-25 17:07:33

無源光網絡PON接入網技術

2019-05-13 08:51:53

總監技術CTO

2023-10-15 12:54:55

2019-05-06 10:51:49

總監技術場景

2013-06-26 09:42:25

技術服務器內存虛擬化

2017-11-10 08:35:06

存儲FCoE網絡

2025-05-19 09:07:00

2023-03-16 17:26:09

AI模型
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 亚洲精品1区| 国产一区二区三区在线 | 在线国产视频观看 | 国产二区精品视频 | 日韩欧美亚洲综合 | 久久精品99久久 | 久久午夜精品 | 日本三级电影在线免费观看 | 天天精品在线 | 久久国产区 | 97精品视频在线观看 | 精品成人佐山爱一区二区 | 精精国产xxxx视频在线播放 | 国产精品久久影院 | 国产亚洲欧美在线 | 欧美自拍视频 | 一区二区三区在线免费观看视频 | 亚洲精品视频免费 | 久久久影院 | 亚洲高清在线播放 | 国产精品久久久久无码av | 日韩欧美在线播放 | 国产精品久久久久久影院8一贰佰 | 日韩中文在线 | 一区二区在线观看免费视频 | 日日操日日干 | 亚洲精品www | 国产在线精品一区二区三区 | 日韩欧美视频在线 | 国产一区二区三区久久久久久久久 | 狠狠操狠狠操 | 天天色影视综合 | 日本黄色一级视频 | 成人国产精品色哟哟 | 四虎成人在线播放 | 欧美美女爱爱视频 | 国产免费拔擦拔擦8x高清 | 国产精品毛片久久久久久 | a级免费黄色片 | 亚洲a在线观看 | 欧美日韩亚洲在线 |