成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

字節Seed提出序貫策略優化方法,突破同傳“質量-延遲”權衡問題

人工智能 新聞
香港中文大學、字節跳動Seed和斯坦福大學研究團隊出手,提出了一種面向同聲傳譯的序貫策略優化框架 (Sequential Policy Optimization for Simultaneous Machine Translation,?SeqPO-SiMT)。

AI字幕總是慢半拍,質量和延遲難以平衡是業界老問題了。

為此,香港中文大學、字節跳動Seed和斯坦福大學研究團隊出手,提出了一種面向同聲傳譯的序貫策略優化框架 (Sequential Policy Optimization for Simultaneous Machine Translation, SeqPO-SiMT)。

在70億參數(7B)規模上實現SOTA。

圖片

實驗結果顯示,SeqPO-SiMT的翻譯質量不僅優于監督微調(SFT)的離線模型及LLaMA-3-8B,其表現甚至能媲美乃至超越Qwen-2.5-7B的離線翻譯水平。

方法:SeqPO-SiMT序貫策略優化

針對以上難點,研究團隊提出SeqPO-SiMT框架。其核心思想是將同聲傳譯任務建模為一個序貫決策問題,綜合評估整個翻譯流程的翻譯質量和延遲,并對整個決策序貫進行端到端的優化。

該方法的主要特點是:它不再孤立地評估每一步決策的好壞,而是將一整句話的翻譯過程視為一個整體,即形成一個完整決策序貫,更符合人類對同傳的評估過程。

同聲傳譯采樣階段

該框架使用一個大語言模型(LLM)充當策略模型圖片,在每個時間步t,模型會接收新的源語言文本塊圖片,并基于已有的所有源文本圖片和之前的翻譯歷史圖片,來生成當前的翻譯塊圖片

這個決策過程可以被形式化地表示為:圖片

該框架的一個關鍵靈活性在于,如果模型決定等待更多上下文,輸出的圖片可以為空,其長度完全由策略模型圖片自行決定。

圖片

優化階段

獎勵函數:對于一個batch內的第i個樣本,系統會通過一個在最終步驟T給予的融合獎勵圖片來評估整個過程的優劣。這個獎勵同時評估翻譯質量(Quality)和延遲(Latency)。

具體而言,首先計算出原始的質量分圖片和延遲分圖片,然后對兩者進行歸一化處理以統一量綱得到圖片圖片,最終的獎勵被定義為:圖片

其中,圖片是一個超參數,用于權衡質量與延遲的重要性。

優化目標:模型的最終優化目標最大化期望獎勵圖片,同時為了保證訓練的穩定性,目標函數中還引入了KL散度作為約束項,防止策略模型圖片與參考模型圖片偏離過遠。

這個結合最終獎勵和穩定性約束的優化過程,使得模型能夠端到端地學會一個兼顧翻譯質量與延遲的最優策略

圖片

圖片

結果與分析:翻譯質量媲美Qwen-2.5-7B離線翻譯水平

研究團隊在多個公開的英漢互譯測試集上進行了實驗,并與多種現有同傳模型進行對比。實驗結果顯示:在低延遲水平下,SeqPO-SiMT框架生成的譯文質量相較于基線模型有明顯提升。

圖片

與多個高性能模型的離線翻譯結果進行對比,結果顯示,SeqPO-SiMT的翻譯質量不僅優于監督微調(SFT)的離線模型及LLaMA-3-8B,其表現甚至能媲美乃至超越Qwen-2.5-7B的離線翻譯水平。這表明該方法在70億參數(7B)規模上實現了業界頂尖(SoTA)的性能

圖片

SeqPO-SiMT為解決同聲傳譯中的“質量-延遲”權衡問題提供了一個新的視角,它強調了對決策“序貫”進行整體優化的重要性。該方法對于需要進行實時、連續決策的自然語言處理任務具有一定的參考意義,并為未來開發更高效、更智能的同聲傳譯系統提供了有價值的探索。

論文鏈接:https://arxiv.org/pdf/2505.20622

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-04-29 09:10:00

2023-09-20 08:37:33

語音翻譯同傳翻譯

2015-07-02 11:17:30

MySQLSlave延遲優化

2025-01-22 09:48:07

2014-11-27 10:30:38

云管理企業云云管理工具

2021-07-16 23:01:03

SQL索引性能

2025-05-12 09:00:00

2025-01-23 17:07:07

2021-07-26 18:23:23

SQL策略優化

2023-12-03 08:57:54

開源模型

2023-12-04 13:23:00

數據訓練

2022-11-21 18:00:26

GraphQLAPI開發

2017-12-28 08:48:53

DRAM延遲問題

2024-01-16 17:17:30

模型訓練

2024-11-11 10:34:55

2013-09-23 09:18:16

云網絡延遲云網絡內容交付網絡

2024-05-24 08:59:15

2021-10-23 09:20:39

AI

2024-09-30 14:40:00

AI強化學習框架

2023-07-09 15:20:00

緩存平衡性能
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 精品久久久久久久久久久 | 久久99精品久久久水蜜桃 | 激情五月婷婷丁香 | 国产精品99久久久久久宅男 | 国产视频1区 | 黑人精品 | 国产精品一区二区三区在线播放 | 亚洲天堂一区二区 | 亚洲欧美在线一区 | 九九伊人sl水蜜桃色推荐 | 免费一区二区 | 欧美黑人国产人伦爽爽爽 | 成人免费视频观看 | 欧美精品综合 | 精品久久久久久亚洲精品 | 国产免费自拍 | 男女羞羞视频免费 | 久久久久久久久久久91 | 精品日韩欧美一区二区 | 午夜激情一区 | 亚洲www啪成人一区二区麻豆 | 91在线视频观看 | 97av视频在线 | 91精品国产91久久久久久吃药 | 亚洲黄色网址视频 | 你懂的在线视频播放 | 成年人视频在线免费观看 | 日韩在线视频一区 | 免费看的黄网站 | 拍戏被cao翻了h承欢 | 精品欧美 | 日韩欧美视频在线 | 久草在线免费资源 | 精品久久久久一区二区国产 | 永久看片 | 天天干天天爱天天爽 | 在线中文字幕日韩 | 久久三区 | 成人a视频片观看免费 | 亚洲国产精品人人爽夜夜爽 | 成人激情视频在线观看 |