成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

<option id="4oy4m"><menu id="4oy4m"></menu></option>

<table id="4oy4m"><small id="4oy4m"></small></table>

鴻蒙開發者社區

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發者社區

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發者社區訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業版APP

鴻蒙開發者社區視頻號

51CTO軟考題庫

賬號設置退出

字節Seed提出序貫策略優化方法，突破同傳“質量-延遲”權衡問題

2025-06-19 08:49:00

人工智能新聞

香港中文大學、字節跳動Seed和斯坦福大學研究團隊出手，提出了一種面向同聲傳譯的序貫策略優化框架 (Sequential Policy Optimization for Simultaneous Machine Translation,?SeqPO-SiMT)。

AI字幕總是慢半拍，質量和延遲難以平衡是業界老問題了。

為此，香港中文大學、字節跳動Seed和斯坦福大學研究團隊出手，提出了一種面向同聲傳譯的序貫策略優化框架 (Sequential Policy Optimization for Simultaneous Machine Translation, SeqPO-SiMT)。

在70億參數（7B）規模上實現SOTA。

實驗結果顯示，SeqPO-SiMT的翻譯質量不僅優于監督微調（SFT）的離線模型及LLaMA-3-8B，其表現甚至能媲美乃至超越Qwen-2.5-7B的離線翻譯水平。

方法：SeqPO-SiMT序貫策略優化

針對以上難點，研究團隊提出SeqPO-SiMT框架。其核心思想是將同聲傳譯任務建模為一個序貫決策問題，綜合評估整個翻譯流程的翻譯質量和延遲，并對整個決策序貫進行端到端的優化。

該方法的主要特點是：它不再孤立地評估每一步決策的好壞，而是將一整句話的翻譯過程視為一個整體，即形成一個完整決策序貫，更符合人類對同傳的評估過程。

同聲傳譯采樣階段

該框架使用一個大語言模型（LLM）充當策略模型，在每個時間步t，模型會接收新的源語言文本塊，并基于已有的所有源文本和之前的翻譯歷史，來生成當前的翻譯塊。

這個決策過程可以被形式化地表示為：

該框架的一個關鍵靈活性在于，如果模型決定等待更多上下文，輸出的可以為空，其長度完全由策略模型自行決定。

優化階段

獎勵函數：對于一個batch內的第i個樣本，系統會通過一個在最終步驟T給予的融合獎勵來評估整個過程的優劣。這個獎勵同時評估翻譯質量（Quality）和延遲（Latency）。

具體而言，首先計算出原始的質量分和延遲分，然后對兩者進行歸一化處理以統一量綱得到和，最終的獎勵被定義為：

其中，是一個超參數，用于權衡質量與延遲的重要性。

優化目標：模型的最終優化目標最大化期望獎勵，同時為了保證訓練的穩定性，目標函數中還引入了KL散度作為約束項，防止策略模型與參考模型偏離過遠。

這個結合最終獎勵和穩定性約束的優化過程，使得模型能夠端到端地學會一個兼顧翻譯質量與延遲的最優策略：

結果與分析：翻譯質量媲美Qwen-2.5-7B離線翻譯水平

研究團隊在多個公開的英漢互譯測試集上進行了實驗，并與多種現有同傳模型進行對比。實驗結果顯示：在低延遲水平下，SeqPO-SiMT框架生成的譯文質量相較于基線模型有明顯提升。

與多個高性能模型的離線翻譯結果進行對比，結果顯示，SeqPO-SiMT的翻譯質量不僅優于監督微調（SFT）的離線模型及LLaMA-3-8B，其表現甚至能媲美乃至超越Qwen-2.5-7B的離線翻譯水平。這表明該方法在70億參數（7B）規模上實現了業界頂尖（SoTA）的性能。

SeqPO-SiMT為解決同聲傳譯中的“質量-延遲”權衡問題提供了一個新的視角，它強調了對決策“序貫”進行整體優化的重要性。該方法對于需要進行實時、連續決策的自然語言處理任務具有一定的參考意義，并為未來開發更高效、更智能的同聲傳譯系統提供了有價值的探索。

論文鏈接：https://arxiv.org/pdf/2505.20622

責任編輯：張燕妮來源：量子位

模型優化 LLM

51CTO技術棧公眾號

業務
速覽

媒體

51CTO CIOAge HC3i

社區

51CTO博客鴻蒙開發者社區 AI.x社區

教育

51CTO學堂精培企業培訓 CTO訓練營

主站蜘蛛池模板：精品久久久久久久久久久 | 久久99精品久久久水蜜桃 | 激情五月婷婷丁香 | 国产精品99久久久久久宅男 | 国产视频1区 | 黑人精品 | 国产精品一区二区三区在线播放 | 亚洲天堂一区二区 | 亚洲欧美在线一区 | 九九伊人sl水蜜桃色推荐 | 免费一区二区 | 欧美黑人国产人伦爽爽爽 | 成人免费视频观看 | 欧美精品综合 | 精品久久久久久亚洲精品 | 国产免费自拍 | 男女羞羞视频免费 | 久久久久久久久久久91 | 精品日韩欧美一区二区 | 午夜激情一区 | 亚洲www啪成人一区二区麻豆 | 91在线视频观看 | 97av视频在线 | 91精品国产91久久久久久吃药 | 亚洲黄色网址视频 | 你懂的在线视频播放 | 成年人视频在线免费观看 | 日韩在线视频一区 | 免费看的黄网站 | 拍戏被cao翻了h承欢 | 精品欧美 | 日韩欧美视频在线 | 久草在线免费资源 | 精品久久久久一区二区国产 | 永久看片 | 天天干天天爱天天爽 | 在线中文字幕日韩 | 久久三区 | 成人a视频片观看免费 | 亚洲国产精品人人爽夜夜爽 | 成人激情视频在线观看 |

<s id="okwqu"><input id="okwqu"></input></s><sup id="okwqu"><tbody id="okwqu"></tbody></sup>

<input id="okwqu"><nav id="okwqu"></nav></input>

<s id="okwqu"><em id="okwqu"></em></s>