成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

AdaptiVocab:使用輕量級框架自適應降低LLM Token數!

發布于 2025-5-21 07:34
瀏覽
0收藏

一種叫做AdaptiVocab方法,通過詞匯表適配,在垂直領域顯著提升LLM效率,且不損失生成質量與知識能力。其輕量級特性為實際部署提供了可行方案,尤其在資源受限場景下具有重要應用價值。

AdaptiVocab:使用輕量級框架自適應降低LLM Token數!-AI.x社區

1. 研究背景與動機

  • 問題提出:大型語言模型(LLM)在通用領域表現出色,但計算成本高,尤其在自回歸解碼中每一步都需要前向傳播。
  • 領域特定需求:在專業領域(如地球科學、物理史),通用詞匯冗余,導致效率低下。傳統領域適應方法關注性能而非效率。
  • 核心思路:通過調整詞匯表(Vocabulary Adaptation),用領域相關的n-gram替換通用token,減少輸入和生成的token數量,從而提升效率。

2. 方法:AdaptiVocab框架

AdaptiVocab:使用輕量級框架自適應降低LLM Token數!-AI.x社區

2.1 詞匯修改(Vocabulary Modification)

  • 目標:用領域高頻n-gram替換低效token。
  • 算法流程

候選n-gram生成:從領域語料中提取n-gram(n≤5)。

節省分數計算:基于頻率和覆蓋范圍迭代選擇能最大減少token的n-gram。

替換策略:逐步替換原詞匯表中低頻token,避免冗余(如覆蓋重疊的n-gram)。

  • 示例:在物理史領域,將“electrodynamics”合并為一個token,減少分段。

2.2 Tokenization修補算法

  • 步驟

原tokenizer處理:先用原tokenizer分詞。

分解被替換token:將被移除的token遞歸拆分為子token。

最長匹配合并:按最長優先原則將子token合并為新的n-gram token。

  • 優勢:兼容任何tokenizer(如BPE),無需重新訓練分詞器。

2.3 嵌入初始化(Exponential Initialization)

  • 輸入嵌入:指數加權(末詞權重更高),因自回歸生成中后續處理依賴末詞。
  • 輸出嵌入:指數衰減(首詞權重更高),因生成時需優先預測完整n-gram。
  • 公式

AdaptiVocab:使用輕量級框架自適應降低LLM Token數!-AI.x社區

其中,輸入用正號,輸出用負號。

2.4 輕量微調(Lightweight Fine-Tuning)

  • 參數選擇:僅微調輸入/輸出嵌入層及首尾Transformer層,減少計算開銷。
  • 訓練成本:單GPU(RTX A6000)4小時完成,成本低廉。

3. 實驗與結果

3.1 數據集與模型

  • 數據集:M2D2中的地球科學(8.3M tokens)、物理史(8.3M tokens)、游戲與玩具(2.9M tokens)。
  • 模型:Mistral-7B-v0.3和Llama-2-7B。

3.2 評估維度

  • 效率:輸入/輸出token減少量。
  • 生成質量:LLM-as-Judge(Gemini-1.5-Pro)評分(邏輯、連貫性、語言可接受性)。
  • 人工評估:9名標注者對比生成結果。
  • 領域問答:構建開放書多選數據集(900題),評估知識保留。

3.3 主要結果

  • 效率提升:平均減少25%的token使用(輸入22.9-27.9%,輸出24.9-35.8%)。
  • 生成質量:輕量微調后與原始模型相當(如Mistral在物理史領域評分3.16 vs. 3.15)。
  • 問答性能:AdaptiVocab+FT與Vanilla+FT準確率相近(62% vs. 64%),驗證知識保留。

消融實驗

在n-gram長度測試中,n=3的詞匯片段替換效率最優,長n-gram因出現頻率低導致增益受限;嵌入初始化方法中,指數加權策略(邏輯評分2.95)顯著優于均值初始化(2.73)和隨機初始化,驗證了其基于生成任務特性的權重設計合理性;微調策略對比顯示,僅調整輸入輸出嵌入層及首尾Transformer層的輕量微調效果最佳,而LoRA適配器因參數適配位置偏差表現較差(準確率下降約5%)。

AdaptiVocab:使用輕量級框架自適應降低LLM Token數!-AI.x社區

貢獻與創新

方法層面提出首個覆蓋詞匯修改、嵌入初始化與輕量微調的端到端詞匯適配框架,解決了傳統領域適應方法忽視效率的問題;實踐層面通過單GPU低成本適配(4小時訓練)降低部署門檻,適用于低資源場景;數據層面公開構建的地球科學、物理史、游戲與玩具領域問答數據集(900題)填補了領域評測空白。

局限與未來方向

模型規模受限,僅驗證7B參數模型(如Mistral、Llama-2-7B),未探索更大模型(如70B)的適配規律;領域泛化能力待驗證,當前實驗局限于單一領域,跨領域遷移需進一步測試;技術融合潛力未充分挖掘,未來可與模型剪枝(減少參數量)、知識蒸餾(提升推理速度)等壓縮技術結合,形成效率優化組合方案。

原文鏈接:https://arxiv.org/pdf/2503.19693

本文轉載自????沐白AI筆記????,作者:楊沐白

收藏
回復
舉報
回復
相關推薦
主站蜘蛛池模板: 伊人精品久久久久77777 | 国产精品欧美日韩 | 国产精品免费视频一区 | 在线视频 中文字幕 | 国产精品成人一区二区 | 日韩一区二区三区四区五区六区 | 99日韩| 日韩视频在线观看一区二区 | 一级做a爰片久久毛片 | 国产一区二区久久 | 欧美中文字幕一区二区三区亚洲 | av中文字幕在线观看 | 国产精品美女久久久久久免费 | 亚洲欧美在线一区 | 日韩中文字幕在线观看 | 男人的天堂一级片 | 久久国产精品一区二区三区 | 亚洲欧美激情四射 | 99久久精品免费看国产四区 | 99免费 | 久久久久国产一区二区三区四区 | 国产精品久久久久久妇女 | 美女久久久久久久久 | 国产清纯白嫩初高生视频在线观看 | 国产 欧美 日韩 一区 | 日韩av网址在线观看 | 国产亚洲精品美女久久久久久久久久 | 成人性生交大片免费看中文带字幕 | 中文字幕1区2区3区 亚洲国产成人精品女人久久久 | 99在线资源 | 九九av| 女生羞羞网站 | 国产精品久久久久久久久久久久久 | 一区二区三区欧美 | 操到爽 | 欧美成人免费 | 欧美成人一区二区 | 色播99 | 九九综合| 国产欧美一级 | 青青草在线播放 |