成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

<center id="ks6ym"><noscript id="ks6ym"></noscript></center>

<s id="ks6ym"><tbody id="ks6ym"></tbody></s>

<kbd id="ks6ym"><optgroup id="ks6ym"></optgroup></kbd>

鴻蒙開發者社區

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發者社區

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發者社區訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業版APP

鴻蒙開發者社區視頻號

51CTO軟考題庫

AI.x社區

登錄/注冊
51CTO

中國優質的IT技術網站

51CTO博客

專業IT技術創作平臺

51CTO學堂

IT職業在線教育平臺

Tokenizer不存在了？Meta開源BLT算法！

發布于 2024-12-18 10:52

瀏覽

0收藏

Tokenizer不存在了？Meta開源BLT算法！-AI.x社區

分詞化/tokenize 化，是模型理解自然語言的最小單元。但是一些問題，如多語言、錯別字、計算開銷等問題，基于Byte的分詞更為流行。

Meta的這個工作開源Byte Latent Transformer（BLT）的方法。

BLT 的核心思想：

直接處理原始字節：與傳統的基于詞元的模型不同，BLT 直接使用構成文本的最小數字單位-字節進行處理。這從根本上消除了對分詞的需求，避免了分詞可能帶來的誤差和局限性。
動態 patching：這是 BLT 的關鍵創新。它根據文本的復雜度將字節組合成不同長度的“patch”（可以理解為小塊）。對于簡單的字節序列，BLT 會使用較大的 patch，從而節省計算資源；而對于復雜的區域，則使用較小的 patch，以提高精度。這種動態調整的方式使得 BLT 能夠更有效地利用計算資源。

Tokenizer不存在了？Meta開源BLT算法！-AI.x社區

Patching（分塊）： 是BLT的核心，將原始字節分成更小的“塊”進行處理，優化計算效率和上下文相關性。它比傳統的分詞更靈活。

幾種常見分塊方法：

固定步長分塊：按固定大小分割字節，簡單易用，但對復雜數據效果不佳。
空格分塊：以空格為界分割，適合自然語言，但不適用于不使用空格的語言。
基于熵的分塊：根據字節的不可預測性分割，更智能，能更好地處理復雜和噪聲數據。
BPE分詞器和增量分塊：類似BPE分詞，但無需固定詞匯表，更靈活。

BLT整體架構，先使用Local Encoder 對字節轉換成patch，然后使用Latent Transformer進行語義層面的編碼學習，最后使用Local Decoder解碼出字節

Tokenizer不存在了？Meta開源BLT算法！-AI.x社區

Local Encoder，負責將原始字節數據動態分組為塊：

Tokenizer不存在了？Meta開源BLT算法！-AI.x社區

基于熵的分組：根據數據復雜程度（熵值高低）分配計算資源，高熵區域分配更多資源。
哈希n-gram嵌入：將字節序列（n-gram）哈希成特征，捕捉字符級模式，尤其適用于噪聲或多語言數據。
交叉注意力層：匯集字節信息到塊表示，捕捉局部和全局上下文。

Latent Transformer，全局處理塊表示，并根據每個塊的復雜度動態調整計算量：

自適應計算分配：不同于傳統Transformer平等對待所有token，潛在Transformer將計算力集中在復雜數據區域，例如化學公式或多語言短語比填充詞需要更多計算。
全局上下文感知：使用塊因果注意力機制處理塊，同時保持序列的整體上下文，確保高信息密度的塊對下游任務做出有意義的貢獻。

Local Decoder 將經過Latent Transformer處理的塊轉換回字節序列：

字節級解碼：保留BLT的字節級粒度，高保真地重建文本，適用于拼寫校正或低資源語言處理等需要精度的任務。
交叉注意力優化：類似于編碼器，解碼器使用交叉注意力層優化輸出，確保生成文本的連貫性和準確性。

在與 LLaMA 3 等領先模型進行評估時，BLT 在效率和準確性方面都表現出非常好的性能，MMLU，HellaSwag，Noisy and Real-World Inputs等相比llama3都獲得了更好的結果。

Tokenizer不存在了？Meta開源BLT算法！-AI.x社區

通過摒棄分詞并采用基于字節的建模方法，BLT 解決了目前長期存在的一些問題：

提供了跨語言和文字的一致性表現。
確保了在處理真實世界中混亂、嘈雜的數據時的魯棒性。
顯著降低計算成本，使得更大規模、更復雜的 NLP 應用成為可能。

本文轉載自 ??NLP前沿??，作者： ??NLP前沿??

標簽

已于2024-12-18 10:54:01修改

贊

收藏

回復

舉報

回復

相關推薦

萬引大神: 機器學習不存在了

ceesoft ? 3116瀏覽 ? 0回復
Meta公司開源大數據模型SAM實戰演練

51CTO內容精選 ? 3280瀏覽 ? 0回復
Meta開源用于數學等復雜推理AI Agent—HUSKY

Aceryt ? 2799瀏覽 ? 0回復
HCCL開源了！華為集合通信庫開源鏈接、拓撲算法、常用接口

愛串門的小馬駒 ? 2974瀏覽 ? 0回復
Meta剛開源llama 3.2多模態，就被打敗了！

NLP前沿1 ? 3014瀏覽 ? 0回復
Meta開源多模態模型——Llama 3.2

Aceryt ? 3012瀏覽 ? 0回復
LLM實踐系列-詳談Tokenizer訓練細節

NLP工作站 ? 3523瀏覽 ? 0回復
騰訊放大招，超Meta！史上參數最大，開源專家混合模型

Aceryt ? 2175瀏覽 ? 0回復
Meta開源“記憶層”，重塑Transformer架構大模型

Aceryt ? 2430瀏覽 ? 0回復
Meta開源多模式模型，輕松混合文本和語音

Aceryt ? 1971瀏覽 ? 0回復
OmniTokenizer-視覺tokenizer生成

shizhi02 ? 2006瀏覽 ? 0回復
Agent不存在了？誰說必須用 Agent！

探索AGI ? 2234瀏覽 ? 0回復
Meta公布BLT新架構：告別token，擁抱patch

51CTO內容精選 ? 1958瀏覽 ? 0回復
Meta楊立昆引燃全民大討論：美政府有些人被洗腦了，監管讓開源變得像非法一樣！

51CTO技術棧 ? 2129瀏覽 ? 0回復
DeepSeek并非完美，訓練過程存在“深度詛咒”

Aceryt ? 2483瀏覽 ? 0回復
為了狙擊Manus，OpenAI開源了首個Agent SDK

Halo咯咯 ? 2708瀏覽 ? 0回復
DeepSeek與Qwen組團開源了模型，沖!

PaperAgent ? 1640瀏覽 ? 0回復
Meta放大招！Llama 4三大模型來襲，開源免費還超能打

Halo咯咯 ? 2520瀏覽 ? 0回復
LeCun有了新證據！大模型思考與人類思考存在本質差別

Syrupup ? 1030瀏覽 ? 0回復

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

最近發布

阿里開源VRAG-RL：定義下一代檢索增強生成 2025-06-16 07:56:18發布
RAG應用要如何吃到大模型長上下文的紅利？-LongRAG 2025-06-04 06:19:46發布

熱門推薦

AI Agents開源工具棧全解析~ 1回復

從原理到調參，小白也能讀懂的大模型微調LoRA，不懂線性代數也沒問題 0回復

Deepseek R1 0528實測：性能直逼頂尖，普通電腦本地運行全攻略 0回復

本命周！MiniMax M1有多猛？網友：僅用40k思考預算就干翻Gemini，實測：真·超DS！ 1回復

DeepSeek 新模型 R1-0528 悄悄開源，與o3 相當，實測來了 0回復

上一篇： OpenAI VS Deepmind：年度最大AI對決！

下一篇： Anthropic最新研究，Claude學會“演戲”了！

社區精華內容

目錄

主站蜘蛛池模板：国产福利久久 | 中文字幕在线视频一区二区三区 | 国产美女网站 | 国产免费视频 | 91亚洲国产成人精品一区二三 | 欧美视频区 | 国产香蕉视频在线播放 | 免费黄色在线 | 综合第一页 | 日本三级日产三级国产三级 | 成人免费小视频 | 人人人人爽| 欧美激情国产精品 | 视频一区二区中文字幕日韩 | 99福利视频 | 黄视频在线网站 | 免费观看一级毛片 | 日韩免费一区 | 国内久久精品 | 视频一区二区三区四区五区 | 91精品久久久久久久 | 亚洲欧美一区二区三区国产精品 | 国产三级日本三级 | 九九九视频在线 | 男人的天堂在线视频 | 欧美激情亚洲天堂 | 日本精品999| 视频在线一区 | 91麻豆精品国产91久久久久久久久 | 日韩视频一区二区三区 | 97视频免费 | 国产精品日产欧美久久久久 | 欧美a免费 | 日日干夜夜操 | 日本午夜在线视频 | 一级全黄视频 | 人和拘一级毛片c | 亚洲国产激情 | 国产亚洲精品精品国产亚洲综合 | 欧美综合视频在线 | 天天干天天想 |

<code id="0ckqu"><source id="0ckqu"></source></code>

<button id="0ckqu"></button>

<table id="0ckqu"></table>

<li id="0ckqu"><optgroup id="0ckqu"></optgroup></li>

<bdo id="0ckqu"><th id="0ckqu"></th></bdo>

<input id="0ckqu"><pre id="0ckqu"></pre></input>