成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

【大模型】圖解Transformers Encoder 原創

發布于 2024-9-29 11:00
瀏覽
0收藏

前面圖解了Transformer整體架構,今天圖解編碼器。

先來個整體視角:

【大模型】圖解Transformers Encoder-AI.x社區

再逐步分解開來:

????????'?? ?????? ???????????????

編碼器負責通過自注意力機制和前饋層處理輸入的 token,從而生成具有上下文感知的表示。

?? 它是 NLP 模型中理解序列的核心動力。

【大模型】圖解Transformers Encoder-AI.x社區

???????? 1.1: ?????????? ????????????????????

編碼器的第一步是將每個輸入的單詞嵌入為一個大小為 512 的向量。

?? 這種嵌入過程只發生在最底層的編碼器中。

可以把它想象成把單詞翻譯成模型能夠理解的語言!??

【大模型】圖解Transformers Encoder-AI.x社區

???????? 1.2: ???????????????????? ??????????????????

Transformer 缺乏循環結構,因此它們使用位置編碼來表示 token 的位置。

怎么實現的?

通過正弦和余弦函數的組合,模型能夠理解句子中單詞的順序!??

【大模型】圖解Transformers Encoder-AI.x社區

???????? 2: ?????????? ???? ?????????????? ????????????

編碼器是層疊的,每一層都會接收前一層的輸入,并通過多輪自注意力機制和前饋層進一步優化輸入。

這有助于更好地理解輸入的上下文!

【大模型】圖解Transformers Encoder-AI.x社區

???????? 2.1: ??????????-???????????? ????????-??????????????????

自注意力機制讓模型能夠將輸入中的每個詞與其他詞相互關聯。

注意力得分基于以下三個部分:

查詢(Query)

鍵(Key)

值(Value)

這個過程會重復多次,以便從多個角度進行理解!??

【大模型】圖解Transformers Encoder-AI.x社區

???????? 2.2: ???????????? ????????????????????????????

通過將查詢(Query)和鍵(Key)向量相乘,給每對單詞分配一個得分。

這為序列中的每個詞分配了一個相對的重要性得分,類似于根據詞與詞之間的相關性對它們進行排序!

【大模型】圖解Transformers Encoder-AI.x社區

???????? 2.3: ?????????????? ?????? ?????????????????? ????????????

這些得分會通過除以查詢(Query)和鍵(Key)向量維度的平方根進行縮放,以確保梯度的穩定性。

這樣可以防止較大的值對結果產生偏差。??

【大模型】圖解Transformers Encoder-AI.x社區

???????? 2.4: ???????????????? ??????????????

應用 softmax 函數以獲得注意力權重,強調重要的單詞,同時減弱不太相關的單詞。

這有助于集中注意力于輸入的關鍵部分!??

【大模型】圖解Transformers Encoder-AI.x社區

???????? 2.5: ?????????????????? ?????????????? ??????????????

注意力權重與值(Value)向量相乘,生成的輸出是值的加權和。

這樣就將上下文信息整合到了輸出表示中!??

【大模型】圖解Transformers Encoder-AI.x社區

???????? 2.6: ?????????????????????????? ?????? ??????????????????

編碼器中的每個子層之后都會有一個歸一化步驟和殘差連接。

這樣可以幫助緩解梯度消失問題,并確保模型在計算過程中保持平衡,為下一步做好準備!??

【大模型】圖解Transformers Encoder-AI.x社區

???????? 2.7: ????????-?????????????? ???????????? ??????????????

歸一化之后,前饋網絡會處理輸出,對上下文進行進一步的精細化調整。

這是在將信息發送到下一層之前的最后一步!??

【大模型】圖解Transformers Encoder-AI.x社區

???????? 3: ????????????

編碼器的最終輸出是一組向量,每個向量都捕捉了輸入序列的豐富上下文理解。

這些輸出已準備好被解碼,并用于各種 NLP 任務!??

【大模型】圖解Transformers Encoder-AI.x社區



本文轉載自公眾號人工智能大講堂 

原文鏈接:??https://mp.weixin.qq.com/s/2-lpJ1jsL0-7vpmPgbY8HQ???


?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
標簽
已于2024-9-29 11:04:44修改
收藏
回復
舉報
回復
相關推薦
主站蜘蛛池模板: 在线a视频 | 99精品视频在线观看 | 欧美在线一区二区三区 | 超碰在线亚洲 | 夜夜操av | 国产在线观看一区二区三区 | 激情毛片| 国产精品欧美精品日韩精品 | 精品乱码一区二区 | 99久久婷婷国产亚洲终合精品 | 欧美精品乱码久久久久久按摩 | 日日日日日日bbbbb视频 | 久久综合久久久 | 免费一区二区在线观看 | 男人午夜视频 | 国产成人精品一区二区三区四区 | 亚洲福利在线视频 | 黄频免费 | 99精品视频一区二区三区 | www.99热这里只有精品 | 久久国产99| 色视频www在线播放国产人成 | 一级黄色绿像片 | av在线天堂网 | 亚洲香蕉在线视频 | 一区二区在线免费观看 | 日韩精品在线观看免费 | 特一级黄色毛片 | 91伊人 | 天天拍天天操 | 青青久久av北条麻妃海外网 | 成人h免费观看视频 | 久久一区二区三区四区 | 99国产精品久久久久久久 | 国产精品一区一区三区 | 99久久国产免费 | 日本一区二区不卡 | 成人国产精品久久久 | 东京久久 | 亚洲在线 | 欧美日韩国产精品一区二区 |