成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

<tr id="2moag"><center id="2moag"></center></tr>

<button id="2moag"><strong id="2moag"></strong></button>

<code id="2moag"><sup id="2moag"></sup></code>

鴻蒙開發者社區

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發者社區

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發者社區訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業版APP

鴻蒙開發者社區視頻號

51CTO軟考題庫

AI.x社區

登錄/注冊
51CTO

中國優質的IT技術網站

51CTO博客

專業IT技術創作平臺

51CTO學堂

IT職業在線教育平臺

為什么有了大模型還需要用Embedding模型？

發布于 2024-12-27 14:05

瀏覽

0收藏

不知道大家有沒有想過這個問題？

我這兩天對這個問題還深入思考了一下，思考的初衷是來源于現在這么多的開源大模型，而且挺多是多模態場景，而Embedding模型相對單模且英文語料居多，如果能復用大模型的output layer，是不是會加速手頭上的實驗進展。

為什么有了大模型還需要用Embedding模型？-AI.x社區

但思考后覺得效果應該是比不上原生的Embedding模型，有空再專門測試一下看看。

可能主要有以下幾點原因：

像LLM模型都是預測next token，那么針對next token的預測，模型肯定更加關注在這個token附近的信息，那么對應這個Embedding也更多是這附近的局部信息。而我們需要的Embedding表征，是輸入句子的全局表征，而不是“你好嗎，我吃飯了，你可以出來了嗎？”這句話里，對其中“你可以出來了嗎”做的局部信息特征映射。
目前比較好的Embedding模型都用到了對比學習，這種學習方式能夠更精確地學習的全局Eembedding特征，如果用LLM也可以在下游接一個自監督訓練器，效果也會很不錯，就是成本有點高。最近有一篇paper也可供參考：《Improving Text Embeddings with Large Language Models》

為什么有了大模型還需要用Embedding模型？-AI.x社區

對比學習目標是，學習一個這樣的特征提取器，在它提取的特征所構建的 embedding 空間中，同類樣本的 embedding 互相靠近，而不同類樣本的embedding相互遠離。通常，同類樣本對互稱為正樣本（positive sample），不同類樣本對互稱為負樣本（negative sample）。

本文轉載自 ??沐白AI筆記??，作者：楊沐白

標簽

贊

收藏

回復

舉報

回復

相關推薦

從AIGC到AGI，為什么我們需要更多的“技術信仰派”？

51CTO技術棧 ? 3999瀏覽 ? 0回復
什么是AI網關？你還需要一個嗎？

51CTO技術棧 ? 3919瀏覽 ? 2回復
什么是超參數？大模型的超參數是做什么用的？超參數和大模型參數有什么關系？

AI探索時代 ? 6282瀏覽 ? 0回復
大模型所謂的參數是什么？大模型為什么需要訓練？大模型訓練到底干了什么？

AI探索時代 ? 6899瀏覽 ? 0回復
你知道什么是微調嗎？大模型為什么要微調？以及大模型微調的原理是什么？

AI探索時代 ? 6819瀏覽 ? 0回復
大模型愛好者的福音，有了它個人電腦也可以運行大模型了

AI探索時代 ? 3870瀏覽 ? 0回復
什么是提示詞工程(prompt engineering)？為什么需要提示詞工程？

AI探索時代 ? 7088瀏覽 ? 0回復
什么是多模態大模型？為什么需要多模態大模型？

AI探索時代 ? 5231瀏覽 ? 0回復
什么是端到端(end to end)大模型，它和傳統的大模型有什么區別？其優勢與劣勢是什么？

AI探索時代 ? 4422瀏覽 ? 0回復
大模型技術進階路線，有了基礎應該怎么進階？

AI探索時代 ? 2586瀏覽 ? 0回復
什么是具身智能模型，它和普通大模型有什么區別？

AI探索時代 ? 3423瀏覽 ? 0回復
有了大模型的應用經驗之后，再談對大模型的理解

AI探索時代 ? 1754瀏覽 ? 0回復
為什么預訓練大模型要使用無監督學習的方式？

AI探索時代 ? 2894瀏覽 ? 0回復
深入理解預訓練與微調，為什么需要預訓練，什么是微調？

AI探索時代 ? 4276瀏覽 ? 0回復
為什么Transformer要用LayerNorm？

智駐未來 ? 6565瀏覽 ? 0回復
你為什么要用GraphGAG？

熵減AI ? 1973瀏覽 ? 0回復
為什么 RAG 一定需要 Rerank？

玄姐聊AGI ? 2348瀏覽 ? 0回復
為什么大模型在 OCR 任務上表現不佳？

Baihai_IDP ? 1369瀏覽 ? 0回復
為什么用Qwen3 embedding和rerank

熵減AI ? 499瀏覽 ? 0回復

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

最近發布

一文講透深入理解邏輯回歸 2025-06-17 06:35:55發布
如何有效降低機器學習模型過擬合？ 2025-06-04 07:02:18發布

熱門推薦

AI Agents開源工具棧全解析~ 1回復

從原理到調參，小白也能讀懂的大模型微調LoRA，不懂線性代數也沒問題 0回復

Deepseek R1 0528實測：性能直逼頂尖，普通電腦本地運行全攻略 0回復

本命周！MiniMax M1有多猛？網友：僅用40k思考預算就干翻Gemini，實測：真·超DS！ 1回復

DeepSeek 新模型 R1-0528 悄悄開源，與o3 相當，實測來了 0回復

上一篇：深度學習的Batchsize必須是2的n次方嗎？

下一篇：一文講清楚視覺大模型！CLIP模型論文解讀

社區精華內容

目錄

主站蜘蛛池模板：日日操视频 | 五月激情六月婷婷 | 日韩一区二区三区在线 | 一区二区三区免费 | 成人免费小视频 | 日韩精品一区二 | 欧美日韩在线一区二区 | 久久最新网址 | 中文字幕视频在线 | 精品国产一区二区三区久久狼黑人 | 亚洲一区中文字幕 | 日韩三区在线观看 | 亚洲人成人一区二区在线观看 | 中文字幕一区二区三区精彩视频 | 一区二区视频在线 | 国产乱码精品一区二区三区五月婷 | 天天草狠狠干 | 亚洲一区中文字幕 | 中文字幕av免费 | 国产免费麻豆视频 | 一二三区av | 亚洲欧美日韩在线 | 成人一区二区电影 | 免费网站在线 | 久久久av | 久久精彩视频 | 欧美日韩中文字幕在线播放 | 免费一级大片 | 国产精品日韩欧美一区二区三区 | 亚洲欧洲小视频 | 成人国产精品免费观看 | 国外成人在线视频网站 | 亚洲精品乱码久久久久久按摩观 | 精品欧美一区二区三区久久久 | 亚洲国产精品第一区二区 | 精品国产欧美一区二区 | 日韩国产中文字幕 | 亚洲精品视频在线观看视频 | 99精品国产一区二区三区 | 九九热这里 | www.久久久.com |

<input id="w64io"></input>