成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

鴻蒙開發者社區

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發者社區

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發者社區訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業版APP

鴻蒙開發者社區視頻號

51CTO軟考題庫

AI.x社區

登錄/注冊
51CTO

中國優質的IT技術網站

51CTO博客

專業IT技術創作平臺

51CTO學堂

IT職業在線教育平臺

多模態與偽多模態大模型原創

發布于 2024-9-10 09:24

瀏覽

0收藏

“ 透過現象看本質，才是最應該做的選擇 ”

對大模型了解的人應該知道，大模型是因為openAI的GPT模型爆火的，當然大模型的發展也是經過多年的發展才有了今天的地步。

在之前的文章中也介紹過，大模型的全程是大規模預訓練語言模型的簡稱，也就是說大模型剛開始是在語言處理領域大放異彩的。

因此，可以說大模型是深度學習，也就是神經網絡模型與自然語言處理相結合而產生的一種技術。

而隨著大模型在自然語言處理領域的爆發，一些技術人員開始把大模型應用到圖片處理，視頻處理等領域，后來慢慢就誕生了處理各種模態數據的模型。

到今天，多模態成為了主流。

多模態大模型

什么是多模態？

模態值得是數據類型，比如文本，圖片，視頻等；而多模態就是指能夠同時處理文本，圖片，視頻等多種模態數據的模型。

簡單來說，多模態大模型就像一個人一樣，他既會寫字認字，也會繪畫欣賞畫，他即能通過拍視頻的方式表達自己；也能看懂別人視頻所表達的思想。

而多模態大模型就是這樣，它既能看懂別人的文字，也能看懂別人的視頻，也可以把別人的視頻用語言表達出來，這就是多模態大模型。

多模態與偽多模態大模型-AI.x社區

這種實現方式，需要解決很多技術難點，比如說文本和視頻或圖片內容等多種模態數據之間的融合，模態之間的數據差異問題，數據對齊與一致性問題等。

這種實現多模態大模型的方式，叫做真多模態大模型。

但實現多模態只有這種方式嗎？

其實，還有另一種實現多模態的方式或者說方法；那就是在多個處理不同模態數據的大模型之上，構建一個虛擬的“多模態大模型”，我叫他偽多模態大模型。

簡單來說就是真實的多模態大模型就相當于一個無所不能的人，天文地理，物理化學，前知五百年后曉五百世；而偽多模態大模型，就相當于給阿斗配一個頂級智囊團，雖然阿斗什么都不懂，但他可以問啊。

多模態與偽多模態大模型-AI.x社區

就比如說，用戶輸入一段文字，這時前置模塊就可以識別出這是文本模塊，那么它就可以問其它的大模型，你們誰能處理文本，然后文本模型就會說我我我。

而如果用戶輸入一段視頻，那么前置模塊就可以找一個視頻處理的大模型，最后再通過后置的轉化模塊，把輸出數據轉化為用戶需要的格式。

這就是偽多模態，很多初創企業干的就是這種產品，他們通過集成多種類型的模型，來實現對多種模態數據的處理。

多模態與偽多模態大模型-AI.x社區

當然，這種偽多模態模型雖然在外人看來都差不多，但我們要知道它們使用的是完全不同的技術；并且，偽多模態大模型雖然能夠處理一些簡單任務，但在復雜任務中可能就沒有真正的多模態模型表現得好了。

很多東西如果不能透過表象看本質，就會導致很大的認知偏差；比如說，我們都以為語音處理的大模型，它是直接處理語音格式的數據，事實上是會有一個前置層，先把語音文件轉化為文本格式，然后再讓大模型處理。

等大模型處理完之后，再把文本格式的數據轉換為語音數據輸出，前者技術叫ASR，后者叫TTS。

本文轉載自公眾號AI探索時代作者：DFires

原文鏈接：??https://mp.weixin.qq.com/s/AXTjnpb2l1c-KeZSOpm_NA??

?著作權歸作者所有，如需轉載，請注明出處，否則將追究法律責任

標簽

贊

收藏

回復

舉報

回復

相關推薦

多模態視覺-語言大模型的架構演進

angel ? 5048瀏覽 ? 0回復
「多模態大模型」解讀 | 突破單一文本模態局限

Baihai_IDP ? 3398瀏覽 ? 0回復
什么是多模態大模型？為什么需要多模態大模型？

AI探索時代 ? 5226瀏覽 ? 0回復
多模態大模型之模態融合的注意點及難點

AI探索時代 ? 6268瀏覽 ? 0回復
多模態大模型數據分析與實踐

zhcs333 ? 4459瀏覽 ? 0回復
多模態大模型最全綜述導讀

shizhi02 ? 3090瀏覽 ? 0回復
多模態大模型中，多模態融合后怎樣知道最終結果受哪種模態影響更大？

shizhi02 ? 2326瀏覽 ? 0回復
多模態大模型：基礎架構

魯班模錘1 ? 2765瀏覽 ? 0回復
南大&阿里發布多模態大模型WINGS，解決基于LLM的多模態訓練災難遺忘問題

海因斯DK ? 3263瀏覽 ? 0回復
什么是多模態大模型

AI探索時代 ? 3700瀏覽 ? 0回復
多模態大模型Qwen2的深入了解

一起AI技術 ? 3858瀏覽 ? 0回復
多模態大模型數據構造方法

shizhi02 ? 3141瀏覽 ? 0回復
【多模態&RAG】多模態RAG ColPali實踐

大模型自然語言處理 ? 2370瀏覽 ? 0回復
如何全面評估多模態大模型能力？MLLM評測任務與指標總結

shizhi02 ? 7791瀏覽 ? 0回復
多模態大語言模型的空間智能探秘：突破與挑戰

十一月雨_55 ? 2595瀏覽 ? 0回復
EarthMarker：首個視覺提示遙感多模態大模型

AIRoobt ? 4386瀏覽 ? 0回復
醫學領域大模型與多模態大模型的綜合調查

知識圖譜科技 ? 2608瀏覽 ? 0回復
多模態理解和生成：多模態理解與生成統一獎勵模型；將獎勵模型多模態情緒識別上

AI研究前瞻 ? 2160瀏覽 ? 0回復
融合語言模型的多模態大模型研究

zhcs333 ? 2110瀏覽 ? 0回復

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

最近發布

熱門推薦

AI Agents開源工具棧全解析~ 1回復

從原理到調參，小白也能讀懂的大模型微調LoRA，不懂線性代數也沒問題 0回復

Deepseek R1 0528實測：性能直逼頂尖，普通電腦本地運行全攻略 0回復

本命周！MiniMax M1有多猛？網友：僅用40k思考預算就干翻Gemini，實測：真·超DS！ 1回復

DeepSeek 新模型 R1-0528 悄悄開源，與o3 相當，實測來了 0回復

上一篇：大模型開發之算子

下一篇：最近一段時間關于大模型技術的學習及應用的心得體會

社區精華內容

目錄

主站蜘蛛池模板：日韩伦理一区二区 | 欧区一欧区二欧区三免费 | 亚洲国产aⅴ成人精品无吗欧美激情欧美激情在线五月 | 91精品国产综合久久福利软件 | 91在线视频观看 | 69av片| 久久99精品久久久久久狂牛 | 欧美一区二区视频 | 天天曰天天曰 | 成av人电影在线 | 一区欧美| 少妇精品亚洲一区二区成人 | 日韩在线一区二区 | 产真a观专区 | 日韩高清在线观看 | 成人av免费在线观看 | 99热国产精品 | 欧美激情国产日韩精品一区18 | 四虎最新视频 | 伊人超碰在线 | 欧美精品1区2区3区精品国产欧美一区二区 | 久久激情视频 | 91免费在线视频 | 91xxx在线观看 | 国产高清性xxxxxxxx | 欧美日韩国产精品一区二区 | 国产精品99久久久久久久久久久久 | 国产三区在线观看视频 | 91亚洲国产成人久久精品网站 | 人人人人干 | 成人伊人 | 国产黄色av网站 | 在线亚洲电影 | 美女福利网站 | 在线视频亚洲 | 国产精品久久久久久久免费大片 | 精品在线一区二区 | 欧美在线视频a | 欧美日韩亚洲国产 | 日韩高清一区 | 情侣av |