成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

傳統(tǒng)RAG涼涼?多模態(tài)RAG帶來工業(yè)級(jí)革命

發(fā)布于 2024-10-30 15:23
瀏覽
0收藏

論文筆記分享,標(biāo)題Beyond Text: Optimizing RAG with Multimodal Inputs for Industrial Applications

多模態(tài)VL模型很早的就進(jìn)入了這個(gè)圈子,早的有LLava,近一點(diǎn)的gpt4o。這個(gè)內(nèi)容的主要想論證一個(gè)事情,在工業(yè)界,同時(shí)包含文本和圖像的RAG系統(tǒng),相比于單文本的 RAG 系統(tǒng)會(huì)提高整體性能?

當(dāng)然這個(gè)問題的結(jié)論是,會(huì)提高,所以還額外做了一些,優(yōu)化多模態(tài)流程探索的工作。

首先,多模態(tài)的結(jié)合,2種模式,一種是圖片保持不變,建立起圖片向量庫;另一種是圖片會(huì)提取出摘要描述用于召回。 分別對(duì)應(yīng)了下圖

傳統(tǒng)RAG涼涼?多模態(tài)RAG帶來工業(yè)級(jí)革命-AI.x社區(qū)

比較特別的是,這個(gè)論文用到的數(shù)據(jù)是私有的,測(cè)試數(shù)據(jù)是自己標(biāo)的。 語料庫有8540 個(gè)片段,8377 張圖片。 測(cè)試數(shù)據(jù)由專業(yè)人士標(biāo)注100個(gè)問答對(duì)。

考慮到,這里多模態(tài),現(xiàn)有的評(píng)測(cè)框架不夠用了,所以他們開發(fā)并開源了一個(gè)評(píng)測(cè)框架,具體的維度還是老幾樣,正確性,相關(guān)性,事實(shí)性等等。地址在:https://github.com/riedlerm/multimodal_rag_for_industry

評(píng)測(cè)結(jié)論如下圖,就看下圖左一,關(guān)注框框的對(duì)比把

  • 僅僅使用圖片的RAG,不管是不是摘要,效果基本都不如baseline  no rag
  • 使用text only的RAG系統(tǒng)已經(jīng)是個(gè)非常強(qiáng)的baseline了

多模態(tài)的RAG有潛力,但是很難打敗基于純文本的,但是如果圖片檢索厲害的話,還是能起飛的(黃框)

傳統(tǒng)RAG涼涼?多模態(tài)RAG帶來工業(yè)級(jí)革命-AI.x社區(qū)

最后,在多模態(tài)RAG中,基于圖片摘要向量的比圖像直接做向量的,大部分指標(biāo)都表現(xiàn)的好,受限于多模態(tài)向量的潛能,文本向量模型目前表現(xiàn)更好,也限制了這方面的發(fā)揮。總的來說,未來可期。

傳統(tǒng)RAG涼涼?多模態(tài)RAG帶來工業(yè)級(jí)革命-AI.x社區(qū)

本文轉(zhuǎn)載自 ??NLP前沿??,作者: 熱愛AI的

收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦
主站蜘蛛池模板: 日韩av成人| 99热都是精品 | 亚洲一区二区三区在线视频 | 国产a级毛毛片 | 国产精品视频一二三 | 天天操天天操 | 一本一道久久a久久精品蜜桃 | 久久久久久国产精品免费免费狐狸 | 国产一区二区三区在线 | 天天草草草| 精品久久久久久亚洲综合网 | 九九热在线视频免费观看 | 天天爱天天操 | 亚洲一区 中文字幕 | 狠狠干综合视频 | 国产中文字幕在线 | 欧美成人激情视频 | 成人一区二区三区在线观看 | 亚洲成av片人久久久 | 超碰97人人人人人蜜桃 | 日本在线中文 | 亚洲国产精品va在线看黑人 | 亚洲视频一区在线播放 | 日韩欧美在线播放 | 久久精品亚洲精品国产欧美 | 亚洲欧美日韩国产 | 伊人精品 | 国产精品亚洲第一区在线暖暖韩国 | 五月婷婷在线播放 | 羞视频在线观看 | 久久久www成人免费精品 | 精品视频一区二区 | 国产精品久久久久久久久久免费看 | 亚洲日本视频 | 国产精品自产av一区二区三区 | 在线免费亚洲视频 | 久久成人免费 | 国产精品久久久乱弄 | 91偷拍精品一区二区三区 | 欧美日韩国产综合在线 | 91精品国产欧美一区二区 |