成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

<ul id="pjnyh"><kbd id="pjnyh"><tr id="pjnyh"></tr></kbd></ul>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號矩陣

移動端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學(xué)堂

IT職業(yè)在線教育平臺

一文徹底搞懂GraphRAG

發(fā)布于 2024-9-3 11:34

瀏覽

0收藏

自ChatGPT引領(lǐng)人工智能的新潮流以來，我們見證了大型語言模型（LLM）與私有數(shù)據(jù)結(jié)合的巨大潛力。這種結(jié)合不僅催生了功能強(qiáng)大的AI應(yīng)用，也標(biāo)志著AI專業(yè)能力的提升。

然而，隨著深入探究，我們發(fā)現(xiàn)傳統(tǒng)的文本嵌入檢索技術(shù)（Text2Vec RAG）在處理知識庫問答時仍存在局限。本文闡述如何通過圖形RAG技術(shù)，有效填補(bǔ)這一空白，實(shí)現(xiàn)對知識庫的深入挖掘和全面理解。

1 局部和全局問題

文本嵌入檢索技術(shù)讓LLM應(yīng)用能夠穩(wěn)定地根據(jù)知識庫內(nèi)容回答問題。Text2Vec的優(yōu)勢在于能夠從知識庫中提取關(guān)鍵事實(shí)，直接回答用戶的問題。但這種方法也有局限，它依賴于查詢的具體性，且難以處理跨文檔的抽象問題。

想象一下，有一個詳盡的諾貝爾和平獎得主知識庫。問系統(tǒng)“2023年的諾貝爾和平獎得主是誰？”這種問題，系統(tǒng)能迅速給出答案，因為這些信息在知識庫中清晰可查。但若問“過去十年最杰出的諾貝爾和平獎得主有哪些？”系統(tǒng)就可能束手無策，尤其是當(dāng)問題需要跨文檔整合信息時。例如，用戶可能好奇“最近幾屆諾貝爾和平獎得主主要關(guān)注哪些議題？”如果這些議題在知識庫中沒有直接提及，傳統(tǒng)的文本嵌入檢索就難以給出滿意的答案。

因此，引入圖形RAG，這不僅能夠解決具體的局部問題，還能應(yīng)對需要全局視角的復(fù)雜問題。

知識圖譜通過半結(jié)構(gòu)化的層次方法組織信息，允許我們在數(shù)據(jù)集的全局層面上進(jìn)行推理，識別節(jié)點(diǎn)間的復(fù)雜關(guān)系。圖形RAG利用這種結(jié)構(gòu)，通過識別緊密相連的節(jié)點(diǎn)群體——即社區(qū)，來構(gòu)建對用戶查詢的深入理解。

圖形RAG的流程簡化為：

圖形提取：從數(shù)據(jù)中抓取節(jié)點(diǎn)和邊，形成知識圖譜。
圖形存儲：將圖譜存儲于數(shù)據(jù)庫，保證信息的管理和檢索。
社區(qū)檢測：發(fā)現(xiàn)圖中的社區(qū)，每個社區(qū)代表一個主題。
社區(qū)報告：為每個社區(qū)制作報告，梳理節(jié)點(diǎn)和邊的關(guān)系。
上下文構(gòu)建：通過Map Reduce技術(shù)整合社區(qū)信息，為用戶查詢提供精準(zhǔn)上下文。

這一流程優(yōu)化了信息檢索，對用戶復(fù)雜查詢的響應(yīng)更加精準(zhǔn)和全面。

一文徹底搞懂GraphRAG-AI.x社區(qū)

2 構(gòu)建知識圖譜：圖形提取

構(gòu)建對非結(jié)構(gòu)化知識庫的抽象理解，首先需要提取構(gòu)建知識圖譜的關(guān)鍵節(jié)點(diǎn)和邊，這一過程可以通過大型語言模型（LLM）自動化實(shí)現(xiàn)。挑戰(zhàn)在于甄別哪些概念和關(guān)系是有價值的。

例如，從一篇關(guān)于沃倫·巴菲特的文章中提取信息，他的持股和出生地等信息顯然是關(guān)鍵實(shí)體和邊，而他上次董事會會議上領(lǐng)帶的顏色則可能無關(guān)緊要。關(guān)鍵在于根據(jù)應(yīng)用場景和領(lǐng)域定制提取提示，這將直接影響從數(shù)據(jù)中提取的信息類型。

設(shè)定提取提示可以通過兩種方式：一是多輪提示，即提供一系列輸入輸出樣例讓LLM學(xué)習(xí)；二是LLM微調(diào)，即在特定數(shù)據(jù)集上訓(xùn)練模型以提高性能。雖然微調(diào)可能更有效，但也更耗費(fèi)時間。

3 圖譜數(shù)據(jù)的存儲與管理

已經(jīng)成功設(shè)置LLM的提取流程。面對存儲問題，雖然Neo4j和Arango DB是圖形數(shù)據(jù)庫的首選，但學(xué)習(xí)新的查詢語言可能耗時。

為了簡化，可以使用graph2nosql，這是一個Python接口，支持在NoSQL數(shù)據(jù)庫中存儲圖形數(shù)據(jù)，并支持基本的圖形操作，如節(jié)點(diǎn)管理、圖形可視化和社區(qū)檢測。這樣，可以避免復(fù)雜的數(shù)據(jù)庫技術(shù)棧，同時保持?jǐn)?shù)據(jù)的靈活性和易用性。

一文徹底搞懂GraphRAG-AI.x社區(qū)

graph2nosql 數(shù)據(jù)模型

4 社區(qū)檢測

完成圖形數(shù)據(jù)的提取與存儲后，緊接著的任務(wù)便是識別圖中的社區(qū)結(jié)構(gòu)。社區(qū)由緊密相連的節(jié)點(diǎn)群組成，其內(nèi)部聯(lián)系遠(yuǎn)比與圖外節(jié)點(diǎn)更為頻繁。這一識別過程可以通過多種社區(qū)檢測算法實(shí)現(xiàn)。

Louvain算法是其中一種廣泛應(yīng)用的方法，它通過不斷迭代合并節(jié)點(diǎn)，形成社區(qū)，直至達(dá)到優(yōu)化的模塊度標(biāo)準(zhǔn)——模塊度是評價社區(qū)劃分優(yōu)劣的一個重要指標(biāo)。

除此之外，還有幾種知名的社區(qū)檢測算法，包括：

Girvan-Newman算法
Fast Unfolding算法
Infomap算法

這些算法各有優(yōu)勢，適用于不同的場景和需求。

5 社區(qū)報告生成

社區(qū)報告基于已識別的社區(qū)，提煉出節(jié)點(diǎn)和邊的關(guān)鍵信息，幫助我們把握知識庫的核心主題。每個社區(qū)都代表一個主題，為解答相關(guān)問題提供具體上下文。社區(qū)報告是跨文檔信息整合的起點(diǎn)，有助于構(gòu)建對知識庫的整體理解。

例如，諾貝爾和平獎得主的社區(qū)報告可能會突出顯示與獲獎?wù)呦嚓P(guān)的主要議題。而"發(fā)現(xiàn)"功能則進(jìn)一步深化了這些報告，提供了更細(xì)致的洞察。

為了確保社區(qū)報告的相關(guān)性和準(zhǔn)確性，應(yīng)根據(jù)具體應(yīng)用場景進(jìn)行細(xì)致的提示設(shè)計或模型微調(diào)。

6 上下文構(gòu)建：Map Reduce的應(yīng)用

在處理查詢時，采用map-reduce模式來構(gòu)建從中間到最終的響應(yīng)。

Map階段：這里，我們將每個社區(qū)與用戶查詢配對，利用社區(qū)報告來生成對查詢的初步答案。同時，還會讓LLM評估社區(qū)報告對用戶查詢的相關(guān)性。

Reduce階段：隨后，根據(jù)生成的中間響應(yīng)的相關(guān)性得分進(jìn)行排序，篩選出最相關(guān)的前k個社區(qū)。這些社區(qū)的報告，連同節(jié)點(diǎn)和邊的信息，將作為最終LLM提示的上下文，確保答案的準(zhǔn)確性和深度。

7 結(jié)語

Text2vec RAG在知識庫問答方面存在局限，而圖形RAG則能巧妙地補(bǔ)上這一短板。它通過社區(qū)報告為知識庫提供了更深層次的理解，幫助團(tuán)隊快速定位關(guān)鍵信息，提升效率。然而，這種方法在調(diào)用LLM時成本較高，可能帶來延遲。

未來，RAG系統(tǒng)可能會采用混合策略，根據(jù)查詢類型選擇最合適的工具，如利用社區(qū)報告作為上下文候選。這一領(lǐng)域的探索仍在進(jìn)行中。

本文轉(zhuǎn)載自 ??AI科技論談??，作者： AI科技論談

標(biāo)簽

贊

收藏

回復(fù)

舉報

回復(fù)

相關(guān)推薦

一文帶你了解OpenAI Sora

381972426 ? 2711瀏覽 ? 0回復(fù)
一文搞懂大模型、RAG、函數(shù)調(diào)用、Agent、知識庫、向量數(shù)據(jù)庫、知識圖譜、AGI的區(qū)別和聯(lián)系?。?/a>

玄姐聊AGI ? 1.4w瀏覽 ? 0回復(fù)
俯視LLM的靈魂：一文搞懂稀疏自動編碼器

魯班模錘1 ? 5999瀏覽 ? 0回復(fù)
一文徹底理解大模型 Agent 智能體原理和案例

玄姐聊AGI ? 4579瀏覽 ? 0回復(fù)
一文搞懂大模型、RAG、函數(shù)調(diào)用、Agent、知識庫、向量數(shù)據(jù)庫、知識圖譜、AGI的區(qū)別和聯(lián)系??！

玄姐聊AGI ? 3868瀏覽 ? 0回復(fù)
一文徹底理解大模型 Agent 智能體原理和案例

玄姐聊AGI ? 4414瀏覽 ? 0回復(fù)
一文讀懂GraphRAG大模型知識圖譜

數(shù)字化助推器 ? 4682瀏覽 ? 0回復(fù)
GraphRAG新增文件對已有知識庫影響有多大？緩存又是何時失效？一文帶你探究到底

AI博物院 ? 3049瀏覽 ? 0回復(fù)
一文圖解BERT注意力機(jī)制

石映飛云 ? 2852瀏覽 ? 0回復(fù)
一文教會如何動手搭建AI Agent

數(shù)字化助推器 ? 6103瀏覽 ? 0回復(fù)
一文搞懂AI大模型的四個核心技術(shù)

數(shù)字化助推器 ? 3105瀏覽 ? 0回復(fù)
一文帶你了解機(jī)器學(xué)習(xí)

寶寶數(shù)模AI ? 2072瀏覽 ? 0回復(fù)
一文詳解集成學(xué)習(xí)算法原理

寶寶數(shù)模AI ? 2386瀏覽 ? 0回復(fù)
一文搞懂 DeepSeek - 強(qiáng)化學(xué)習(xí)和蒸餾

玄姐聊AGI ? 3246瀏覽 ? 0回復(fù)
一文搞懂 DeepSeek 的蒸餾技術(shù)和案例實(shí)踐

玄姐聊AGI ? 7126瀏覽 ? 0回復(fù)
一文揭秘GPT：AI是如何徹底改變我們的？

唐克 ? 2282瀏覽 ? 0回復(fù)
一文吃透自注意力機(jī)制

人工智能訓(xùn)練營 ? 4343瀏覽 ? 0回復(fù)
一文輕松搞懂 MHA、MQA、GQA 和 MLA

智駐未來 ? 2369瀏覽 ? 0回復(fù)
一文搞懂什么是數(shù)據(jù)合約

小虎哦哦 ? 495瀏覽 ? 0回復(fù)

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

六款必知的AI Agent工作流，優(yōu)缺點(diǎn)解析 1天前發(fā)布
Cursor 1.0 上線！為什么說它可能是「程序員失業(yè)預(yù)警」？ 2025-06-16 00:00:48發(fā)布

熱門推薦

AI Agents開源工具棧全解析~ 1回復(fù)

從原理到調(diào)參，小白也能讀懂的大模型微調(diào)LoRA，不懂線性代數(shù)也沒問題 0回復(fù)

Deepseek R1 0528實(shí)測：性能直逼頂尖，普通電腦本地運(yùn)行全攻略 0回復(fù)

本命周！MiniMax M1有多猛？網(wǎng)友：僅用40k思考預(yù)算就干翻Gemini，實(shí)測：真·超DS！ 1回復(fù)

DeepSeek 新模型 R1-0528 悄悄開源，與o3 相當(dāng)，實(shí)測來了 0回復(fù)

上一篇：基于GPT-4o-mini，使用LangChain打造AI搜索智能體

下一篇： 10款殺手級AI編程助手，Python開發(fā)更輕松

社區(qū)精華內(nèi)容

目錄

主站蜘蛛池模板：一级做a爰片性色毛片16 | 色橹橹欧美在线观看视频高清 | 国产美女在线观看 | 欧美一级免费看 | 亚洲精品在线看 | 成人精品一区 | 国产精品欧美一区喷水 | www.99热| 久久精品国产一区二区电影 | 免费网站国产 | 久久亚洲综合 | 国产高清在线观看 | 黄色片免费看视频 | 精品在线观看入口 | 91一区| 一级黄在线观看 | 狠狠干2020 | 欧美精品一区二区在线观看 | 天天躁日日躁狠狠很躁 | 亚洲天堂中文字幕 | 精品久久久久久久人人人人传媒 | 精品视频在线免费观看 | 欧美一区二区三区免费在线观看 | 黄色在线免费观看视频网站 | 亚洲国产精品一区二区三区 | 亚洲免费毛片 | 国产视频中文字幕 | 一区精品在线观看 | 免费在线观看一区二区 | 亚洲精品色| 国产精品高潮呻吟 | 免费电影av | 日韩和的一区二在线 | 中文字幕日韩欧美一区二区三区 | 操夜夜 | 国产精品揄拍一区二区久久国内亚洲精 | 国产精品一区二区三区久久久 | 国产一区不卡 | 久久一视频 | 欧美精品片 | 亚洲性人人天天夜夜摸 |

<abbr id="tpznq"></abbr>

<p id="tpznq"><tfoot id="tpznq"><thead id="tpznq"></thead></tfoot></p>

<blockquote id="tpznq"></blockquote>

<ul id="tpznq"><font id="tpznq"></font></ul>