成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

<dl id="gymo8"><xmp id="gymo8"></xmp></dl>

<li id="gymo8"><dl id="gymo8"></dl></li>

<li id="gymo8"></li>

<rt id="gymo8"><acronym id="gymo8"></acronym></rt><button id="gymo8"></button>

<li id="gymo8"><dl id="gymo8"></dl></li>

鴻蒙開發者社區

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發者社區

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發者社區訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業版APP

鴻蒙開發者社區視頻號

51CTO軟考題庫

AI.x社區

登錄/注冊
51CTO

中國優質的IT技術網站

51CTO博客

專業IT技術創作平臺

51CTO學堂

IT職業在線教育平臺

用RAG的思路構建文檔級別知識圖譜框架-RAKG 原創

大模型自然語言處理

發布于 2025-5-9 06:39

瀏覽

0收藏

下面我們來看一個用RAG的思路構建文檔級別知識圖譜構建框架思路，這個思路要解決的問題是如何自動構建文檔級別的知識圖譜。傳統的知識圖譜構建方法面臨長文本處理中的長距離遺忘問題、復雜實體消歧、跨文檔知識整合不足的問題。整體思路可以參考下。

方法

用RAG的思路構建文檔級別知識圖譜框架-RAKG-AI.x社區

上圖的流程：RAKG框架通過句子分割和向量化處理文檔，提取初步實體，并執行實體消歧和向量化。處理后的實體經過語料庫回顧檢索以獲取相關文本和圖結構檢索以獲取相關知識圖譜。隨后，使用LLM整合檢索到的信息以構建關系網絡，這些網絡針對每個實體進行合并。最后，新構建的知識圖譜與原始知識圖譜相結合。

A. 理想知識圖譜的假設

RAKG假設存在一個理論上完美的知識圖譜構建過程，該過程可以將文檔轉換為一個理想的完備知識圖譜。這個理想知識圖譜可以表示為：

用RAG的思路構建文檔級別知識圖譜框架-RAKG-AI.x社區

B. 知識庫向量化

RAKG將文檔和知識圖譜進行向量化處理，便于后續的檢索和生成操作。

文檔分塊和向量化：文檔被分割成多個文本塊（chunks），通常以句子為單位進行分割。每個文本塊被向量化，以便于后續的處理和分析。類似RAG，這種方法能夠減少LLM每次處理的信息量，同時確保每個片段的語義完整性，從而提高了命名實體識別的準確性。
知識圖譜向量化：初始知識圖譜中的每個節點（如實體）通過提取其名稱和類型來進行向量化。使用 BGE-M3 模型進行向量化，便于在檢索過程中使用。

C. 預實體構建

RAKG通過命名實體識別（NER）來識別文本中的實體，并將這些實體作為預實體進行處理。

實體識別和向量化：NER的整個過程由LLM(Qwen2.5-72B)完成。先對每個文本塊進行命名實體識別，識別出其中的實體。接著為每個預實體分配類型和屬性描述，區分具有相似名稱的不同實體。最后將實體的名稱和類型組合后進行向量化。
實體消歧：在完成整個文檔的實體識別和向量化后，進行相似性檢查。對于相似度超過閾值的實體，進行進一步的消歧處理，以確保每個實體只有一個唯一表示。

D. 關系網絡構建

RAKG通過RAG的方法來構建關系網絡。

文檔文本塊檢索：對于指定的實體，通過文本塊的標識符（chunk-id）檢索相關的文本塊。使用向量檢索獲取與選定實體相似的文本塊。
圖結構檢索：在初始知識圖譜中進行向量檢索，獲取與選定實體相似的其他實體及其關系網絡。
關系網絡生成和評估：將檢索到的文本和關系網絡信息整合，并輸入到LLM中，以生成中心實體的屬性和關系。使用LLM作為評判者來評估生成的三元組，確保其真實性和準確性。
LLM作為裁判的過程：提取的實體與源文本進行核對以消除幻覺。檢索器使用實體獲取相關文本和知識圖譜，構建關系網絡。然后驗證該網絡與檢索信息的一致性。

E. 知識圖譜融合

RAKG將新構建的知識圖譜與初始知識圖譜進行融合。自然而然，KG融合有兩點核心內容。

實體合并：將新知識圖譜中的實體與初始知識圖譜中的實體進行消歧和合并，確保實體的一致性。
關系整合：將新知識圖譜中的關系與初始知識圖譜中的關系進行整合，以獲得更全面的知識圖譜。

評估指標

評估指標主要是評估KG的，正好復習下KG的常見評估指標。

1. 實體密度（Entity Density, ED）

實體密度是指知識圖譜中實體的數量。公式如下：

ED=N_e

其中N_e，表示知識圖譜中提取的實體數量。實體密度越高，通常意味著從文本中提取的信息越多，知識圖譜的覆蓋范圍越廣。

2. 關系豐富度（Relationship Richness, RR）

關系豐富度是指知識圖譜中關系的數量相對于實體數量的比率。公式如下：

用RAG的思路構建文檔級別知識圖譜框架-RAKG-AI.x社區

其中N_r，表示知識圖譜中提取的關系數量。關系豐富度越高，說明知識圖譜中實體之間的關系越復雜，能夠更好地捕捉實體之間的交互。

3. 實體保真度（Entity Fidelity, EF）

實體保真度用于評估提取的實體的可信度。公式如下：

用RAG的思路構建文檔級別知識圖譜框架-RAKG-AI.x社區

4. 關系保真度（Relationship Fidelity, RF）

關系保真度用于評估提取的關系的可信度。公式如下：

用RAG的思路構建文檔級別知識圖譜框架-RAKG-AI.x社區

5. 準確性（Accuracy）

準確性是指知識圖譜在問答任務中的表現。通過構建的知識圖譜來回答問題的準確率。較高的準確性意味著知識圖譜能夠更好地保留文本的語義信息。

6. 實體覆蓋率（Entity Coverage, EC）

實體覆蓋率衡量的是評估知識圖譜中的實體與標準知識圖譜中的實體之間的匹配程度。公式如下：

用RAG的思路構建文檔級別知識圖譜框架-RAKG-AI.x社區

7. 關系網絡相似度（Relation Network Similarity, RNS）

關系網絡相似度衡量的是評估知識圖譜與標準知識圖譜在關系層面上的相似度。公式如下：

用RAG的思路構建文檔級別知識圖譜框架-RAKG-AI.x社區

這些指標用于全面評估知識圖譜的質量，確保其在實體提取、關系構建和整體準確性方面的表現。

實驗效果

用RAG的思路構建文檔級別知識圖譜框架-RAKG-AI.x社區

RAKG實現了95.81%的準確率，優于KGGen（86.48%）和GraphRAG（89.71%）

用RAG的思路構建文檔級別知識圖譜框架-RAKG-AI.x社區

RAKG、GraphRAG和KGGen生成的知識圖的實體密度和關系豐富度。結果表明，RAKG產生的實體比GraphRAG和KGGen更密集，關系更豐富。

用RAG的思路構建文檔級別知識圖譜框架-RAKG-AI.x社區

LLM作為評委的結果：實體通過率約為91.33%，關系網絡通過率大約為94.51%。

參考文獻：RAKG:Document-level Retrieval Augmented Knowledge Graph Construction，https://arxiv.org/pdf/2504.09823

公眾號大模型自然語言處理作者：余俊暉

原文鏈接：????????https://mp.weixin.qq.com/s/x3VscG0T93T1pmdX7XSm_g??

?著作權歸作者所有，如需轉載，請注明出處，否則將追究法律責任

標簽

知識圖譜框架

已于2025-5-9 11:28:14修改

贊

收藏

回復

舉報

回復

相關推薦

基于規則學習的關系模式知識圖譜嵌入研究

mb5f8eba9bdb0af ? 4070瀏覽 ? 0回復
基于預訓練模型的知識圖譜嵌入編輯

mb5f8eba9bdb0af ? 3062瀏覽 ? 0回復
ICLR 2024 | UIUC等提出BioBridge：用知識圖譜構建多模態生物醫學基礎模型

zhangyannni ? 3457瀏覽 ? 0回復
ODA：通過全局觀察增強大模型集成知識圖譜推理能力的新型Agent框架

PaperAgent ? 3515瀏覽 ? 0回復
利用LlamaIndex和本地PDF文檔，輕松打造知識圖譜GraphRAG

小虎哦哦 ? 4280瀏覽 ? 0回復
iText2KG：顯著降低LLM構建知識圖譜時的幻覺現象

大語言模型論文跟蹤 ? 3143瀏覽 ? 0回復
一款由知識圖譜引擎驅動的創新Agent框架

探索AGI ? 3421瀏覽 ? 0回復
AgentRE：用智能體框架提升知識圖譜構建效果，重點是開源！

大語言模型論文跟蹤 ? 4842瀏覽 ? 0回復
知識圖譜與大模型的深度結合策略剖析

玄姐聊AGI ? 4396瀏覽 ? 0回復
一個增量式構建知識圖譜的項目：iText2KG

PaperAgent ? 4280瀏覽 ? 0回復
采用RAG和知識圖譜克服人工智能幻覺問題

51CTO內容精選 ? 2779瀏覽 ? 0回復
基于知識圖譜的LangChain應用實戰

ermulong ? 3131瀏覽 ? 0回復
小白也能讀懂的GraphRAG知識圖譜全流程解析，多圖預警！

AI博物院 ? 8044瀏覽 ? 0回復
淺談基于LLM的三階段自動知識圖譜構建方法

大模型自然語言處理 ? 3005瀏覽 ? 0回復
RAG與本地知識庫，向量數據庫，以及知識圖譜的聯系與區別

AI探索時代 ? 5790瀏覽 ? 0回復
GraphRAG+Langchain實現大模型知識圖譜

數字化助推器 ? 2814瀏覽 ? 0回復
從數據孤島到智能系統：RAG和知識圖譜的協同作用

51CTO內容精選 ? 2823瀏覽 ? 0回復
MedRAG：利用知識圖譜引導推理提升醫療Copilot的RAG能力 - 新加坡南洋理工等

知識圖譜科技 ? 4364瀏覽 ? 0回復
MDQA 知識圖譜提示用于多文檔問答

AI悠閑區 ? 663瀏覽 ? 0回復

大模型自然語言處理

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

最近發布

GraphRAG變種：HippoRAG進化到HippoRAG2.0,提升多跳復雜推理性能 3天前發布
Qwen3 Embedding模型架構、訓練方法、數據策略 4天前發布

熱門推薦

AI Agents開源工具棧全解析~ 1回復

從原理到調參，小白也能讀懂的大模型微調LoRA，不懂線性代數也沒問題 0回復

Deepseek R1 0528實測：性能直逼頂尖，普通電腦本地運行全攻略 0回復

本命周！MiniMax M1有多猛？網友：僅用40k思考預算就干翻Gemini，實測：真·超DS！ 1回復

DeepSeek 新模型 R1-0528 悄悄開源，與o3 相當，實測來了 0回復

上一篇：開源多模態RAG的視覺文檔(OCR-Free)檢索增強生成方案-VDocRAG

下一篇： Encoder-free無編碼器多模態大模型EVEv2模型架構、訓練方法淺嘗

社區精華內容

目錄

主站蜘蛛池模板： 91精品国产麻豆 | 真人一级毛片 | 日本不卡免费新一二三区 | 成年人在线观看视频 | 久久综合久色欧美综合狠狠 | 羞羞在线观看视频 | 伊人久久大香线 | 岛国av免费在线观看 | 亚洲国产一区在线 | 日韩成人精品在线 | 天天干亚洲 | 日韩在线小视频 | 国产三区精品 | 欧美日韩国产在线 | 一区二区三区四区在线 | 午夜大片 | 精品三级在线观看 | 在线视频a | 亚洲视频在线一区 | 国产美女免费视频 | 日本精品免费在线观看 | 日本精品久久久久久久 | av电影手机在线看 | 亚洲国产欧美日韩 | 一区二区在线免费观看 | 成人激情视频免费观看 | 国产精品美女www爽爽爽 | 国产成人免费在线观看 | 亚洲区一区二区 | www.夜夜草 | avav在线看 | 精品自拍视频在线观看 | 久久久久综合 | 国产欧美在线一区二区 | 免费观看的黄色网址 | 男女免费视频网站 | 不卡一区二区三区四区 | 亚洲精品久久久久久久久久久久久 | 中文字幕亚洲一区 | 91在线观看免费 | 色婷婷亚洲国产女人的天堂 |

<abbr id="cemq4"><source id="cemq4"></source></abbr><center id="cemq4"><acronym id="cemq4"></acronym></center>

<code id="cemq4"><delect id="cemq4"></delect></code>

<rt id="cemq4"><delect id="cemq4"></delect></rt>

<dl id="cemq4"><tr id="cemq4"></tr></dl>