成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

AI預(yù)測論文能不能中,8B超越70B大模型,港大發(fā)布圖文融合多智能體GraphAgent

人工智能
港大黃超教授團(tuán)隊(duì)提出多智能體自動化框架GraphAgent,能自動構(gòu)建和解析知識圖譜中的復(fù)雜語義網(wǎng)絡(luò),應(yīng)對各類預(yù)測和生成任務(wù)。

論文能不能中?可以用AI提前預(yù)測~

港大黃超教授團(tuán)隊(duì)提出多智能體自動化框架GraphAgent,能自動構(gòu)建和解析知識圖譜中的復(fù)雜語義網(wǎng)絡(luò),應(yīng)對各類預(yù)測和生成任務(wù)。

圖片

GraphAgent通過圖生成、任務(wù)規(guī)劃和任務(wù)執(zhí)行三大核心智能體的協(xié)同運(yùn)作,融合大語言模型與圖語言模型的優(yōu)勢,成功連接了結(jié)構(gòu)化圖數(shù)據(jù)與非結(jié)構(gòu)化文本數(shù)據(jù),在文本總結(jié)與關(guān)系建模方面實(shí)現(xiàn)了明顯提升。

實(shí)驗(yàn)中,在預(yù)測性任務(wù)(如節(jié)點(diǎn)分類)和生成性任務(wù)(如文本生成)上,GraphAgent均取得突出成果,僅以8B參數(shù)規(guī)模便達(dá)到了與GPT-4、Gemini等大規(guī)模封閉源模型相當(dāng)?shù)男阅芩健?/p>

特別在零樣本學(xué)習(xí)和跨域泛化等場景中,GraphAgent展現(xiàn)出顯著優(yōu)勢。

有意思的是,團(tuán)隊(duì)將GraphAgent應(yīng)用到了學(xué)術(shù)論文評審場景。

在實(shí)際投稿流程中,作者往往需要根據(jù)評審意見準(zhǔn)備Rebuttal回應(yīng),而GraphAgent僅基于論文評審意見(Reviews)就能幫助作者更好地評估論文的錄取可能。

圖片

GraphAgent長啥樣?

現(xiàn)實(shí)世界的數(shù)據(jù)呈現(xiàn)雙重特性:一方面是結(jié)構(gòu)化的圖連接數(shù)據(jù),另一方面是非結(jié)構(gòu)化的文本與視覺信息。

這些數(shù)據(jù)中蘊(yùn)含的關(guān)系網(wǎng)絡(luò)也分為兩類:顯式的連接關(guān)系(如社交網(wǎng)絡(luò)互動),以及隱式的語義依賴(常見于知識圖譜)。

這種復(fù)雜性帶來了三大核心挑戰(zhàn):

  • 異構(gòu)數(shù)據(jù)融合:系統(tǒng)需要整合多種形式的信息。以學(xué)術(shù)網(wǎng)絡(luò)為例,論文間的引用構(gòu)成了圖結(jié)構(gòu)關(guān)系,而標(biāo)題、摘要等文本則承載著豐富的語義信息。有效整合這些異構(gòu)信息可支持知識總結(jié)、科學(xué)問答等應(yīng)用。
  • 多層次關(guān)系理解:實(shí)際場景中往往存在多維度的關(guān)聯(lián)。例如電商平臺中,用戶-商品交互構(gòu)成行為圖譜,產(chǎn)品評論則形成語義網(wǎng)絡(luò)。深入理解這些多層關(guān)系有助于提升用戶-商品交互預(yù)測的準(zhǔn)確性。
  • 任務(wù)多元化:應(yīng)用場景要求系統(tǒng)具備廣泛的處理能力。預(yù)測類任務(wù)包括節(jié)點(diǎn)分類、鏈接推斷等圖分析;生成類任務(wù)涉及圖增強(qiáng)文本生成、知識圖譜問答等。這需要系統(tǒng)能夠靈活適應(yīng)不同任務(wù)特點(diǎn),并充分利用數(shù)據(jù)中的結(jié)構(gòu)化與語義信息。

圖片

為應(yīng)對上述挑戰(zhàn),研究團(tuán)隊(duì)提出多智能體自動化框架GraphAgent。

該框架通過三大核心智能體的協(xié)同配合,實(shí)現(xiàn)了圖結(jié)構(gòu)與語義信息的深度融合,可同時支持預(yù)測型(圖分析、節(jié)點(diǎn)分類)和生成型(文本創(chuàng)作)等多樣化任務(wù)。

其核心架構(gòu)包括:

  • 圖生成智能體(Graph Generator Agent)
  • 任務(wù)規(guī)劃智能體(Task Planning Agent)
  • 任務(wù)執(zhí)行智能體(Task Execution Agent)

三大智能體通過協(xié)同機(jī)制緊密配合,融合大語言模型與圖語言模型的優(yōu)勢,有效挖掘數(shù)據(jù)中的關(guān)系網(wǎng)絡(luò)與語義依賴。

下面詳細(xì)介紹各個智能體的核心功能:

圖片

圖生成智能體

圖生成智能體負(fù)責(zé)構(gòu)建語義知識圖譜(Semantic Knowledge Graph, SKG),通過創(chuàng)新的雙階段迭代機(jī)制實(shí)現(xiàn)深層語義信息的提取與整合。

該智能體的工作流程分為兩個核心階段:

知識節(jié)點(diǎn)提取階段

該階段采用自適應(yīng)的分層策略,從非結(jié)構(gòu)化文本中識別多維度的知識實(shí)體:

  • 通過定制化的系統(tǒng)提示,調(diào)用大語言模型(LLM)處理輸入文本
  • 運(yùn)用迭代式識別技術(shù),同時捕獲宏觀領(lǐng)域概念(如”Machine Learning”)和微觀技術(shù)細(xì)節(jié)(如”Self-Supervised Learning”)
  • 基于多輪迭代構(gòu)建層次化知識結(jié)構(gòu),確保知識體系的完整性與連貫性

知識描述增強(qiáng)階段

這一階段著重提升知識表示的豐富度與準(zhǔn)確性:

  • 為每個識別的節(jié)點(diǎn)生成詳實(shí)的語義描述
  • 整合相關(guān)上下文信息,構(gòu)建完整的知識聯(lián)系
  • 采用動態(tài)迭代更新機(jī)制:i) 將每輪描述作為下輪優(yōu)化的基礎(chǔ);ii) 持續(xù)深化和拓展知識內(nèi)容;iii) 通過多輪迭代融合,最終形成語義完備的知識圖譜

任務(wù)規(guī)劃智能體

任務(wù)規(guī)劃智能體作為框架的決策核心,通過精密的三階段處理機(jī)制完成復(fù)雜任務(wù)的規(guī)劃與分解。

其工作流程包括:

意圖識別與任務(wù)制定

該階段專注于準(zhǔn)確理解用戶需求并確定處理策略:

  • 深度解析用戶查詢,提取核心意圖
  • 將任務(wù)分類為三大類型:預(yù)定義圖預(yù)測(Predictive_predefined),處理已知結(jié)構(gòu)的圖分析;開放圖預(yù)測(Predictive_wild),應(yīng)對未知結(jié)構(gòu)的圖推理;自由生成任務(wù)(Open_generation),執(zhí)行靈活的創(chuàng)作需求。

圖結(jié)構(gòu)標(biāo)準(zhǔn)化處理

此階段實(shí)現(xiàn)不同類型圖數(shù)據(jù)的統(tǒng)一表達(dá):

  • 運(yùn)用專業(yè)圖構(gòu)建工具(GBW_Tool)進(jìn)行結(jié)構(gòu)轉(zhuǎn)換
  • 同步處理顯式關(guān)系圖(G_exp)與語義知識圖(G_skg)
  • 建立標(biāo)準(zhǔn)化的異構(gòu)圖表示體系,確保處理一致性

圖文特征融合

這一階段著重實(shí)現(xiàn)信息的深度整合:

  • 結(jié)合預(yù)訓(xùn)練文本編碼器與圖神經(jīng)網(wǎng)絡(luò),構(gòu)建雙層編碼體系
  • 生成文本語義與圖結(jié)構(gòu)的聯(lián)合表示
  • 為下游任務(wù)提供豐富的特征支持,奠定執(zhí)行基礎(chǔ)

圖動作智能體

圖動作智能體是框架的核心執(zhí)行單元,通過創(chuàng)新的三維處理架構(gòu),實(shí)現(xiàn)了任務(wù)的精準(zhǔn)執(zhí)行與性能優(yōu)化。

其工作機(jī)制包括:

智能化任務(wù)處理機(jī)制

針對不同類型任務(wù)采用差異化處理策略:

  • 預(yù)測類任務(wù):設(shè)計(jì)專屬系統(tǒng)提示,引導(dǎo)模型進(jìn)行精準(zhǔn)預(yù)測
  • 生成類任務(wù):融合語義知識圖譜,提升文本生成的質(zhì)量與相關(guān)性
  • 自適應(yīng)優(yōu)化:根據(jù)任務(wù)特點(diǎn)動態(tài)調(diào)整處理流程,確保執(zhí)行效率

深度圖指令對齊技術(shù)

創(chuàng)新性地實(shí)現(xiàn)了多層次的模態(tài)對齊:

  • 同類型圖結(jié)構(gòu)對齊:增強(qiáng)模型對特定圖模式的理解能力
  • 跨類型知識融合:提升處理異構(gòu)圖關(guān)系的準(zhǔn)確性
  • 雙向增強(qiáng)機(jī)制:顯著提升模型在多樣化場景下的泛化表現(xiàn)

漸進(jìn)式學(xué)習(xí)策略

采用先進(jìn)的課程學(xué)習(xí)方法:

  • 基于難度梯度的任務(wù)編排:從基礎(chǔ)到進(jìn)階的平滑過渡
  • 精細(xì)化的訓(xùn)練序列設(shè)計(jì):確保知識積累的連續(xù)性
  • 全方位性能調(diào)優(yōu):在各類任務(wù)中保持穩(wěn)定的高水平表現(xiàn)

實(shí)驗(yàn)

數(shù)據(jù)集設(shè)置

實(shí)驗(yàn)評估采用了六個各具特色的基準(zhǔn)數(shù)據(jù)集,涵蓋了不同場景和任務(wù)類型。

如Table 1所示,這些精心選擇的數(shù)據(jù)集在規(guī)模、結(jié)構(gòu)和應(yīng)用領(lǐng)域等方面展現(xiàn)出顯著差異,為全面驗(yàn)證框架性能提供了理想的測試基礎(chǔ)。

圖片

為全面評估GraphAgent的通用性能,本研究精選了六個具有代表性的基準(zhǔn)數(shù)據(jù)集開展系統(tǒng)實(shí)驗(yàn)。這些數(shù)據(jù)集按照任務(wù)特征可劃分為三大類:

結(jié)構(gòu)化圖數(shù)據(jù)集: 采用了兩個經(jīng)典的節(jié)點(diǎn)分類數(shù)據(jù)集IMDB和ACM。其中IMDB數(shù)據(jù)集包含11,616個節(jié)點(diǎn),ACM數(shù)據(jù)集涵蓋10,942個節(jié)點(diǎn),這兩個數(shù)據(jù)集都具有清晰的圖結(jié)構(gòu)特征,為評估模型在結(jié)構(gòu)化數(shù)據(jù)處理方面的能力提供了可靠基準(zhǔn)。

文本處理數(shù)據(jù)集: 選擇了Arxiv-Papers和ICLR-Peer Reviews兩個具有代表性的數(shù)據(jù)集。Arxiv-Papers構(gòu)建了包含153,555個SKG節(jié)點(diǎn)的語義知識圖,用于評估文檔分類性能;ICLR-Peer Reviews則包含161,592個SKG節(jié)點(diǎn),專門用于論文錄用預(yù)測任務(wù),這些數(shù)據(jù)集體現(xiàn)了模型處理復(fù)雜文本及語義關(guān)系的能力。

智能生成數(shù)據(jù)集: 引入了Related Work Generation和GovReport總結(jié)兩個具有挑戰(zhàn)性的數(shù)據(jù)集。Related Work Generation基于多篇論文構(gòu)建,包含875,921個SKG節(jié)點(diǎn),用于驗(yàn)證模型的相關(guān)工作生成能力;GovReport包含15,621個SKG節(jié)點(diǎn),針對長文檔摘要生成任務(wù),這兩個數(shù)據(jù)集都對模型的生成能力提出了較高要求。

實(shí)驗(yàn)效果分析

結(jié)構(gòu)化數(shù)據(jù)預(yù)測性能分析

為深入評估GraphAgent在結(jié)構(gòu)化圖任務(wù)中的零樣本學(xué)習(xí)能力,研究團(tuán)隊(duì)設(shè)計(jì)了一組的對比實(shí)驗(yàn)。

實(shí)驗(yàn)采用IMDB數(shù)據(jù)集進(jìn)行模型訓(xùn)練,分別在1-shot和40-shot兩種低資源場景下驗(yàn)證模型性能,并在ACM數(shù)據(jù)集的1,000個未見節(jié)點(diǎn)上開展遷移測試,以評估模型的泛化能力。

實(shí)驗(yàn)結(jié)果表明:GraphAgent在所有關(guān)鍵指標(biāo)上都顯著優(yōu)于當(dāng)前最先進(jìn)的圖語言模型HiGPT,平均性能提升超過28%。模型在40-shot設(shè)置下取得了顯著性能提升:Micro-F1和Macro-F1均達(dá)74.98%(提升48.5%/63.5%),AUC達(dá)80.90%(提升27.2%)

圖片

GraphAgent的卓越性能主要源于三項(xiàng)核心技術(shù)創(chuàng)新:

首先,智能圖生成機(jī)制通過自動構(gòu)建語義知識圖譜(SKG)為模型注入豐富的補(bǔ)充信息,顯著增強(qiáng)了復(fù)雜語義關(guān)系的理解能力;

其次,精確的任務(wù)規(guī)劃機(jī)制使模型能夠準(zhǔn)確理解和分解用戶意圖,并為不同應(yīng)用場景制定最優(yōu)執(zhí)行策略;

最后,創(chuàng)新性的雙重優(yōu)化策略結(jié)合了圖文對齊和任務(wù)微調(diào)機(jī)制,不僅提升了模型的基礎(chǔ)性能,還增強(qiáng)了遷移學(xué)習(xí)能力,使模型即使在1-shot等低資源場景下仍能保持穩(wěn)定的高性能表現(xiàn)。

語義理解能力分析

為深入評估GraphAgent在復(fù)雜語義關(guān)系處理方面的性能,研究團(tuán)隊(duì)基于兩個典型數(shù)據(jù)集開展了系統(tǒng)實(shí)驗(yàn):利用Arxiv-Papers數(shù)據(jù)集進(jìn)行論文分類驗(yàn)證,并通過ICLR-Peer Reviews數(shù)據(jù)集測試論文錄用預(yù)測能力。

通過嚴(yán)格的實(shí)驗(yàn)評估,GraphAgent在處理隱式語義依賴關(guān)系時展現(xiàn)出如下突出優(yōu)勢:

圖片

實(shí)驗(yàn)結(jié)果凸顯了GraphAgent的三大核心優(yōu)勢:

在參數(shù)規(guī)模優(yōu)化方面,僅有8B參數(shù)的GraphAgent憑借其獨(dú)特的語義知識圖譜架構(gòu),成功實(shí)現(xiàn)了對復(fù)雜語義依賴關(guān)系的精準(zhǔn)把握,通過多層次語義信息的局部與全局整合,在各項(xiàng)評估指標(biāo)上顯著超越了Llama3-70b和Qwen2-72b等大規(guī)模模型,平均性能提升達(dá)31.9%。

在泛化能力表現(xiàn)上,GraphAgent展現(xiàn)出卓越的跨任務(wù)學(xué)習(xí)潛力。其多任務(wù)版本GraphAgent-General在Arxiv-Papers數(shù)據(jù)集的表現(xiàn)甚至優(yōu)于專門優(yōu)化的單任務(wù)版本。

特別值得注意的是,8B規(guī)模的GraphAgent在零樣本場景下也能達(dá)到Deepseek-Chat-V2等大型閉源模型的性能水平。

在架構(gòu)效率方面,GraphAgent通過創(chuàng)新性地整合語義知識圖譜和結(jié)構(gòu)化知識表示,相比傳統(tǒng)的監(jiān)督微調(diào)方法和GraphRAG系統(tǒng),不僅顯著提升了模型性能,還有效降低了輸入開銷,同時成功緩解了大語言模型常見的幻覺問題。

文本生成任務(wù)

GraphAgent在圖增強(qiáng)文本生成任務(wù)中展現(xiàn)出卓越表現(xiàn),通過性能評估、模型對比和架構(gòu)分析三個維度的系統(tǒng)實(shí)驗(yàn),充分驗(yàn)證了其突出優(yōu)勢。

圖片
圖片

基于Llama3-70b和Qwen2-72b的雙重對比驗(yàn)證表明,GraphAgent在困惑度(PPL)等核心指標(biāo)上顯著優(yōu)于基線模型。不同于傳統(tǒng)的監(jiān)督微調(diào)(SFT)和GraphRAG方法,GraphAgent通過智能構(gòu)建語義知識圖譜,從根本上提升了模型的推理理解能力,有效解決了常規(guī)微調(diào)和知識注入方法在處理復(fù)雜推理模式時的固有局限。

在架構(gòu)創(chuàng)新和性能對標(biāo)方面,GraphAgent展現(xiàn)出突出優(yōu)勢。

以GPT-4為評判基準(zhǔn)的實(shí)驗(yàn)顯示,GraphAgent相比Llama3-8b和Llama3-70b分別實(shí)現(xiàn)了114%和45%的性能提升,在67%的測試案例中領(lǐng)先同等規(guī)模模型,58%的情況下超越主流開源方案。

尤為顯著的是,GraphAgent僅以8B的參數(shù)規(guī)模和極低的計(jì)算開銷便達(dá)成這些卓越成果,充分驗(yàn)證了基于語義知識圖譜的架構(gòu)設(shè)計(jì)在增強(qiáng)文本生成能力方面的顯著效果。

消融實(shí)驗(yàn)

通過系統(tǒng)化的消融實(shí)驗(yàn)(Ablation Study),研究團(tuán)隊(duì)深入評估了GraphAgent架構(gòu)中三個核心組件的性能貢獻(xiàn),研究結(jié)果揭示了以下關(guān)鍵發(fā)現(xiàn):

圖片

語義知識圖譜(SKG)的基礎(chǔ)支撐作用:移除SKG組件導(dǎo)致模型性能顯著降低15.2%,充分證實(shí)了自動構(gòu)建的語義知識圖譜在提供關(guān)鍵補(bǔ)充信息方面的不可替代性。這一發(fā)現(xiàn)強(qiáng)調(diào)了結(jié)構(gòu)化知識表示對模型整體性能的決定性影響。

圖文對齊機(jī)制的重要性:實(shí)驗(yàn)表明,缺失圖文對齊機(jī)制造成了最顯著的性能損失,困惑度(PPL)增加達(dá)11.282。這突出表明深層次的圖文理解能力對于需要復(fù)雜推理的生成任務(wù)至關(guān)重要,是保障模型高質(zhì)量輸出的關(guān)鍵環(huán)節(jié)。

課程學(xué)習(xí)策略的優(yōu)化效果:雖然相較其他組件影響相對較小(預(yù)測任務(wù)降低4.0%,生成任務(wù)PPL增加0.503),但課程學(xué)習(xí)策略的缺失仍對雙任務(wù)性能產(chǎn)生明顯負(fù)面影響。這驗(yàn)證了漸進(jìn)式學(xué)習(xí)路徑在優(yōu)化模型訓(xùn)練效果方面的積極作用。

最后研究團(tuán)隊(duì)透露了他們的未來研究方向,包括:

多模態(tài)能力拓展:計(jì)劃將當(dāng)前框架的處理能力擴(kuò)展至視覺信息領(lǐng)域,建立支持關(guān)系型數(shù)據(jù)、文本內(nèi)容和視覺元素的綜合處理機(jī)制。這一拓展不僅包括多模態(tài)信息的理解與融合,還將重點(diǎn)開發(fā)跨模態(tài)知識表示和生成能力,從而實(shí)現(xiàn)更豐富的智能交互場景。特別關(guān)注視覺-文本-關(guān)系的協(xié)同建模,為多模態(tài)智能系統(tǒng)開辟新的研究方向。

模型性能優(yōu)化:致力于提升模型在復(fù)雜現(xiàn)實(shí)場景中的泛化表現(xiàn),重點(diǎn)研究如何在保持或提升性能的同時實(shí)現(xiàn)模型壓縮。這涉及創(chuàng)新的模型架構(gòu)設(shè)計(jì)、高效的參數(shù)共享機(jī)制以及先進(jìn)的知識蒸餾技術(shù)。同時,將探索計(jì)算資源優(yōu)化策略,提高模型在實(shí)際部署環(huán)境中的效率,為大規(guī)模應(yīng)用奠定基礎(chǔ)。

應(yīng)用場景擴(kuò)展:積極探索框架在多個實(shí)際領(lǐng)域的落地應(yīng)用,重點(diǎn)關(guān)注科學(xué)研究輔助和商業(yè)智能分析等高價值場景。在科研領(lǐng)域,將開發(fā)專門的文獻(xiàn)分析和知識發(fā)現(xiàn)工具;在商業(yè)領(lǐng)域,著重構(gòu)建面向決策支持的智能分析系統(tǒng)。同時,密切關(guān)注新興技術(shù)趨勢,探索在醫(yī)療健康、金融科技等領(lǐng)域的應(yīng)用場景。

項(xiàng)目地址:https://github.com/HKUDS/GraphAgent。
論文鏈接:https://arxiv.org/abs/2412.17029。
實(shí)驗(yàn)室主頁: https://sites.google.com/view/chaoh。

責(zé)任編輯:姜華 來源: 量子位
相關(guān)推薦

2024-10-17 18:52:41

2024-04-30 08:28:44

開源大模型Llama

2024-04-19 08:01:01

Llama 3 8BMeta

2024-07-23 09:20:35

2023-08-14 13:29:37

2024-12-19 07:10:00

2023-10-13 19:58:33

Mistral7B模型

2025-01-08 09:30:00

Meta大模型訓(xùn)練

2024-11-25 08:10:00

2025-02-17 12:30:00

2024-05-30 12:50:05

2023-10-09 12:36:08

人工智能數(shù)據(jù)

2025-02-05 23:21:32

2025-04-23 15:25:27

語言模型Eagle 2.5英偉達(dá)

2024-06-17 18:04:38

2019-11-21 09:25:23

AI 數(shù)據(jù)人工智能

2024-04-26 07:48:45

DockerLLama3模型

2024-06-19 13:02:01

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 国产在线精品一区二区三区 | 欧美久久免费观看 | a看片 | 国产亚洲一区二区三区在线观看 | 国产有码| 国产在线永久免费 | 国产精品区一区二 | 国产福利小视频 | 久久久这里都是精品 | 999精品在线 | 久久香焦 | 国产精品福利一区二区三区 | 久久一区视频 | 91在线精品一区二区 | 男女精品网站 | 成人av播放 | 日日摸日日碰夜夜爽亚洲精品蜜乳 | 日韩在线中文字幕 | 日韩高清一区二区 | 国产精品69毛片高清亚洲 | 成人h视频在线 | 一级片成人| 天天操天天干天天爽 | 欧美日韩网站 | 成人免费黄视频 | 久久成人精品一区二区三区 | 欧洲亚洲视频 | www.操.com| 亚洲国产一区二区在线 | 欧美成人一区二区三区片免费 | 久久久久国产精品免费免费搜索 | 亚洲激情一区二区三区 | 九九精品在线 | 欧美精品一区二区三区蜜桃视频 | 亚洲精品久久久久中文字幕欢迎你 | 久久久毛片 | 91免费视频| 97久久久| 国产夜恋视频在线观看 | 久久成人综合 | 北条麻妃99精品青青久久主播 |