成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

中科大ICLR2025:特定領域僅用5%訓練數據,知識準確率提升14%

人工智能 新聞
來自中國科學技術大學MIRA實驗室的王杰教授團隊提出了提出了一個創新的框架——知識圖譜驅動的監督微調(KG-SFT),該框架通過引入知識圖譜(KG)來提升大語言模型(LLMs)在特定領域的知識理解和處理能力。

讓大語言模型更懂特定領域知識,有新招了!

來自中國科學技術大學MIRA實驗室的王杰教授團隊提出了提出了一個創新的框架——知識圖譜驅動的監督微調(KG-SFT),該框架通過引入知識圖譜(KG)來提升大語言模型(LLMs)在特定領域的知識理解和處理能力。

實驗結果表明,其在多個領域和多種語言的數據集上取得了顯著的效果,成功入選ICLR 2025

圖片

截至目前,LLMs在常識問答方面表現越來越出色,但它們對領域知識的理解和推理能力仍然有限。

由于難以深入理解專業領域問答背后所蘊含的復雜知識和邏輯關系,因此在面對這類問題時,往往無法準確地給出正確的答案和詳細的推理過程,這極大地限制了其在專業領域的應用價值。

尤其是在數據稀少和知識密集型的場景中,如何讓LLMs更好地理解和操縱知識,成為了研究的關鍵

而中科大MIRA實驗室的這項工作即圍繞此展開。

KG-SFT是如何工作的

KG-SFT針對LLMs難以理解領域問答背后的知識和邏輯,導致推理能力弱的問題,提出基于知識圖譜增強的大語言模型監督微調技術。

KG-SFT首先通過解析領域知識圖譜中的多條推理路徑,設計圖上推理路徑與文本推理過程的聯合生成機制。使LLMs在監督微調過程中,能夠同步輸出推理答案以及蘊含豐富領域知識和邏輯關系的推理過程,從而提升其對領域知識的理解與推理能力。

KG-SFT框架的核心在于將知識圖譜與監督微調相結合,通過生成問答背后的邏輯嚴密的推理過程解釋來增強LLMs對知識和邏輯的理解。

該框架包含三個關鍵組件:

  • Extractor(提取器)
  • Generator(生成器)
  • Detector(檢測器)

圖片

1、Extractor:精準提取知識關聯

Extractor首先對問答對(Q&A)中的實體進行識別,并從外部知識圖譜中提取相關的推理子圖。

這一步驟揭示了Q&A對背后的知識關聯和邏輯,為后續的解釋生成提供了基礎。

通過命名實體識別(NER)和多條推理路徑的檢索,Extractor能夠有效地從大規模知識圖譜中獲取與問題相關的知識。

2、Generator:生成流暢的解釋

Generator利用圖結構重要性評分算法(如HITS算法)對推理子圖中的實體和關系進行評分,選擇高分部分作為重要內容。

然后,使用大型語言模型(如ChatGPT)生成流暢的解釋草稿。

這些解釋不僅邏輯清晰,而且能夠幫助LLMs更好地理解問題和答案之間的關系。

3、Detector:確保解釋的正確性

Detector對生成的解釋草稿進行句子級別的知識沖突檢測,確保解釋的正確性。

通過自然語言推理(NLI)模型(如DeBERTa)和重新引導機制,Detector能夠標記并糾正可能存在的知識沖突,從而提高解釋的可靠性。

實驗結果及創新點

實驗結果表明,KG-SFT在多個領域和語言設置中均取得了顯著的性能提升。

特別是在低數據醫學問答任務上,KG-SFT在英語場景中僅使用5%的訓練數據就比傳統方法提高了近14%的準確率

圖片

從創新之處來看,KG-SFT不僅關注數據的數量,更注重數據的質量。

通過生成高質量的解釋,KG-SFT幫助LLMs更好地理解和操縱知識,從而在特定領域實現更優的性能。

此外,KG-SFT還可以作為插件式模塊與現有的數據增強方法結合使用,進一步提升性能。

圖片

在多領域數據集上的實驗結果進一步驗證了KG-SFT的廣泛適用性。

盡管在某些需要復雜推理的領域(如形式邏輯和專業會計)中表現稍遜,但整體性能依然具有較強的競爭力。

圖片

概括而言,KG-SFT框架通過結合知識圖譜和LLMs,有效地提升了監督微調數據的質量,從而顯著提高了LLMs在特定領域的性能。

這一方法不僅在低數據場景中表現出色,還展示了其作為插件式模塊與現有數據增強方法結合的潛力。

論文作者第一作者陳瀚鑄是中國科學技術大學2021級碩博連讀生,師從王杰教授,主要研究方向為大語言模型、知識圖譜和推理數據合成。

更多細節歡迎查閱原論文。

論文地址:
https://openreview.net/pdf?id=oMFOKjwaRS

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-04-10 09:19:52

2025-04-10 09:15:03

2025-05-26 09:41:26

2024-11-04 13:30:00

模型AI

2022-09-25 17:07:27

訓練圖像

2021-12-06 09:53:09

自然語言神經網絡人工智能

2023-03-03 18:31:23

網絡承運商路由

2017-03-23 17:09:45

2024-09-12 13:50:00

模型訓練

2013-06-19 11:32:32

計算性能ISCHPC

2024-04-22 13:35:00

AI數據

2024-11-11 17:27:26

2023-12-04 13:23:00

數據訓練

2024-06-17 07:10:00

2022-04-13 10:31:04

微軟Jigsaw大型語言模型

2025-02-27 14:10:00

模型AI訓練

2012-11-23 10:15:55

SCC12全球超級計算大會

2021-05-07 09:34:20

量子芯片計算機

2021-08-10 16:01:18

模型人工智能深度學習

2021-11-17 16:13:45

IBM 處理器量子
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 熟女毛片| 亚洲国产精品久久久久婷婷老年 | 亚洲精品视频免费观看 | 欧美精品成人一区二区三区四区 | 亚洲成av | 美女视频h | 91精品欧美久久久久久久 | 玖玖免费| 久久一区视频 | 羞羞的视频在线 | 午夜国产一区 | 精品欧美一区二区三区久久久小说 | 日日操日日干 | 国产欧美日韩在线播放 | www.亚洲免费| 黄色一级大片在线免费看产 | 国产ts人妖系列高潮 | 亚洲国产成人精品女人久久久野战 | www.亚洲一区二区三区 | 日韩中文字幕在线不卡 | 亚洲精品免费观看 | 日韩欧美在线观看 | 91亚洲一区 | 欧美 日韩 国产 成人 | 韩日在线视频 | 国产91在线 | 亚洲 | 欧一区| 九色在线视频 | 亚洲a在线观看 | 91高清在线观看 | 亚洲精品区 | 日韩另类视频 | 亚洲成人三区 | 久久一 | av官网在线 | 亚洲欧美日韩国产综合 | 日韩中文一区二区三区 | 国产目拍亚洲精品99久久精品 | 精品久久久久久中文字幕 | 91在线一区二区 | 亚洲人成网站777色婷婷 |