成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

句法敏感的實體表示用于神經網絡關系抽取

原創
人工智能 深度學習
近年來基于神經網絡的關系抽取模型把句子表示到一個低維空間。這篇論文的創新在于把句法信息加入到實體的表示模型里。

句法敏感的實體表示用于神經網絡關系抽取。關系抽取任務大規模應用的一個主要瓶頸就是語料的獲取。近年來基于神經網絡的關系抽取模型把句子表示到一個低維空間。這篇論文的創新在于把句法信息加入到實體的表示模型里。

首先,基于Tree-GRU,把實體上下文的依存樹放入句子級別的表示。其次,利用句子間和句子內部的注意力,來獲得含有目標實體的句子集合的表示。

研究背景和動機

關系抽取任務大規模應用的一個主要瓶頸就是語料的獲取。遠程監督模型通過將知識庫應用于非結構化文本對齊來自動構建大規模訓練數據,從而減輕對人工構建數據的依賴程度,并使得模型跨領域適應能力得到增強。然而,在利用遠程監督構建語料的過程中,僅僅利用實體名稱進行對齊,而不同實體在不同關系下應該具有更加豐富的多樣的語義表示,從而導致錯誤標注等問題。因此,一套更加豐富的實體表示顯得尤為重要。

另一方,基于語法信息的方法通常作用于兩個實體之間的關系上,而語法信息是可以更加豐富實體的表示的。因此,本文基于句法上下文的實體表示來豐富實體在不同關系模式下的語義,并結合神經網絡模型處理關系抽取任務。

相關工作介紹

我們把相關的工作大致分成早期基于遠程監督的方法和近年來基于神經網絡模型兩類。

為了解決關系抽取任務嚴重依賴于標注語料的問題,Mintz et al.(2009)率先提出了基于遠程監督的方法構建標注語料。然而,這樣構建的自動標注語料含有大量的噪聲。為了緩解語料中噪聲帶來的影響,Riedel et al.(2010)將關系抽取看成是一個多實例單類別的問題。進一步的,Hoffmann et al.(2011)和Surdeanu et al.(2012)采取了多實例多類別的策略。同時,采用最短依存路徑作為關系的一個語法特征。上述方法典型的缺陷在于模型的性能依賴于特征模板的設計。

近年來,神經網絡被廣泛的應用于自然語言處理任務上。在關系抽取領域,Socher et al.(2012)采用循環神經網絡來處理關系抽取。Zeng et al.(2014)則構建了端到端的卷積神經網絡,進一步的,Zeng et al.(2015)假設多實例中至少有一個實例正確地表示了相應的關系。相比于假設有一個實例表示一對實體的關系,Lin et al.(2016)通過注意力機制挑選正面的實例更充分的使用了標注語料含有的信息。

以上這些基于神經網絡的方法大多數都使用詞層次的表示來生成句子的向量表示。另一方面,基于語法信息的表示也受到了眾多研究者的青睞,其中最主要的即最短依存路徑(Miwa and Bansal(2016)和Cai et al.(2016))。

主要方法

首先,基于依存句法樹,利用基于樹結構的循環神經網絡(Tree-GRU)模型生成實體在句子級別的表示。如上圖所示,有別于僅僅使用實體本身,我們能夠更好地表達出長距離的信息。具體的實體語義表示如下圖所示。我們使用Tree-GRU來獲得實體的語義表示。

其次,利用基于子節點的注意力機制(ATTCE,上圖)和基于句子級別的實體表示注意力機制(ATTEE,下圖)來減輕句法錯誤和錯誤標注的負面影響。

實驗結果

本文在NYT語料上進行了實驗。最終結果如上圖所示。其中,SEE-CAT和SEE-TRAINS分別是本文使用的兩種結合三種向量表示(句子的向量表示,兩個實體的向量表示)的策略。從圖中可以看出,本文提出的模型在相同數據集上取得了比現有遠程監督關系抽取模型更好的性能。

總結

本文的實驗結果表明,更豐富的命名實體語義表示能夠有效地幫助到最終的關系抽取任務。

團隊名稱:業務平臺事業部

作者:何正球,陳文亮,張梅山,李正華,張偉,張民

責任編輯:王雪燕 來源: 51CTO
相關推薦

2023-05-04 07:39:14

圖神經網絡GNN

2020-10-06 19:05:09

神經網絡人類思維人工智能

2017-03-07 13:55:30

自動駕駛神經網絡深度學習

2018-07-03 16:10:04

神經網絡生物神經網絡人工神經網絡

2018-09-09 23:58:25

可視化神經網絡模型

2025-02-25 14:13:31

2020-08-06 10:11:13

神經網絡機器學習算法

2018-01-29 00:16:16

神經網絡遞歸卷積深度學習

2017-05-15 22:45:43

神經網絡架構信息檢索

2017-11-10 11:51:39

Python自然語言分析器

2022-12-02 15:26:27

模型編碼

2023-06-18 23:00:39

神經網絡損失函數隨機變量

2017-05-31 12:59:44

神經網絡深度學習

2017-09-10 07:07:32

神經網絡數據集可視化

2020-09-02 14:13:02

神經網絡數據圖形

2018-01-04 15:50:44

深度學習自然語言機器學習

2022-04-07 09:01:52

神經網絡人工智能

2019-05-07 19:12:28

機器學習神經網絡Python

2017-05-04 18:30:34

大數據卷積神經網絡

2017-10-22 22:15:57

神經網絡金融時序預測機器學習
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 精品不卡 | 99精品久久 | 欧美一区二区三区一在线观看 | av中文字幕网站 | 天天操网 | 日韩欧美亚洲 | 国产成人av一区二区三区 | 国产精品一区二区免费 | 欧美一级电影免费 | 国产一区三区视频 | 国产精品久久久久久久久免费樱桃 | 国产精品视频专区 | 日韩视频在线播放 | 国产 欧美 日韩 一区 | 日韩在线一区二区三区 | 国产精品夜色一区二区三区 | 亚洲成色777777在线观看影院 | 亚洲免费观看视频 | 日韩一区中文字幕 | 国产不卡视频 | 好好的日在线视频 | 久久久久久久一区二区三区 | 亚洲自拍偷拍免费视频 | 亚洲欧美在线视频 | 日本黄色片免费在线观看 | 1000部精品久久久久久久久 | 国产日韩久久 | 一级电影免费看 | 日本色婷婷 | 在线视频一区二区三区 | 一区二区成人 | 亚洲aⅴ| 亚洲视频在线观看 | 免费观看一区二区三区毛片 | 影音先锋中文字幕在线观看 | 中文字幕亚洲区一区二 | 久久久精品一区 | 成人在线免费电影 | 成人免费视频一区二区 | 日韩av一二三区 | 伊人久操|