成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

谷歌開源“窮人版”摘要生成NLP模型:1000個樣本就能打敗人類

新聞 Android
BERT、GPT-2、XLNet等通用語言模型已經展現了強大的威力,它們可以應付各類任務,比如文本生成、問答。當這些模型對各種語言任務進行微調時,可以達到SOTA性能。

 本文經AI新媒體量子位(公眾號ID:QbitAI)授權轉載,轉載請聯系出處。

BERT、GPT-2、XLNet等通用語言模型已經展現了強大的威力,它們可以應付各類任務,比如文本生成、問答。當這些模型對各種語言任務進行微調時,可以達到SOTA性能。

谷歌開源“窮人版”摘要生成NLP模型:1000個樣本就能打敗人類

以上這些NLP模型都是“通才”,雖然全面,但在面向特定任務時需要微調,訓練數據集也十分龐大,非一般人所能承受。

如果開發一個非通用NLP模型,專門針對某項具體任務,在降低訓練成本的同時,性能會不會提高呢?

這就是谷歌發布的“天馬”(PEGASUS)模型,它專門為機器生成摘要而生,刷新了該領域的SOTA成績,并被ICML 2020收錄。

[[330133]]

“天馬”模型僅使用1000個樣本進行訓練,就能接近人類摘要的水平,大大減少了對監督數據的需求,創造了低成本使用的可能性。

從填空到生成摘要

PEGASUS的全稱是:利用提取的間隙句進行摘要概括的預訓練模型(Pre-training with Extracted Gap-sentences for Abstractive Summarization)。就是設計一種間隙句生成的自監督預訓練目標,來改進生成摘要的微調性能。

在之前的NLP研究中,自監督預訓練對下游的目標并不清楚,可能是文本生成、也可能是摘要提取,模型傾向于通用性。

而來自谷歌的研究者認為,自監督預訓練目標越接近最終的下游任務,微調性能越好。

那論文標題中的間隙句(Gap-sentences)又是什么意思?

在“天馬”模型的預訓練中,研究者從一段文檔中刪掉一些句子,讓模型進行恢復任務。這些隔空刪掉的句子即為間隙句。

這樣一項具有挑戰性的任務促使模型學習發現一般事實的能力,以及學習如何提取從整個文檔中獲取的信息。

谷歌開源“窮人版”摘要生成NLP模型:1000個樣本就能打敗人類

谷歌發現,選擇“重要”句子去遮擋效果最好,這會使自監督樣本的輸出與摘要更加相似。

作者選擇了12個不同數據集,內容豐富多樣,包括新聞、科學論文、專利文件、短篇小說、電子郵件、法律文件和使用說明,表明該模型框架適用于各種主題。

與谷歌之前提出的T5對比,參數數量僅為T5的5%。

谷歌根據ROUGE標準對輸出結果進行評判,通過查找與文檔其余部分最相似的句子來自動識別這些句子。

ROUGE使用n元語法重疊來計算兩個文本的相似度,分數從0到100。

1000個訓練樣本即超過人類

盡管PEGASUS在大型數據集上表現出了卓越的性能,但令人驚訝的是,“天馬”模型并不需要大量的樣本來進行微調,就可以達到近乎SOTA的性能。

下圖展示了在四個選定的摘要數據集中,ROUGE得分與監督樣本數量的關系。虛線表示具有全監督但沒有預訓練的Transformer編碼器-解碼器的性能。

谷歌開源“窮人版”摘要生成NLP模型:1000個樣本就能打敗人類

與基線相比,即使僅用1000個微調樣本,“天馬”在大多數任務中的性能還是要好一些。要考慮到,在某些實際情況下,樣本數量還要多幾個數量級。

這種“樣本效率”極大地提高了文本摘要模型的實用性,因為它大大降低了監督數據收集的規模和成本。

除了機器給出的ROUGE評分外,谷歌還進行了一項鑒別摘要的“圖靈測試”。

谷歌將模型生成的摘要和人類提取的摘要放在一起,給用戶進行評估。在3個不同數據集上進行的實驗表明,打分的人有時會更喜歡機器生成的摘要。

谷歌開源“窮人版”摘要生成NLP模型:1000個樣本就能打敗人類
谷歌開源“窮人版”摘要生成NLP模型:1000個樣本就能打敗人類

當然,“天馬”模型并非沒有缺點,谷歌就找到了一個bug。

作者從XSum數據集中尋找了一段話,其中提到了英國4艘護衛艦的名字,通篇沒有提到4,“天馬”還是正確提取出了護衛艦數量信息。

軍艦的數量從2~5的時候都沒有問題,當數量增加到6時,“天馬”錯誤地認為有7艘。這說明模型“符號推理”的數量有限。

最后,為了支持該持續研究并確保可重復性,谷歌在GitHub上發布了“天馬”的代碼、模型checkpoint以及其他匯總數據集。

傳送門

博客地址:
https://ai.googleblog.com/2020/06/pegasus-state-of-art-model-for.html

論文地址:
https://arxiv.org/abs/1912.08777

代碼地址:
https://github.com/google-research/pegasus

 

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-02-06 08:45:22

2020-09-07 14:15:16

AI 數據人工智能

2021-09-01 00:02:42

人工智能機器學習技術

2021-12-10 15:46:18

谷歌模型人工智能

2020-03-17 09:42:00

谷歌開源機器學習

2020-08-26 11:50:25

谷歌開源工具

2021-09-14 10:11:46

谷歌3D舞蹈生成模型FACT

2023-02-25 21:45:55

模型AI

2020-06-18 11:14:53

微軟谷歌開源

2022-03-25 14:24:18

谷歌自然語言算法

2009-10-10 11:18:54

谷歌Android

2021-10-29 13:53:13

谷歌Chrome OS筆記本

2019-09-10 13:48:12

NLP神經網絡模型

2023-07-14 11:47:08

AI醫生

2025-03-06 10:18:32

谷歌AI搜索純AI版搜索引擎

2022-11-11 15:06:17

模型AI

2019-10-25 10:25:19

開源技術 趨勢

2018-04-30 18:07:51

谷歌開源編程

2021-11-19 10:13:01

模型人工智能計算

2009-03-04 09:27:25

谷歌Twitter電子郵件
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产精品二区三区 | 九色 在线 | 中文字幕一区二区三区四区五区 | 欧美一级毛片久久99精品蜜桃 | 天天夜碰日日摸日日澡 | 精品丝袜在线 | 国产激情精品 | 久久久久久电影 | 欧美日韩在线一区二区 | 欧美日韩国产精品一区 | 欧美激情一区二区 | 日韩精品一二三区 | 国产精品一区二区三区在线 | 日一区二区 | 亚洲国产一区在线 | 奇米超碰 | 婷婷综合网 | 日本成人片在线观看 | 欧美成人一区二区 | 99一级毛片 | 午夜男人的天堂 | 一区二区三区欧美在线观看 | 国产美女视频一区 | 奇米av | com.色.www在线观看 | 成人做爰69片免费观看 | 日韩久久久久 | 欧美在线日韩 | 国产精品久久久久久久久久久久久 | 国产精品一区久久久 | 国产精品亚洲精品久久 | 久久国产欧美日韩精品 | 国产精品免费观看 | 国产欧美一区二区三区久久 | 国产欧美精品一区二区三区 | 国产成人免费视频网站高清观看视频 | 精品国产乱码久久久久久88av | 一区二区三区四区电影 | 2018天天干天天操 | 日韩精品一区二区三区视频播放 | 亚洲国产一区二区三区在线观看 |