成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

<table id="61661"><fieldset id="61661"><legend id="61661"></legend></fieldset></table>

<th id="61661"></th>

<input id="61661"><small id="61661"></small></input>

<tfoot id="61661"></tfoot>

鴻蒙開發者社區

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發者社區

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發者社區訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業版APP

鴻蒙開發者社區視頻號

51CTO軟考題庫

賬號設置退出

擔心GPT-3被喂假消息？谷歌新研究，將知識圖譜轉“人話”來訓練

作者：蕭簫 2021-06-04 16:15:36

新聞人工智能知識圖譜

他們做了個名為TEKGEN的AI模型，直接將知識圖譜用“人話”再描述一遍，生成語料庫，再喂給NLP模型訓練。

本文經AI新媒體量子位（公眾號ID:QbitAI）授權轉載，轉載請聯系出處。

還在擔心大語言模型“啥都吃”，結果被用假信息訓練了？

放在以前，這確實是訓練NLP模型時值得擔心的一個難題。

現在，谷歌從根本上解決了這個問題。

他們做了個名為TEKGEN的AI模型，直接將知識圖譜用“人話”再描述一遍，生成語料庫，再喂給NLP模型訓練。

擔心GPT-3被喂假消息？谷歌新研究，將知識圖譜轉“人話”來訓練

這是因為，知識圖譜的信息來源往往準確靠譜，而且還會經過人工篩選、審核，質量有保障。

目前，這項研究已經被NAACL 2021接收。

擔心GPT-3被喂假消息？谷歌新研究，將知識圖譜轉“人話”來訓練

如何讓AI用“人話”描述知識圖譜？

谷歌用來描述知識圖譜的TEKGEN模型，全名Text from KG Generator（知識圖譜文本生成器）。

它會讀取一個知識圖譜中的所有詞語，捋清它們之間的關系，再用“人話”說出來。

從下圖中來看，轉換語句分為2步：

首先，將關系圖譜中的詞語，按邏輯進行排列；然后，再添加一些詞語、并調整語句間的邏輯關系，將它們變成一段完整的話。

擔心GPT-3被喂假消息？谷歌新研究，將知識圖譜轉“人話”來訓練

為了實現這個功能，TEKGEN包含4個部分：

三元組（包含主語、賓語、關系詞）生成器。將維基百科的知識圖譜、和維基百科文本描述進行對應，生成訓練數據集。
T5的文本-文本生成器，用于將三元組轉換成文本信息。
實體子圖創建器。用于將三元組中的文本信息轉換成語句。
語義質量濾波器。這部分用來處理低質量的輸出，保證生成的語句質量。

擔心GPT-3被喂假消息？谷歌新研究，將知識圖譜轉“人話”來訓練

整體來看，用TEKGEN生成語句的流程是這樣的：

擔心GPT-3被喂假消息？谷歌新研究，將知識圖譜轉“人話”來訓練

生成后的語句，就能用來放心地訓練大語言模型了。

這份生成的語料庫，由4500萬個三元組生成，組合起來的句子有1600萬句。

擔心GPT-3被喂假消息？谷歌新研究，將知識圖譜轉“人話”來訓練

那么，用這個語料庫訓練的NLP模型，是否真能取得更好的效果呢？

“滿分5分，人類給它4.3分”

先來看幾個連詞成句的實例效果。

從輸入的詞語來看，只有主語、賓語，以及這兩個詞語之間的關系。

擔心GPT-3被喂假消息？谷歌新研究，將知識圖譜轉“人話”來訓練

但TEKGEN似乎“悟”出了什么，很快就將這些句子組合成了一段正常的語句。

不僅時間、地點、從屬關系等分得非常清楚，邏輯上也符合我們平時說話的語序。

那么，滿分5分的話，人類對于AI的“圖文轉換”能力給出幾分呢？

谷歌找了些志愿者來進行測評，從結果來看，TEKGEN在“語義”和“流暢度”兩方面，均取得了4.3分以上的好成績。

擔心GPT-3被喂假消息？谷歌新研究，將知識圖譜轉“人話”來訓練

當然，這里面也用LAMA（LAnguage Model Analysis） probe，來對用這個語料庫訓練的模型進行了評估。

在Google-RE和TREx兩個數據集上，經過預訓練的模型，在各項任務上均取得了非常好的效果。

擔心GPT-3被喂假消息？谷歌新研究，將知識圖譜轉“人話”來訓練

說不定，將來真能讓AI去試試高考語文的“圖文轉換”題：

擔心GPT-3被喂假消息？谷歌新研究，將知識圖譜轉“人話”來訓練

作者介紹

論文一作小姐姐Oshin Agarwal，是賓夕法尼亞大學的計算機系在讀博士生，研究方向是自然語言處理中的信息抽取。

這篇論文，是她在谷歌實習期間完成的。

來自谷歌的Heming Ge、Siamak Shakeri和Rami Al-Rfou也參與了這項工作。

目前，作者們已經將這個用知識圖譜生成的語料庫放了出來。

想要訓練NLP模型的小伙伴，可以用起來了~

論文地址：
https://arxiv.org/abs/2010.12688

用知識圖譜生成的語料庫：
https://github.com/google-research-datasets/KELM-corpus

責任編輯：張燕妮來源：量子位

人工智能機器學習技術

51CTO技術棧公眾號

業務
速覽

媒體

51CTO CIOAge HC3i

社區

51CTO博客鴻蒙開發者社區 AI.x社區

教育

51CTO學堂精培企業培訓 CTO訓練營

主站蜘蛛池模板：午夜免费观看 | 伊人久久综合 | 精品亚洲第一 | 日日操操操 | 天天想天天干 | 成人免费视频网址 | 国产精品免费福利 | 国产免费视频 | 国产日韩欧美一区二区 | 夏同学福利网 | 日韩在线欧美 | 国产成年人小视频 | 一级a性色生活片久久毛片波多野 | 国产精品久久久一区二区三区 | 亚洲日本视频 | 日本免费在线观看视频 | 成av在线 | 国产成人短视频在线观看 | 免费a网| 一区二区三区四区在线 | 91精品国产麻豆 | 欧美激情视频一区二区三区在线播放 | 在线播放亚洲 | 国产精品成人在线播放 | 日韩国产欧美视频 | 成人午夜电影网 | 久久久91精品国产一区二区三区 | 午夜视频在线观看视频 | 国产精品久久久久久久一区探花 | 青草久久免费视频 | 久久精品亚洲欧美日韩精品中文字幕 | 亚洲视频免费在线观看 | 男女黄网站| 午夜精品久久久久久不卡欧美一级 | 国产精品一区二区久久精品爱微奶 | 亚洲精品1| 日韩成人影院 | 久久久91精品国产一区二区精品 | 亚洲精品毛片av | 99国产精品久久久 | 欧美日韩免费在线 |

<tfoot id="11611"><em id="11611"><ul id="11611"></ul></em></tfoot>

<th id="11611"><acronym id="11611"><span id="11611"></span></acronym></th>

<strike id="11611"></strike>

<kbd id="11611"><abbr id="11611"></abbr></kbd>

<tfoot id="11611"></tfoot>