成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

超過Google,微信AI在NLP領域又獲一項世界第一

新聞 人工智能
微信AI,NLP領域又獲一項世界第一,這次是在機器閱讀理解方面。

本文經AI新媒體量子位(公眾號ID:QbitAI)授權轉載,轉載請聯系出處。

微信AI,NLP領域又獲一項世界第一,這次是在機器閱讀理解方面。

在專門考驗計算機數學推理能力的DROP數據集上,微信AI最新方案超過了Google Research,排名第一,成為SOTA。

今年3月,在第七屆對話系統技術挑戰賽(DSTC7)上,首次亮相的微信智言團隊一路過關斬將,最終拿下冠軍。

超過Google,微信AI在NLP領域又獲一項世界第一

不過這一次,微信AI團隊說,這不僅是他們在機器閱讀理解方面的進展,也是他們在數學推理方面的第一篇工作。

這一方案,并沒有以當前業界主流的BERT為核心,而是以數字感知的圖神經網絡(NumGNN)方案為基礎。

微信AI團隊介紹,在NumGNNd為核心的情況下,結合NAQANet的基礎模塊以及改進的前處理方法,在不使用BERT、RoBERTa等預訓練模型的條件下,就能獲得了高達67.97%的F1值。

在實際提交到榜單上的NumNet+上,他們又進一步融入RoBERTa的能力,并增加了對多span型問題的支持,從而使單模型 F1值能夠高達82.99%。

從而,他們也得出了一個結論:

即使不使用BERT等預訓練模型,模型的效果就已經比使用BERT的好了。

微信AI團隊說,這一方案可以幫助人工智能提升閱讀理解能力和邏輯推理能力,將來也會將其中的技術應用到騰訊小微智能對話助手中。

不過區別于谷歌和百度等智能語音助手的To C產品形式,目前騰訊小微智能對話助手,主要還是以云服務形式對外輸出。

微信成績意味著什么?AI考數學

先從數據集DROP說起。

DROP數據集,由AI2(Allen Institute for Artificial Intelligence)實驗室提出,主要考察的是模型做類似數學運算相關的操作能力。

(小巧合,微信之父張小龍英文名也叫Allen,但allen.ai的域名屬于AI2)

與SQuAD數據集中大多都是“劉德華老婆是誰?”的問題不同,其中的問題會涉及到數學運算的情況。

比如說,給我們5個人每個人買2個蛋撻,一共要買幾個蛋撻?

這個問題對于人來說很簡單,但對于機器來說卻很困難。

微信AI團隊解釋了這背后的原因:機器不僅要能夠比較數字相對的大小,還要能夠知道和哪些數字做比較并進行推理,這就需要把數字相對的大小等等知識注入模型。

但在之前大多數機器閱讀理解模型中,基本上都將數字與非數字單詞同等對待,無法獲知數字的大小關系,也不能完成諸如計數、加減法等數學運算。

正是基于這一原因,微信AI團隊提出了一種數字感知的圖神經網絡(numerically-aware graph neural network,NumGNN),并基于此提出了NumNet。

超過Google,微信AI在NLP領域又獲一項世界第一

一方面利用圖的拓撲結構編碼數字間的大小關系,將文章和問題中的數字作為圖結點,在具有“>”和“<=”關系的數字間建立有向邊,從而將數字的大小關系作為先驗知識注入模型。

具體來講,給定一個問題和一段文本,先把問題里面的數字和文本里面的數字都抽出來。

每個數字就是圖上一個節點,同時對于任意兩個數字,假如A數字和B數字,如果A大于B的話,那么A和B中間加一條有向邊,表示數字A和B之間是A大于B的關系。

如果A小于等于B,則會加另外一種有向邊,把它們兩個連接起來。通過這種操作,用圖的拓譜結構把數字相對大小知識注入模型。

另一方面,是結合文本信息去做更復雜的數學推理,具體的實現方式是使用圖卷積神經網絡在前述圖結構上執行推理,從而支持更復雜的數學推理功能。

超過Google方案,斬獲全球第一

在DROP數據集的LEADERBOARD上,微信AI團隊的方案為NumNet+。

微信AI團隊介紹稱,這一方案的基礎與NumNet一樣,都是NumGNN。

在新的方案中,用預訓練模型替換了NumNet中的未經過預訓練的Transformer作為encoder,進一步融入了RoBERTa的能力以及對多span型問題的支持。

從而實現了單模型 F1值 82.99%的效果,一舉超過Google Research的BERT-Calculator Ensemble方案,成為榜單第一。

盡管取得的效果還不錯,但在微信AI團隊來看,但還有很多缺陷。

[[279600]]

比如說,目前能夠支持的數學表達式種類還是受到一定限制。尤其是DROP數據集的局限,其對文本理解的要求更高,但需要的數學推理難度比解數學應用題那類問題來得相對簡單一點。

微信AI團隊說,如何把兩者更好的結合起來,使得整個模型的能力進一步的提升,是他們下一步考慮的問題。

而且,他們也說,并不會把注意力集中在用GNN來解決數字推理的問題上,后面也會重點去考慮其他的方式。

更具體來說,是能夠將arithmetic word problems (AWPs)相關工作中處理復雜數學表達式相關的方法能夠進行吸收融合,進一步提升模型的推理能力。

更多詳情,可以前往DROP數據集LEADERBOARD:

https://leaderboard.allenai.org/drop/submissions/public

而微信AI這次的研究成果,已經被EMNLP2019收錄,論文也已公開發表:

NumNet: Machine Reading Comprehension with Numerical Reasoning

https://arxiv.org/abs/1910.06701

項目地址:

https://github.com/llamazing/numnet_plus

 

責任編輯:張燕妮 來源: 量子位
相關推薦

2017-07-04 10:02:58

AMDVega專業卡

2021-07-08 10:13:04

AI 數據人工智能

2021-01-19 22:16:21

5G基站手機

2013-12-17 10:06:40

2013-12-09 14:36:20

2011-03-03 20:53:28

程序員人才

2014-05-19 16:15:26

天河二號超級計算機

2013-06-19 09:58:03

2010-05-27 10:49:03

寬帶

2023-09-14 13:23:00

AI芯片

2019-08-02 10:36:33

人工智能AI芯片

2016-10-20 16:22:01

存儲

2015-05-18 10:28:19

AndroidiOS應用

2021-12-09 09:56:38

量子計算芯片超算

2011-06-03 09:31:17

2012-06-19 09:34:15

2013-10-21 15:45:30

Android筆記本聯想

2016-10-11 17:27:09

5G網絡網絡通信
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 不卡视频一区 | 毛片99 | 国产精品久久久久久久午夜片 | 欧美中文字幕在线 | 日韩免费一区 | 国产www成人| 日日天天| www精品美女久久久tv | 精品一级毛片 | 色网站在线| 欧美黄色片 | 国产一区二区在线免费观看 | 久久高清免费视频 | 四虎最新地址 | 手机看片在线播放 | 国产日产久久高清欧美一区 | 精品日韩在线观看 | 中文在线一区二区 | 黄视频免费在线 | 91不卡 | 欧美一级免费看 | 精品小视频 | 天天干夜夜操视频 | 夜夜爽夜夜操 | 一区二区三区在线 | 欧 | 国产日韩一区二区三区 | 青青草av| 狠狠操电影 | 日批免费观看 | 亚洲视频免费 | 一级全黄少妇性色生活免费看 | 国产精品成人一区二区 | 国产传媒| 国产中文字幕av | 午夜精品导航 | 亚洲一区国产 | 毛片一区二区三区 | 夜夜爽99久久国产综合精品女不卡 | 亚洲理论在线观看电影 | 日韩不卡在线观看 | 亚洲91精品 |