成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

AI在這張“問卷”上首次超越人類,微軟登頂SuperGLUE

新聞 人工智能
自然語言理解(NLU)迎來新的里程碑。在最新的NLU測試基準SuperGLUE中,人類首次被AI超越了。

  本文經AI新媒體量子位(公眾號ID:QbitAI)授權轉載,轉載請聯系出處。

自然語言理解(NLU)迎來新的里程碑。

在最新的NLU測試基準SuperGLUE中,人類首次被AI超越了。

[[374400]]

SuperGLUE相比“前輩”GLUE大大提升了問題的難度,提出一年多以來,人類一直處于第一位。

現如今,人類一下子被兩家AI超越。

一個是來自微軟DeBERTa,一個是來自谷歌T5+Meena

AI在這張“問卷”上首次超越人類,微軟登頂SuperGLUE

超越人類的兩大NLU模型

對NLP領域的人來說,微軟DeBERTa模型并不陌生,早在去年8月微軟就開源了該模型的代碼,并提供預訓練模型下載。

AI在這張“問卷”上首次超越人類,微軟登頂SuperGLUE

最近,最近微軟訓練了更大規模的模型,該版本由15億參數的48個Transformer層組成。增大規模帶來的性能提升,使單個DeBERTa模型SuperGLUE上的得分(90.3)首次超過了人類(89.8),居于榜單首位。

DeBERTa(注意力分離的解碼增強BERT)是一種基于Transformer的神經語言模型,使用自監督學習對大量原始文本語料庫進行預訓練。

和其他預訓練語言模型(PLM)一樣,DeBERTa旨在學習通用語言表示形式,適應各種下游NLU任務。DeBERTa使用三種新技術——分離的注意力機制、增強的掩碼解碼器和一種用于微調的虛擬對抗訓練方法。改進了以前的最新PLM(如BERT、RoBERTa、UniLM)。

AI在這張“問卷”上首次超越人類,微軟登頂SuperGLUE

這項研究是由微軟研究團隊的4位華人學者完成。

AI在這張“問卷”上首次超越人類,微軟登頂SuperGLUE

另一超越人類的AI是由CMU博士生王子瑞提交的T5+Meena。這兩項技術均來自谷歌。

其中,Meena是一個26億參數端到端訓練的神經對話模型,它具有一個演進Transformer編碼器塊和13個演進Transformer解碼器塊。

編碼器負責處理對話上下文,幫助Meena理解對話中已經說過的內容。然后,解碼器使用該信息來制定實際響應。

AI在這張“問卷”上首次超越人類,微軟登頂SuperGLUE

T5是谷歌去年提出的“文本到文本遷移Transformer”,也就是用遷移學習讓不同的NLP任務可以使用相同的模型、損失函數和超參數,一個框架在機器翻譯、文檔摘要、問答和情感分析上都能使用。

T5最大的模型具有110億個參數,早在推出之時就取得了SuperGLUE上的最高水平,至今仍僅次于榜單前二模型和人類。

AI在這張“問卷”上首次超越人類,微軟登頂SuperGLUE

關于SuperGLUE

SuperGLUE是由Facebook、紐約大學、華盛頓大學和DeepMind四家機構于2019年8月提出的新NLU測試基準,以取代過去的GLUE。

AI在這張“問卷”上首次超越人類,微軟登頂SuperGLUE

由于之前微軟、谷歌和Facebook的模型連續刷新GLUE基準測試得分,已有不少AI模型超越了人類的表現。因此GLUE已不能順應NLU技術的發展,SuperGLUE應運而生。

我們從最初的GLUE基準測試中吸取的經驗教訓,并推出了SuperGLUE,這是一個采用了GLUE的新基準測試,具有一系列更加困難的語言理解任務、改進的資源和一個新的公共排行榜。

四家機構在SuperGLUE的官方文檔中如是說。

SuperGLUE總共包含10項任務,用于測試系統因果推理、識別因果關系、閱讀短文后回答是非問題等等方面的能力。SuperGLUE還包含Winogender,一種性別偏見檢測工具。

AI在這張“問卷”上首次超越人類,微軟登頂SuperGLUE

這些問題用當前最先進的算法還不能很好地解決,卻很容易被人類理解。

尤其是“選擇合理的替代方案”(COPA)這一項因果推理任務。它要求系統能根據給出的句子,在兩個選項中找出可能的原因或結果。比如:

那個男人的腳趾斷了。這是什么原因造出的?
備選答案1:他的襪子上有一個洞。
備選答案2:他把錘子掉在腳上了。

人類可以在COPA上獲得了100%的準確率,而BERT只有74%,這表明了NLU還存在巨大的進步空間。

現在SuperGLUE上超越了人類表現,微軟的研究人員認為:“這是通向通用AI的重要里程碑”。

微軟DeBERTa源代碼與預訓練模型:

https://github.com/microsoft/DeBERTa

谷歌T5和Meena:

https://ai.googleblog.com/2020/02/exploring-transfer-learning-with-t5.html

https://ai.googleblog.com/2020/01/towards-conversational-agent-that-can.html

 

 

責任編輯:張燕妮 來源: 量子位
相關推薦

2019-01-25 18:37:20

AI數據科技

2021-08-16 10:21:01

AI 數據人工智能

2024-04-11 12:30:40

2022-12-01 15:22:02

AI阿里騰訊

2024-04-22 07:00:00

AI駕駛

2010-12-22 09:50:21

ARMWindows

2021-07-28 11:54:09

阿里云AI自然語言理解

2020-10-18 18:02:32

AI機器學習微軟

2022-03-07 10:21:13

瀏覽器兼容性供應商

2023-09-05 15:09:31

人工智能

2021-01-27 14:24:17

人工智能AI國際象棋AI

2010-07-20 16:14:09

蘋果微軟

2023-12-12 12:43:04

AI模型

2025-01-27 12:04:37

2025-02-10 12:00:25

2022-08-05 14:59:21

iOS漏洞測試

2024-01-15 00:40:43

C#Java編譯器

2020-04-03 09:05:43

麻將 AI Suphx神經網絡

2023-09-15 11:01:51

人工智能
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 99精品久久久久久 | 欧美日韩精品中文字幕 | 四季久久免费一区二区三区四区 | 国产精品亚洲综合 | 视频1区2区 | 国产日韩一区二区 | 精品中文字幕在线观看 | 日韩国产一区二区三区 | 久久欧美高清二区三区 | 一区二区三区免费在线观看 | 久久久xxx | www.玖玖玖| 一区二区三区不卡视频 | 人人看人人射 | 免费一级欧美在线观看视频 | 一区二区在线免费观看 | 福利国产| 成人精品鲁一区一区二区 | 国产在线精品一区二区 | 精久久久 | 久久久国产视频 | 国产资源网 | 亚洲欧美国产毛片在线 | 韩日中文字幕 | 精品日韩欧美一区二区 | a看片| 久久久精品一区 | 日韩不卡一区二区三区 | 奇米四色在线观看 | 国产一区二区在线免费观看 | 中文字幕中文字幕 | 免费一级淫片aaa片毛片a级 | 精品99在线 | 精品久久久一区 | 日本一本视频 | 一级黄色片在线免费观看 | 中文字幕av亚洲精品一部二部 | 成人免费视频在线观看 | 国产成人av一区二区三区 | 国产精品视频久久久 | 精品久久久久久久人人人人传媒 |