成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

AI高分通過美國8年級科學考試:常識題推理題都能行,不服同臺對戰

人工智能
只要60分飄過八年級科學考試,就能收獲8萬美元獎金(折合人民幣57萬元)。只不過,參加考試的“學生”,必須是個AI。

只要60分飄過八年級科學考試,就能收獲8萬美元獎金(折合人民幣57萬元)。

[[276019]]

只不過,參加考試的“學生”,必須是個AI。

在長達四年的時間里,700多名計算機科學家參與到這項AI競賽當中,但他們的AI紛紛折戟,沒有一個能拿到及格分。

但現在,歷史新紀錄來了。艾倫研究所的一個名叫Aristo的AI搞定了這件事,不僅在8年級科學考試中答對了90%以上的問題,連高三的考試,它都能答對80%!

AI高分通過美國8年級科學考試:常識題推理題都能行,不服同臺對戰

這對于AI來說,有點鵝妹子嚶了。

語言理解+邏輯,難倒AI

雖然AI下圍棋能贏世界冠軍,打德撲還會詐唬,IBM的Watson也早在智力問答《危險邊緣(Jeopardy!)》中大殺四方,但想要通過美國八年級科學考試,對AI來說仍然是一大挑戰。

即使排除了圖片題和圖表題,科學考試中的問答依然不是簡單的自然語言理解問題,還涉及到邏輯推理乃至常識——答案并不是明顯存在于某處文本中的。

舉個例子,在考試中,有的問題比較簡單,只涉及到信息檢索:

一組協同工作以執行特定功能的組織稱為:

(1)器官

(2)有機體

(3)系統

(4)細胞

但有的問題它長這個樣子:

什么樣的改變會導致區域內的松鼠數量減少?

(1)食肉動物數量減少

(2)松鼠之間的競爭減弱

(3)食物增加

(4)森林火災發生次數增多

這可就不是AI光靠學習規則就能回答的問題了,其中牽扯到的邏輯推理,對人類而言或許是小菜一碟,但對AI來說,并沒有那么簡單。

甚至還有多選問題。

就在AlphaGo震驚世界的2016年,最強的AI系統也只能在紐約州八年級科學考試中達到59.3%的準確率,遺憾未能及格。

基于Bert的Aristo

Aristo是怎樣實現突破的呢?

其實,它是站在了巨人的肩膀之上。

Aristo基于艾倫研究所的深度語境化詞表征ELMo(NAACL 2018最佳論文)和大名鼎鼎的BERT開發(現已替換為RoBERTa),集八種類型智能體于一身,有的智能體負責在數據庫中查找答案,有的負責檢查相關概念列表(元組),還有的專門執行邏輯推理。

AI高分通過美國8年級科學考試:常識題推理題都能行,不服同臺對戰

每個智能體都會為答案打分,而Aristo會對不同的分數進行加權,最終做出選擇決策。

AI高分通過美國8年級科學考試:常識題推理題都能行,不服同臺對戰

在實驗測試中,研究人員讓Aristo參加了2017年到2019年各個年級的紐約州會考,結果顯示,Aristo在4年級和8年級的考試中正確率都到達了90%左右,符合紐約州教育部認定的“優秀標準”(85%)。而12年級考試的正確率則是83.54%,離優秀只差了一點點。

AI高分通過美國8年級科學考試:常識題推理題都能行,不服同臺對戰

在此之前,這些考試數據并不在Aristo的訓練集中。

并且,現在Aristo的答題范圍不僅僅局限在文字問題中了,涉及到計算機視覺的圖表題,它也正在拿下。

AI高分通過美國8年級科學考試:常識題推理題都能行,不服同臺對戰
AI高分通過美國8年級科學考試:常識題推理題都能行,不服同臺對戰

在接受媒體采訪時,Aristo項目的高級經理Peter Clark表示:

Aristo的目標不僅僅是通過科學考試,而是創造一個對科學有更深入理解的系統。

雖然如從事類似研究的微軟研究員Jingjing Liu所說,實際上,Aristo仍然不具備“真正”的智能,我們無法將Aristo的能力與人類學生的推理能力相比較。但無疑,它創造了一個很好的應用方向。

比如更強大的搜索,比如個性化教育。

AI高分通過美國8年級科學考試:常識題推理題都能行,不服同臺對戰

對了,Aristo現在有了在線Demo,可以在線調戲喲。

傳送門

Demo:

http://aristo-demo.allenai.org/

數據集:

http://data.allenai.org/ai2-science-questions/

相關論文:

https://allenai.org/papers/papers-aristo-2019.html

 

責任編輯:武曉燕 來源: 今日頭條
相關推薦

2024-06-06 09:18:48

2025-03-03 09:40:00

2022-12-28 13:57:56

AI模型語言

2022-06-09 09:48:46

AI預測醫療

2019-09-19 16:10:14

人工智能AI

2023-08-11 14:01:35

GPT-4推理

2011-09-17 19:40:57

計算機等級考試

2025-04-03 02:25:00

2009-04-27 13:43:15

軟件設計師沖刺預測題

2011-09-17 19:31:01

計算機等級考試

2011-09-17 19:44:59

計算機等級考試

2011-09-17 19:56:00

計算機等級考試

2011-09-17 19:34:08

計算機等級考試

2011-09-17 20:04:38

計算機等級考試

2024-11-01 11:55:14

2019-07-16 11:13:06

阿里自然語言理解AI

2024-06-11 08:55:00

2023-12-04 13:52:00

模型數據
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 一级做a爰片性色毛片视频停止 | 婷婷不卡| 中文字幕高清一区 | 国产在线观看不卡一区二区三区 | 久久精品欧美一区二区三区麻豆 | 中文字幕国产一区 | 国产一区二区免费在线 | 午夜av影院| 精品一区二区免费视频 | 成人久久网 | 91麻豆精品国产91久久久更新资源速度超快 | 人人九九精 | 久久久久亚洲国产| 国产精品免费一区二区三区四区 | 天堂资源最新在线 | 一区二区三区视频在线观看 | 欧美久久精品一级黑人c片 91免费在线视频 | 97影院2| 亚洲一区国产 | 日韩国产中文字幕 | 国产精品精品久久久 | 欧美日韩综合 | 伊人99 | 91免费在线视频 | 成人在线免费视频 | 日韩在线资源 | 国产精品久久久久无码av | 国产激情视频 | 亚洲网站在线观看 | 国产高清一区二区 | 精品国产一区二区三区久久久蜜月 | 粉嫩国产精品一区二区在线观看 | 国产精品免费在线 | 国产欧美精品在线观看 | 日韩欧美在线一区 | 天堂一区二区三区四区 | 国产视频精品视频 | 日韩精品在线免费 | h视频在线观看免费 | 欧美日韩亚洲国产 | 在线精品国产 |