成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

AI能證明數學數據庫中82%的問題了,新SOTA已達成,還是基于Transformer

人工智能
本文提出的方法為一種基于Transformer的在線訓練程序。

不得不說,科學家們最近都在癡迷給AI補數學課了。

這不,臉書團隊也來湊熱鬧,提出了一種新模型,能完全自動化論證定理,并顯著優于SOTA。

要知道,隨著數學定理愈加復雜,之后再僅憑人力來論證定理只會變得更加困難。

因此,用計算機論證數學定理已經成為一個研究焦點。

此前OpenAI也提出過專攻這一方向的模型GPT-f,它能論證Metamath中56%的問題。

而這次提出的最新方法,能將這一數字提升到82.6%。

與此同時,研究人員表示該方法使用的時間還更短,與GPT-f相比可以將計算消耗縮減到原本的十分之一。

難道說這一次AI大戰數學,是要成功了?

還是Transformer

本文提出的方法為一種基于Transformer的在線訓練程序。

大致可以分為三步:

第一、在數學證明庫中預訓練;

第二、在有監督數據集上微調策略模型;

第三、在線訓練策略模型和判斷模型。

具體來看是利用一種搜索算法,讓模型在已有的數學證明庫中學習,然后去推廣證明更多的問題。

其中數學證明庫包括3種,分別是Metamath、Lean和自研的一種證明環境。

這些證明庫簡單來說,就是把普通數學語言轉換成近似于編程語言的形式。

Metamath的主庫是set.mm,包含基于ZFC集合論的約38000個證明。

Lean更為人熟知的,是微軟那個可以參加IMO賽事的AI算法。Lean庫就是為了教會同名算法所有的本科數學知識,并讓它學會證明這些定理。

這項研究的主要目標,是為了構建一個證明器,讓它可以自動生成一系列合適的策略去論證問題。

為此,研究人員提出了一個基于MCTS的非平衡超圖證明搜索算法。

MCTS譯為蒙特卡洛樹搜索,常用于解決博弈樹問題,它因為AlphaGo所被人熟知。

它的運行過程,就是通過在搜索空間中隨機抽樣來找尋有希望的動作,然后根據這個動作來擴展搜索樹。

本項研究采用的思路類似于此。

搜索證明過程從目標g開始,向下搜索方法,逐步發展成一個超圖(Hypergraph)。

當出現一個分支下出現空集時,就意味著找到了一個最優證明。

最后,在反向傳播過程中,記下超樹的節點值和總操作次數。

在這個環節中,研究人員假設了一個策略模型和一個判斷模型。

策略模型允許判斷模型進行抽樣,判斷模型可以評估當前策略找到證明方法的能力。

整個搜索算法,就以如上兩個模型作為參照。

而這兩個模型都是Transformer模型,且權值共享。

接下來,就到了在線訓練的階段。

這個過程中,控制器會將語句發送給異步HTPS驗證,并收集訓練和證明數據。

然后驗證器會將訓練樣本發送給分布式訓練器,并定期同步其模型副本。

實驗結果

在測試環節,研究人員將HTPS與GPT-f進行了比較。

后者是OpenAI此前提出的數學定理推理模型,同樣基于Transformer。

結果表明,在線訓練后的模型可以證明Metamath中82%的問題,遠超GPT-f此前56.5%的記錄。

在Lean庫中,這一模型可以證明其中43%的定理,比SOTA提高了38%,以下是該模型證明出的IMO試題。

不過目前它還不是十全十美。

比如在如下這道題中,它并沒有用最簡便的辦法解出題目,研究人員表示這是因為注釋中出現了錯誤。

One More Thing

用計算機論證數學問題,四色定理的證明便是最為人熟知的例子之一。

四色定理是近代數學三大難題之一,它提出“任何一張地圖只用四種顏色就能使具有共同邊界的國家,著上不同的顏色”。

由于這一定理的論證需要大量計算,在它被提出后100年內,都沒有人能完全論證。

直到1976年,在美國伊利諾斯大學兩臺計算機上,經過1200小時、100億次判斷后,終于可以論證任何一張地圖都只需要4種顏色來標記,由此也轟動了整個數學界。

加之隨著數學問題愈加復雜,用人力來檢驗定理是否正確也變得更加困難。

近來,AI界也把目光逐步聚焦在數學問題上。

2020年,OpenAI推出數學定理推理模型GPT-f,可用于自動定理證明。

這一方法可完成測試集中56.5%的證明,超過當時SOTA模型MetaGen-IL30%以上。

同年,微軟也發布了可以做出IMO試題的Lean,這意味著AI能做出沒見過的題目了。

去年,OpenAI給GPT-3加上驗證器后,做數學題效果明顯好于此前微調的辦法,可以達到小學生90%的水平。

今年1月,來自MIT+哈佛+哥倫比亞大學+滑鐵盧大學的一項聯合研究表明,他們提出的模型可以做高數了。

總之,科學家們正在努力讓AI這個偏科生變得文理雙全。

責任編輯:姜華 來源: 量子位
相關推薦

2022-04-11 14:21:49

模型視頻AI

2009-07-29 08:11:57

雅虎微軟合作wangluo

2020-09-15 15:45:38

Visual Stud數據IDE

2019-12-01 16:05:00

NvidiaInter英特爾

2024-08-19 08:45:00

開源模型

2024-06-12 11:54:21

2015-09-29 14:31:06

安裝量目標Windows 10

2024-08-09 14:48:00

2023-10-30 17:23:54

數據模型

2020-03-16 08:16:16

數據庫數據安全

2020-09-10 18:14:51

人工智能 IBM

2020-09-11 10:59:05

數據庫

2025-05-26 02:44:00

向量數據庫傳統數據庫向量化

2024-08-22 16:23:05

2024-10-18 13:40:26

2023-11-05 15:05:15

AI論文

2011-03-24 14:12:37

數據庫備份

2010-07-06 14:40:15

解決SQL Serve

2021-07-19 18:00:50

ZoomFive9收購

2024-03-25 13:06:00

數據訓練
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 日韩欧美中文在线 | 亚洲综合色网 | 日本精品一区二区三区视频 | 91精品国产91久久久久久 | 日韩中文字幕区 | 亚洲综合三区 | 青青草在线播放 | 国产精品色综合 | 日韩午夜精品 | 亚洲福利在线观看 | 91麻豆精品国产91久久久更新资源速度超快 | 福利成人| 国产精品高潮呻吟久久aⅴ码 | 色精品视频 | 伊人婷婷 | 91久久国产综合久久91精品网站 | 99久久精品国产一区二区三区 | 亚洲综合色视频在线观看 | 羞羞视频在线观看 | 一本一道久久a久久精品蜜桃 | 国产亚洲成av人在线观看导航 | 国产精品视频网 | 黄网址在线观看 | 亚洲国产一区二区视频 | 精品欧美一区免费观看α√ | www.中文字幕.com | 国产成人精品一区二区三 | 91网站视频在线观看 | 国产在线视频一区二区 | 成人国产在线观看 | 亚洲高清一区二区三区 | 国产一区二区在线免费观看 | 草草在线观看 | 国产激情在线 | 久久精品亚洲精品 | 欧美一区二区三区在线 | 亚洲精品日韩综合观看成人91 | 日韩欧美国产精品 | 欧美久久一区二区三区 | 黄色免费在线网址 | 99久久久无码国产精品 |