成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

陶哲軒點評谷歌AlphaProof:AI在數學競賽中展現「超凡智慧」

人工智能 新聞
常用 AI 輔助證明的數學家陶哲軒近期正處在出差的忙碌中,對問題求解引擎 AlphaProof 和 AlphaGeometry2 還未完全消化。

在奧數問題面前,AI 的「智商」往往不太夠用。

不過,這已經是過去式了。谷歌 DeepMind 用 AI 做出了今年國際數學奧林匹克競賽 IMO 的真題,并且距拿金牌僅一步之遙。對于 AI 來說,奧數不再是問題了。

IMO 2024 中六個問題的每一個問題滿分為 7 分,總分最高 42 分。DeepMind 的系統最終得分為 28 分,意味著解決的 4 個問題都獲得了滿分 —— 相當于銀牌類別的最高分。

DeepMind 文章連接:https://deepmind.google/discover/blog/ai-solves-imo-problems-at-silver-medal-level/

常用 AI 輔助證明的數學家陶哲軒近期正處在出差的忙碌中,對問題求解引擎 AlphaProof 和 AlphaGeometry2 還未完全消化。但他在自己的博客上對 DeepMind 的 AI 系統參加 IMO 競賽這件事表達了自己的看法。

圖片

陶哲軒談到,這是一項非常偉大的工作, 再次改變了我們對哪些基準挑戰可以通過 AI 輔助或完全自主的方法實現的期望。 

例如,IMO 級別的幾何問題現在對于專用的 AI 工具來說已基本解決?,F在看來,通過強化學習過程可以找到形式化證明的 IMO 問題至少在某種程度上可以被 AI 攻克。雖然目前每個問題需要相當大的計算量,并且在形式化方面需要人類的幫助。

在陶哲軒看來,這種方法還有一些「buff 加成」,它能使形式化數學更容易自動化,這反過來可能會促進包含形式化成分的數學研究方法。如果更公開地共享由此產生的形式證明數據庫,它可能是一個有用的資源。 

這種方法(更多地基于強化學習而非大型語言模型,有點類似 AlphaGo 的精神,且強調整體方法)非常聰明,事后來看很有道理。正如「AI 效應」所言,一旦解釋清楚,它不會給人一種展示人類智能的感覺;但它仍然是我們 AI 輔助問題解決工具集能力的擴展。

圖片

「AI 效應」是指當人工智能技術取得進展或解決問題時,人們往往會認為這些成就并不是真正的人工智能或者不具備真正的智能。換句話說,一旦某項技術被理解或普及,它就不再被認為是智能的。這種現象表明,人們對 “智能” 的定義和期望會隨著技術的進步而不斷提高。 

本月月初,陶哲軒在自己的博客中發布 AI 數學奧林匹克競賽(AIMO 進步獎)的初步成績已公布的消息。其中,獲得第一名的是 Numina 的團隊。

他在最新博客中表示,DeepMind 的這些新工具無法與最近贏得 AIMO 進步獎的 NuminaMath 模型直接比較。NuminaMath 模型完全自動化且資源效率高出數個數量級,并且采用了完全不同的方法(使用大型語言模型生成 Python 代碼,以蠻力解決區域競賽級別的數值答案問題)。這個模型也是完全開源的。這也是非常不錯的工作,展示了嘗試使用 AI 來輔助或自動化數學問題解決過程的不同部分的多維挑戰。

其實 DeepMind 在數學推理方面有著不懈的努力。在今年年初,它的人工智能算法就已經在數學奧林匹克競賽(IMO)上取得了重大成績突破。論文《Solving olympiad geometry without human demonstrations》向世人介紹了 AlphaGeometry,還登上了國際權威期刊《自然》雜志。專家表示,這是人工智能朝著具有人類推理能力方向邁進的重要一步。

圖片


論文鏈接:https://www.nature.com/articles/s41586-023-06747-5

未來 DeepMind 還將帶給我們怎樣的驚喜,我們拭目以待。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-07-29 13:28:52

2025-06-03 08:15:00

2023-12-06 13:44:00

模型訓練

2024-02-26 08:30:00

2024-07-08 13:08:04

2024-07-04 15:28:11

2023-05-15 15:13:46

智能工作

2023-10-10 13:51:46

GPT-4GitHubAI

2024-12-09 09:35:00

AI數據訓練

2023-10-04 08:07:06

CopilotGitHub

2024-10-14 14:31:36

2024-06-17 08:45:00

2025-05-22 09:08:40

2025-06-12 14:20:35

谷歌DeepMindAI

2024-04-09 09:44:21

數學模型

2024-07-29 14:39:39

2025-06-23 08:45:00

2023-06-30 13:42:44

2024-04-15 12:29:00

AI訓練

2024-09-29 14:00:00

AI數學自動化
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 日韩精品视频在线免费观看 | 久久精品国产一区 | av福利网站 | 日韩久久中文字幕 | 手机日韩 | 日韩区 | 成人精品一区二区三区 | 精品一区二区三区日本 | 毛片a级 | 少妇一级淫片免费放播放 | 婷婷开心激情综合五月天 | 91视频国产一区 | 在线欧美视频 | 亚洲 欧美 在线 一区 | 国产伦精品一区二区三区视频金莲 | 午夜免费视频 | 久操av在线 | 毛片一级片 | 玖玖在线精品 | 中文字幕视频在线观看 | 中文字幕 欧美 日韩 | 国产一区二区在线视频 | 久久久久久国产 | 日日操夜夜干 | 国产一区| 中文字幕精品视频 | 中文字幕免费视频 | 国产免费一区二区 | 久久久久国产一区二区三区四区 | 欧美一区二区在线播放 | 欧美网站一区 | 天天操,夜夜爽 | 欧美极品一区二区 | 午夜视频在线 | 亚洲国产一| 国产免费视频 | 福利久久 | 国产视频中文字幕 | 日韩精品免费在线观看 | 国产精品九九九 | 国产精品久久777777 |