成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

雞兔同籠都能算錯的ChatGPT,陶哲軒發現了它的價值

人工智能 新聞
連三位數的混合運算都算不明白,ChatGPT 對數學家來說有用嗎?

ChatGPT 不擅長數學,這是大家剛開始測試時就發現的問題。比如你問它一個「雞兔同籠」問題,它可能寫出一個看上去非常有條理的解題過程,但仔細一看,答案卻是錯的。

圖片

為了解決這個問題,OpenAI 也做了一些優化,并在今年 1 月末宣布 ChatGPT 數學能力升級。但從測試的結果來看,這次升級效果并不明顯。

圖片

但這么一個連三位數混合運算都算不明白的工具卻吸引了著名數學家陶哲軒的注意。最近一段時間,他似乎一直在探索 ChatGPT 能幫數學研究者做些什么。

通常來講,如果你經常閱讀數學文本,你會很容易找到一些線索,這些線索可以幫你評估某個特定論證部分的有效性、深度和重要性。這會加快你的閱讀速度,讓你可以迅速分離出論文的「肉」。陶哲軒總結說。

但 AI 生成的數學文本給了他截然不同的閱讀體驗:文本乍一看很有說服力,但只有慢慢地逐行閱讀才能發現其中的缺陷。

圖片

在一次測試中,它向 ChatGPT 提了一個數學問題。乍一看,答案驚人地準確,因為它提到了一個高度相關的術語,還討論了一個例子,這在一個有意義的答案中是非常典型的。但其實,ChatGPT 給出的答案并不完全正確:公式是對的,但不是有用的定義,例子也是錯的。

圖片

圖片

在另一個關于「素數是否無窮多」的證明問題中,ChatGPT 給出的答案也并不完全正確。

圖片

圖片

雖然測試結果不太令人滿意,但陶哲軒并沒有對 ChatGPT 持完全否定的態度。他認為,像 ChatGPT 這類大型語言模型在數學中可以用來做一些半成品的語義搜索工作,也就是用它來生成一些提示。

圖片

比如在下面這個例子中,陶哲軒提出的問題是:「我在尋找一個關于 xx 的公式。我想這是一個經典的定理,但我不記得名字了。你有什么印象嗎?」在這輪問答中,雖然 ChatGPT 沒能給出正確答案(庫默爾定理),但根據它給出的近似答案(Legendre 公式),我們可以結合傳統搜索引擎輕松找到正確答案。

圖片


從這些測試中,我們可以看到 ChatGPT 這類 AI 工具與傳統計算機軟件的區別。

傳統的計算機軟件類似于函數??:??→??:給定域??中的輸入??,它可靠地返回范圍??中的單個輸出??(??),該輸出以確定的方式依賴于??。但如果給定域外的輸入(比如大括號用錯,或者出現其他格式問題),則軟件會出現無法定義的情況,或給出無意義的內容。

相比之下,AI 工具類似于概率 kernel μ:??→Pr (??),而不是經典函數。輸入??,它們會給出一個從概率分布 μ_?采樣的隨機輸出。這個概率分布在??(??) 的完美結果附近,但帶有一些隨機偏差和不準確性。但優勢在于,這些工具可以比傳統的軟件工具更優雅地處理嘈雜或格式不那么規范的輸入??。

因此,想用 ChatGPT 輔助自己做研究的數學研究者務必要習慣這種差異。

圖片

當然,在數學方向上,ChatGPT 當前的狀態可能不會持續太久。

前段時間,計算機科學家、Wolfram 語言之父 Stephen Wolfram 提出了一個想法:將 ChatGPT 與自己的 Wolfram | Alpha 知識引擎結合起來用,因為后者本就具有強大的結構化計算能力,而且也能理解自然語言(參見《理工科神器 Wolfram|Alpha 注入超強計算知識,補足 ChatGPT 短板》)。

Meta 在 2 月份發布的一篇論文也支持這種做法。他們提出了一種名為 Toolformer 的新方法,使得語言模型學會「使用」各種外部工具,如搜索引擎、計算器或日歷(參見《語言模型自己學會用搜索引擎了?Meta AI 提出 API 調用自監督學習方法 Toolformer》)。

在未來幾年,如何補齊 ChatGPT 的各項短板將成為非常熱門的方向。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2023-09-02 11:21:54

代碼ChatGPT

2024-07-08 13:08:04

2023-10-04 08:07:06

CopilotGitHub

2024-12-09 09:35:00

AI數據訓練

2023-12-16 12:47:59

2025-05-06 15:31:17

陶哲軒AI工具

2023-05-08 12:12:56

2024-05-20 08:25:55

2024-05-23 17:18:50

2023-10-23 09:25:08

模型AI

2025-06-12 14:20:35

谷歌DeepMindAI

2023-02-26 01:02:22

2024-10-14 14:31:36

2023-05-15 15:13:46

智能工作

2025-05-22 09:08:40

2023-09-05 17:43:04

人工智能AI

2023-10-28 13:18:05

AI工具

2024-06-06 19:07:14

2023-06-25 14:59:07

2025-06-03 08:15:00

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 久久这里只有精品首页 | 999久久久精品 | 国产蜜臀97一区二区三区 | 人人九九精 | 成人精品福利 | 免费观看的黄色网址 | 欧美国产精品一区二区 | 久久久免费观看视频 | 久久久久国产精品www | 91五月天 | 黄色在线观看 | 夜夜久久 | 久久久999免费视频 999久久久久久久久6666 | 久久成人免费视频 | 欧美日韩成人在线 | 天天干天天干 | 免费国产一区 | 人人爽日日躁夜夜躁尤物 | 亚洲免费观看 | 亚洲第1页 | 成人午夜精品 | 91爱啪啪 | 一区二区在线 | 国产精品福利在线观看 | 国产精品久久久久久久午夜片 | 欧美色图综合网 | 成人二区 | 午夜精品 | 一本一道久久a久久精品综合 | 日本天堂视频在线观看 | 成人在线精品 | 欧产日产国产精品视频 | 丝袜美腿一区二区三区动态图 | 亚洲日本免费 | 国产精品久久久久一区二区三区 | 精品一区二区久久久久久久网精 | 国产精品久久九九 | 日韩第一页 | 手机在线一区二区三区 | 精品欧美一区二区精品久久久 | 成人精品久久 |