成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

深度思考:現在的AI模型真的在進行推理嗎?

人工智能
最近,OpenAI、DeepSeek、谷歌、Anthropic都推出新模型,它們都宣稱模型已經具備真正的推理能力,也就是人類解決問題時運用的思維方式,但問題在于:AI大模型所說的推理真的和人一樣嗎?

最近,OpenAI、DeepSeek、谷歌、Anthropic都推出新模型,它們都宣稱模型已經具備真正的推理能力,也就是人類解決問題時運用的思維方式,但問題在于:AI大模型所說的推理真的和人一樣嗎? 

現在的模型可以將復雜問題分解成小問題,然后逐步解決小問題再給出回應,業界將這個過程稱為“思維鏈推理”。這些模型有時表現讓人驚嘆,可以解決邏輯謎題和數學難題,能夠快速寫出完美代碼,但有時面對極為簡單的問題卻顯得蠢笨。 

于是乎,反對者認為所謂的“思維鏈推理”根本不算推理,而支持者卻認為是推理,雖然不如人類靈活,但它正在朝著真正的推理前進。 

反對者:只是用啟發式原則猜測答案 

科學家一直在研究人腦是如何運行的,目前大家一致認為大腦存在多種不同的推理類型。 

推理有演繹推理,即從一個一般性的陳述出發,得出一個具體的結論。還有歸納推理,利用具體的觀察結果來做出更廣泛的概括。除此還有類比推理、因果推理、常識推理。 

與人腦推理相比,目前的AI推理還很狹隘。 

圣塔菲研究所(SFI,Santa Fe Institute,SFI)教授梅蘭妮·米切爾(Melanie Mitchell)曾在一篇論文中寫道:“從有限的數學和經驗中找到一條規則或者一套模型,將它應用于新的未曾見過的情境中,在現實世界,我們非常看重這樣的推理。即使是非常小的孩子,也能從幾個例子中學習并發現抽象規則。” 

孩子能做到,現在的AI能嗎?許多人持懷疑態度。 

愛丁堡大學技術哲學家肖恩·瓦洛爾(Shannon Vallor)在談到OpenAI o1時表示:“AI所做的只是一種元擬態行為(meta-mimicry)。” 

什么意思?就是說以前的ChatGPT舊模型會模仿其訓練數據中人類所寫的陳述內容,新的o1可以模仿人類得出陳述內容的過程,雖然o1輸出的結果會讓人覺得它在推理,但這不是真正意義上的推理。

舉個例子,問ChatGPT一個問題:“1個人帶1匹狼、1只羊、1捆草過河。如果人在場,狼不敢吃羊、羊不敢吃草,可是小河邊的船每次只能讓人帶一種東西過河。那么,如何用最少的渡河次數把所有東西都帶到河對岸呢?” 

雖然o1相比舊版有所改進,但架構并未有太大變動,它在回答問題時出現失誤。瓦洛爾認為:“在回答問題失敗時,我們會看到一個事實,即模型并沒有進行真正的推理。” 

隨后推出的o3讓米切爾感到驚訝,但她更讓他吃驚的是o3在解決問題時消耗的算力如此巨大。由于OpenAI內部運作并不透明,人們無從知曉大模型用這些算力做了什么。如果OpenAI不能做到公開透明,便無法確定模型真的將大問題分解成若干步驟,然后給出一個更完美的整體答案。 

去年紐約大學在一篇名為《Let’s Think Dot by Dot》的論文中質疑過AI推理,研究人員發現,把思維鏈(Chain-of-Thought,CoT)推理中的具體步驟,替換成毫無意義的“...”(點號),產生的推理結果也大差不差。 

米切爾認為:“AI更像是一個啟發式原則構成的集合,不是推理模型。”啟發式原則能幫你猜出問題的正確答案,但它并非真正通過思考獲得答案。 

又例如,研究人員曾開發一個視覺模型,用來分析皮膚癌。初看時,模型似乎能判斷皮膚上的斑點是否為惡性病變,但事實證明,在訓練數據中惡性斑點照片旁邊往往有了標尺信息,模型只是因為標尺信息的存在將斑點判定為惡性病變,這是一種啟發式思考。 

由此可以懷疑,看起來AI似乎在用“推理”解決問題,但實際上只是在利用“記憶信息”進行啟發式探索。 

支持者:不是純粹推理但也不是背誦  

Redwood Research致力于降低人工智能風險,該公司首席科學家瑞安·格林布拉特(Ryan Greenblatt)認為,當前的AI明顯是在進行某種形式的推理。 

格林布拉特說:“機器的處理方式不像人類那樣具有普遍性,它們更多依賴記憶和知識,而非人類那樣依靠推理和判斷,但機器仍在進行處理。” 

既然AI模型可以解答超出樣本范圍的難題,而且表現出色,就可以說它們是在進行某種推理。 

“過河問題”是一個很經典的問題,在訓練數據中,AI應該已經學習過很多次。但當用戶提出問題時,AI并沒有給出正確答案,它可能知道答案,只是進行了復雜的不必要的“思考”,人有時也會犯這種錯誤。

格林布拉特舉例說,如果你花一個月時間學習色彩理論,從互補色到不同色調的心理影響,再到文藝復興時期某些顏料的歷史意義。學完之后參加測試,試題問:“這幅風景畫中為什么要把天空畫成藍色?”你可能會被誤導,寫出極為復雜但沒有必要的答案,比如你可能會說藍色代表神圣的天空,說畫是清晨完成的,象征著新生……實際上答案很簡單:因為天空就是藍色的。

Open Philanthropy分析師阿杰亞·科特拉(Ajeya Cotra)認為,有些活動被人類稱為推理,在這一范疇內,AI將會表現得越來越好。人類說AI只是在進行“元擬態”活動,重點不在于“元擬態”,而在于“只是”。人類的意思可能是它不會對世界產生重大影響,我們離超級人工智能還有很遠,這種斷定值得懷疑。 

再比如,在一堂大學物理課上,面對問題時學生的表現參差不齊。有人作弊,直接給出答案。有人是天才,無需思考公式的內容,憑借深刻的理解與直覺給出答案。大多學生憑借記憶記住公式,努力思考用哪個公式解答問題。 

科特拉認為,現在的AI和大多學生一樣,它會將記憶內容與一些推理內容結合起來。AI可能不太聰明,但它很勤奮,能記住無數方程式。它將強大的記憶與少量理解結合,找出針對某個問題的方程式組合,然后給出答案。 

乍一看,AI和天才學生一樣極為聰明,但細細分析就會發現答案中的漏洞,盡管如此,并不意味著AI沒有推理。

換句話說,這些模型既不是純粹地進行推理,也不是純粹地進行背誦。 

科特拉說:“我認為這是處于兩者之間的一種狀態。人們對此感到困惑,因為他們想要將其歸入某一類別,要么說是單純的記憶,要么說是真正意義上的深入推理。但實際上,推理的深度是有一定范圍的。”

結語:鋸齒狀智能 

研究人員用“鋸齒狀智能”這一術語能描述今天的AI,就是說它既能出色解決一些數學問題,碰到簡單問題時又會變得愚蠢。 

人類總是喜歡將AI的智能與人類智能類比,或者我們應該換個角度看待,將人工智能視為“與眾不同”的智能,不要糾結于“比人類更聰明”或者“比人類更愚笨”。 

人工智能正在進化,某一天也許變得無比強大,能夠囊括人類所有的智能,甚至還有余力,這種變革值得期待。(小刀)

責任編輯:龐桂玉 來源: 極客網
相關推薦

2025-06-24 09:05:00

AI模型訓練

2025-05-28 10:10:20

2024-03-26 09:11:13

TensorFlow深度學習Pipeline

2025-05-28 02:40:00

AdaptThink推理模型AI

2025-05-08 02:02:02

2024-07-26 08:59:33

2025-03-28 08:00:00

AI安全漏洞

2023-11-19 23:36:50

2022-12-09 09:52:47

AI深度學習

2024-12-18 08:33:01

2023-08-27 15:28:53

人工智能語言模型

2022-04-11 15:40:34

機器學習研究推理

2021-12-22 14:20:31

語言人工智能機器學習

2023-09-05 14:43:15

2025-01-15 13:01:07

2025-05-22 08:00:00

2025-05-16 08:44:01

2020-09-04 16:07:28

智慧城市Quayside多倫多
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 日韩一区二区在线观看 | 偷拍自拍网站 | 国产成人精品久久二区二区91 | 久久精品日产第一区二区三区 | 亚洲视频在线免费观看 | 亚洲黄色成人网 | 国产精品1区2区 | 国产成人99久久亚洲综合精品 | 99热在这里只有精品 | 99精品99 | www.中文字幕.com | 亚洲国产欧美一区二区三区久久 | 中文字幕不卡在线观看 | 中文字幕一区在线 | 免费视频一区二区 | 亚洲91视频 | 久久69精品久久久久久久电影好 | 成人在线免费观看视频 | 91在线一区二区 | 精品视频一区二区 | 精品一区二区不卡 | 羞羞视频在线观免费观看 | 精品一区视频 | 日韩精品一区二区三区中文在线 | 国产精品99久 | 成人国产精品久久 | 九九久久精品 | 精品国产一区探花在线观看 | 成人一区二区在线 | 国产日韩欧美中文字幕 | 国产精品99久久久久久久久久久久 | 国产成人高清在线观看 | 五月天激情综合网 | 免费a级毛片在线播放 | 夜夜骚 | 午夜免费网站 | 国产 欧美 日韩 一区 | 成人h动漫精品一区二区器材 | 日韩中文字幕免费在线 | 色就干| 一区二区三区四区五区在线视频 |