AI盈利難、機器人泡沫多!馬庫斯25年AI預測,隔空喊話馬斯克
去年,馬庫斯對于AI趨勢的預測幾乎全部正確,但完全沒想到OpenAI可以估值到1500億美元。
在本月2日,馬庫斯發(fā)表了對2025年的25個AI預測,涵蓋AGI、GenAI、自動駕駛、人形機器人、智能體等多個方向。
馬斯克(Elon Musk),曾預測2025年底的AI能力:「我們就會擁有比任何人都聰明的AI」。
馬庫斯對此并不認同,主要預測內容如下:
1. 反對馬斯克的預言,到2025年底不會出現強人工智能。
2. GenAI的可靠性、推理、幻覺、能耗等問題得不到根本的解決。
3. 智能體和類人機器人在2025年會得到大量宣傳,但應用有限。
4. AI模型盈利難,估值開始下滑;OpenAI市場表現不佳;自動駕駛難落地。
對2025年的25項預測
高置信度預測
1 通用人工智能(AGI)不會在2025年實現。(可能會有人通過弱化定義甚至用經濟標準重新定義AGI來試圖混淆概念。)
2 到2025年底,沒有任何單一系統能可靠解決四項以上的Marcus-Brundage的AI 2027任務,甚至可能沒有任何任務被完全解決。
3 AI模型的盈利將繼續(xù)保持在中等偏下水平甚至可能不復存在(芯片制造公司如NVIDIA在供應硬件方面會繼續(xù)表現優(yōu)異,但模型開發(fā)公司在這場「淘金熱」中只能充當「賣鏟子」的角色)。
4 美國幾乎不會有實質性法規(guī)出臺,消費者仍面臨GenAI帶來的風險。全球其他地區(qū)在法規(guī)制定上會越來越參考歐洲的做法。
5 國家AI安全研究所將提供指導,但它們對危險模型的約束力將非常有限。
6 GenAI的可靠性問題將在2025年持續(xù)存在。
7「幻覺」現象(即生成內容中的虛構敘述)問題將繼續(xù)困擾GenAI。
8 推理能力的不足仍將繼續(xù)困擾GenAI。
9 AI「智能體」將在2025年被廣泛宣傳,但在除了一些非常狹窄的應用場景外,仍然難以實現可靠性。
10 類人機器人將受到大量宣傳,但不會有產品能夠接近The Jetsons中「Rosie機器人」的能力。盡管運動控制可能表現優(yōu)異,但場景意識和認知靈活性仍然不足。
The Jetsons中的機器人Rosie
11 OpenAI將繼續(xù)提前數月甚至數年預覽產品,但正式推出和廣泛可用仍需較長時間。(例如,Sora于2024年2月預覽,直到12月才正式發(fā)布,且受到使用限制;Sal Khan在2024年5月演示的AI家庭教師仍未普及;o3 已進行了預覽,但尚未發(fā)布,其價格可能相當昂貴。)
12 與2016年Hinton的預測相反,很少有放射科醫(yī)生會被AI替代。
13 真正的無人駕駛汽車(無需人類參與交通)仍將限制在少數城市,且在天氣良好的條件下。人類駕駛員仍將在經濟中占很大比重。
14 GenAI的版權相關訴訟將在2025年持續(xù)不斷。
15 AI模型的能耗將上升并會成為一個主要問題,但很少有GenAI公司會公開用電量。
16 被AI替代的勞動力比例將少于10%,可能少于5%。商業(yè)藝術家和配音演員可能受到最大的影響。(當然,隨著人們開始使用新工具,許多工作也會隨之改變。)
17 馬庫斯依然堅持關于o3的預測,即一開始人們會感到驚奇,然而一旦深入探究就會發(fā)現o3不可靠;o3在封閉領域(比如數學)表現最佳,而在開放領域(比如關于真實世界的日常推理)表現欠佳。
中等置信度預測
18 技術「護城河」仍然難以建立。相反,中美兩國將趨同到大體相似的AI模型;歐洲的部分系統也將趕上大致相同的位置。
19 由于價格及其穩(wěn)定性與價格不匹配的原因,很少有公司(更不要提更少的消費者)會大規(guī)模采用o3。
20 公司將繼續(xù)嘗試使用AI,但將其全面采用為生產級系統并在現實世界中大規(guī)模部署的態(tài)度仍然會非常謹慎。
21 2025年可能成為AI大公司估值開始下滑的一年。(盡管正如那句名言所說,「市場的非理性比你的償付能力持續(xù)得更久?!梗?/span>
22 Sora在物理學領域將繼續(xù)表現不佳。(谷歌的Veo 2看起來似乎有所改進,但由于尚未親自測試,仍然懷疑其在狀態(tài)變化和對象持久性上的問題。另一種尚未完全發(fā)布的基于不同原理的混合系統,稱為Genesis,看起來可能很有前景。)
23 神經符號AI的影響力將在2025年顯著增加。
低置信度預測,但值得討論
24 我們很可能會看到GenAI在大規(guī)模網絡攻擊中扮演重要的重要角色。馬庫斯將在Politico中發(fā)表一篇短文,討論可能的4種方式。
25 到2025年底,可能仍然不會出現「GPT-5級別」的模型(即通過社區(qū)共識認為在各方面實現重大飛躍的模型)。相反,我們可能會看到像o1這樣的模型,它在許多可生成高質量合成數據的任務中表現良好,但在其他領域僅比GPT-4有小幅改進。
2024年的預測回顧
總的來說,馬庫斯對2024年預測盡管存在一些需要注意的地方,但大體上得到了驗證。
核心預測
在2024年3月, 馬庫斯發(fā)帖總結了對2024年的最核心的預測。
唯一的例外可能是OpenAI的o3,它在去年12月宣布,但至今未發(fā)布,也未接受廣泛的審查。
除此之外,所有七條預測基本上都非常接近預期。
2024年的現實情況:
- 我們目前仍然處于GPT-4級別階段,這些模型只是做了些許漸進性的改動,沒有一個值得OpenAI冠以GPT-5之名。
- 如今有許多類似的模型,市場上充斥著價格戰(zhàn),幾乎沒有護城河。
- 幻覺問題依然沒有得到有效解決。
- 企業(yè)級的采用遠不如大多數人原本預期的那樣廣泛,所有公司的總體利潤(當然,硬件公司如英偉達除外,它們通過銷售芯片而非AI模型獲利)也充其量只是中等偏下水平的增長。
- 到目前為止,參與的許多公司都在虧損,雖然至少有三家公司被半收購,而它們?yōu)橥顿Y者帶來的利潤極為有限。
- 2024年最重大的AI事件并不是大家期待已久的GPT-5發(fā)布,盡管粉絲們整年都在預測它的到來,但它始終未曾出現。
2024年的其他預測
馬庫斯從2022年開始,就預言單純依靠擴展大語言模型 (LLM) 的方法最終會走到盡頭,在2024年11月和12月業(yè)內人士的評論似乎驗證了這一預測。
馬庫斯在2022年提出的「scaling law」并非物理定律,而是具有有限生命周期的泛化規(guī)則的觀點,在最近幾個月得到了廣泛傳播。
馬庫斯提出的「AI碰壁」(hitting a wall)這一概念在CNN、《The Verge》和《華爾街日報》等媒體中也得到廣泛報道。
馬庫斯關于「擴展scaling與收益遞減」的觀點和相關術語已逐漸普及。
馬庫斯在2022年,以及早在2001年出版的《The algebraic mind》一書中提出的具體弱點(如組合性、事實性和推理能力等)依然存在。盡管這些問題或許會在未來得到解決,但當前的技術手段顯然不夠。
馬庫斯在1998年、1999年和2001年,以及之后多次強調的分布漂移(distribution shift)問題,在最近的研究中得到了多次印證,例如蘋果公司的關于推理的著名論文。
論文鏈接:https://arxiv.org/pdf/2410.05229
在2022年12月,馬庫斯預測的聊天機器人導致死亡的事件。
在2023年,該預言不幸得到了證實,而2024年似乎又出現了類似案例。
關于AI生成錯誤信息,馬庫斯的警告正在逐步成為現實,盡管到目前為止,其影響比最初擔憂的要輕。但馬庫斯仍然感到擔憂,并認為需要保持警惕。
在2023年2月,馬庫斯提出的關于GenAI破壞互聯網的警告,越來越顯得正確。
馬庫斯在2022年11月預測,LLM不會立即顯著改善如亞馬遜Alexa等商業(yè)AI智能體,這一預測在2024年仍然成立。
馬庫斯預測2024年會被視為「AI 幻滅之年」。這一說法可能有些夸大,但對部分人來說卻是事實。雖然許多人仍然對AI熱情不減,但也有不少人大失所望。例如,《華爾街日報》報道:「微軟AI機器人的早期采用者懷疑其是否物有所值」。
馬庫斯在2023年關于OpenAI可能被視為AI界WeWork的預測尚未得到驗證,但OpenAI的處境仍不樂觀。
OpenAI尚未盈利,預計至少到2029年之前都不會盈利,其消耗資金的速度以十億美元計,且仍缺乏明確的技術護城河。從長期來看,特別是在高估值情況下,安全性仍然不確定。記者Ed Zitron和經濟學家Brad DeLong等人也越來越多地表達了類似觀點。
關于生成式A技術和經濟限制的預測大體正確,但馬庫斯對投資者的判斷完全錯誤。馬庫斯原本認為OpenAI不太可能獲得另一輪大規(guī)模融資,更不用說估值超1500億美元。但時間會證明這是否是一項明智的投資。
在2024年2月Sora公布后不久,馬庫斯指出其在物理領域的問題,并預測這些問題不會消失。這一預測目前仍然成立。
馬庫斯在2022年12月關于GPT-4的七項預測(見下圖)大部分已被證實(第七項仍待驗證),適用于2024年發(fā)布的所有模型。