成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

AI 發展是否正在放緩?AI 發展將駛向何方?

人工智能
或許模型規模的擴大已經到達極限,也可能尚未結束。大家都在探索下一步該如何走。但可以肯定的是,這種趨勢不會無限持續下去。模型規模擴大的終結,反而帶來了一系列正面效應:人工智能的發展將重新依賴于創新思維和重大突破。

無論人工智能是否能穿越炒作的迷霧,我都感到生活在人類歷史上這個有趣的時代是如此幸運。回想五年前我開始接觸神經網絡時,AI 連識別貓都顯得力不從心,那時的技術水平遠不如今日。

而如今,我們所做到的事情,對于我們的祖輩來說,恐怕就像是變戲法一樣神奇。人工智能行業的飛速發展,讓我深感敬佩。但接下來的問題是,這樣的發展勢頭能夠持續嗎?

Image source: https://ia.samaltman.com/

1.大膽預測

數月前,Sam 大膽預測“超級智能 AI 將在幾千天內成為現實”,并聲稱 AGI(盡管其定義尚不明確)是“現有硬件條件下就能達成的目標”。然而,行業領袖在 AI 發展預測上的表現并不總是那么可靠。一個典型的例子就是過去十年中對自動駕駛汽車的過分樂觀預期。因此,這樣的預測我們還是應該有所保留。

很快,情況就出現了變化。OpenAI、Google 和 Anthropic 等領先的 AI 公司紛紛表示,新模型開發的收益正在逐漸減少[1]。Ilya Sutskever 指出,我們在擴大預訓練規模上似乎已經觸碰到一個瓶頸。現在,一個新的觀點正在成為主流,那就是模型擴展似乎已經遇到了障礙。

2.那么,這是否標志著模型擴展的終結?

當前,關于模型擴展的終結似乎成為了熱門話題。

在 2010 年代和 2020 年代初期,我們見證了模型擴展的黃金時期。成功的秘訣似乎很簡單:將海量數據輸入大型神經網絡,經過長時間訓練,就能目睹奇跡的出現。然而,這種策略最終帶來的回報只會遞減。那么,未來幾年我們還能期待些什么呢?

“所有的傳統機器學習模型最終都會遇到增長瓶頸;大語言模型(LLMs)或許也不例外。”

2.1 盡管計算能力在增強,但數據并沒有同步增長

我們只有一個互聯網,而且已經挖掘了所有可用數據。

語言模型訓練數據量的快速增長(先是整個維基百科,接著是社交媒體,最后是大部分互聯網內容),如今似乎已經停滯不前。盡管有些公司正在與出版商合作以獲取更多數據,但我們必須承認:只有一個互聯網,訓練數據不可能再有顯著的增長。除非,我們開始尋找其他數據源。互聯網上除了豐富的文本,還有大量的圖片、視頻和音頻資源。根據 Epoch AI 的一篇文章[2]估算,從在線多模態數據中提取的文本 tokens 數量,可能會比普通網絡爬蟲數據集多出 5 到 200 倍。

預訓練自回歸模型的時代終將落幕。— Ilya Sutskever

2.2 那么,接下來要提的就是合成數據了

在 2024 年的 NeurIPS 會議上,Ilya 提到了合成數據的使用是未來的發展方向之一,這當然也是經常被視為持續擴展模型規模的一條路徑。其核心思想是,在很多情況下,驗證數據的正確性以及評估數據質量相對容易。合成訓練數據在某些案例中已經取得了顯著成效,比如 AlphaGo[3] 在 2016 年戰勝了圍棋世界冠軍,以及 AlphaZero[4] 和 AlphaProof[5] 通過純粹在自我生成的數據上訓練,學會了玩游戲和解幾何題。

在編程領域,合成數據的一個成功案例是 CriticGPT[6]。OpenAI 在一個審查周期內使用兩個 ChatGPT 實例,一個負責生成代碼,另一個則批判性地審查以便找出代碼中的錯誤。這個想法雖然簡單,但正如我們在下圖中所見,效果顯著!CriticAI 系統發現的問題數量遠超人類。

圖片圖片

在編程和數學領域,我們可以生成大量示例,并迅速驗證哪些是正確的,從而創建一個較小的、更精細且高質量的數據集。但對于其他領域,合成數據的適用性可能就有所限制了。我認為,合成數據的應用程度很大程度上取決于具體領域。

2.3 大模型的收益遞減現象

模型的表現不僅會受到訓練數據集規模的影響,也會受到模型自身規模的影響(如下圖所示)。

圖片圖片

測試 loss 值與模型大小及訓練數據集規模之間的關系遵循冪律分布。圖片來源:作者根據 OpenAI 的數據制作的圖像。

長期以來,我們通過無腦地增加模型規模和數據量來提升模型性能,但這種策略的效果已經逐漸減弱。

目前,許多 AI 公司轉而致力于開發更小的模型。這些模型可能是性能適中但成本較低的“夠用”模型(比如谷歌的 Gemini mini系列),有時候這些小型模型甚至能超越某些旗艦模型(比如 OpenAI 的 GPT-4o 與 GPT-4 相比)。然而,這種性能提升是以更長的訓練時間為代價的。我們還觀察到,新的架構設計帶來了意想不到的成果,例如 Claude 的 Haiku 所采用的“混合專家”模型。

2.4 模型規模的擴大并不必然帶來“涌現”能力

過去十年的經驗告訴我們,擴大模型規模、訓練計算量和數據集大小可以增強模型的性能。在大語言模型(LLMs)中,這一點通常體現在它們對序列中下一個單詞的預測能力上。

所謂“涌現”能力,指的是那些在小模型中未曾出現,而在大模型中得以展現的能力。

雖然人工智能在我們設定的各項基準測試中表現日益精進,但它仍舊無法進行真正的推理。人們曾寄希望于,只要模型足夠大,就能突然學會推理。

我們經常看到人工智能在數學和物理測試中超越博士生的報道,但同樣也會看到它在一些簡單測試中的失敗,而這些測試對小孩子來說卻是輕而易舉[7]。如果人工智能無法在其訓練數據之外進行有效泛化,那么繼續增加數據量最終也不會帶來實質性的改善。

3.人工智能將走向何方?

現在,我們再次步入了一個充滿奇跡與驚喜的時代。大家都在尋找下一個可以擴展(scale)的領域。如今,擴展正確的事物比以往任何時候都更為重要。——Ilya Sutskever

3.1 推理層面的擴展

在模型擴展是否已達極限的爭論中,部分焦點已經轉向了“推理擴展”[8]。OpenAI 的 o1[9] 就是這種推理擴展的一個實例。

與模型擴展側重于增加模型大小、訓練數據和計算資源不同,推理擴展著眼于優化模型在運行過程中的處理和推理能力。這些模型經過微調,以便在給出答案前進行“推理”。

近期的一些創新,如先推理后行動的提示詞技術、智能體、混合模型、幻覺檢測與緩解等,還需要一些時間才能成熟,以進一步提升模型的表現。

3.2 展望未來

盡管我們看到了擴展能力的局限性,但仍有不少人對未來保持樂觀。據 Epoch AI 預測,未來 5 年內,我們有望繼續擴展數據、計算資源和硬件,足以訓練出計算能力是 GPT-4 十倍以上的新型模型。這一數字還有可能增長,但最大的挑戰恐怕是電力需求的激增。

圖片圖片

展望 2030 年,人工智能訓練的擴展將面臨哪些限制,以訓練所需的計算 FLOP 來衡量。數據來源:Epoch AI[2]

在 NeuroIPS 的最新演講中,Ilya 對未來發展趨勢做出了一些預測,盡管具體的實施時間和方式尚不明確:

  • 系統將變得智能體化:Agent 是今年人工智能的一大進步。例如,Anthropic 公司幾個月前推出的智能體模型,能夠與計算機互動并實現 AI 的全面控制,令人印象深刻。
  • 系統將能夠推理和理解。AI 的推理能力越強,其行為就越難以預測(頂尖的國際象棋 AI 對棋手來說就是不可預測的)。
  • 系統將擁有自我意識,因為它具備了推理和理解的能力。

讓 AI 具備推理能力將是重要的一步,或許 OpenAI 的 o1 模型已經為我們揭示了未來的發展方向:讓 AI 在給出答案前進行一段時間的思考和推理。AI 的推理能力越強,其不可預測性也就越高。然而,一旦我們擁有了強大的推理能力、完善的智能體系統,并且減少了幻覺現象,實現通用人工智能乃至超級智能將不再遙不可及。

4.結束語

或許模型規模的擴大已經到達極限,也可能尚未結束。大家都在探索下一步該如何走。但可以肯定的是,這種趨勢不會無限持續下去。模型規模擴大的終結,反而帶來了一系列正面效應:人工智能的發展將重新依賴于創新思維和重大突破。有一點共識是明確的:未來充滿了不確定性。

Thanks for reading! 

Hope you have enjoyed and learned new things from this blog!

About the author

Lan Chu

Data Scientist | Write about data and AI. 

?? LinkedIn https://www.linkedin.com/in/lanchuhuong/

原文鏈接:https://medium.com/gitconnected/is-ai-progress-slowing-down-69d4f1215e49

責任編輯:武曉燕 來源: Baihai IDP
相關推薦

2017-09-06 09:52:45

AI深度學習人工智能

2021-10-14 13:57:58

物聯網人工智能數據

2021-11-04 17:23:25

AI人工智能IOT

2017-08-30 20:44:51

AI機器學習深度學習

2024-08-05 13:38:18

2021-11-29 09:50:05

AI 數據人工智能

2020-12-21 14:46:51

人工智能

2025-02-26 07:55:14

2019-02-14 13:21:24

大數據數字化人工智能

2021-07-13 07:41:08

人工智能AI深度學習

2021-07-13 09:42:32

可信AI人工智能AI

2009-03-19 10:37:07

技術IT人職業發展

2024-01-10 18:13:52

生成式AI開源

2020-06-27 09:12:49

AI醫療人工智能

2021-04-27 09:30:47

AI 數據人工智能

2019-10-29 19:56:42

人工智能技術軟件

2021-10-08 22:16:36

人工智能技術基因

2017-12-04 09:44:35

2021-09-15 14:14:49

區塊鏈以太坊代幣

2020-03-25 14:31:06

新基建智慧交通智能
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 五月香婷婷| 久久久久久久久久久高潮一区二区 | 天堂三级 | 搞黄网站在线观看 | 91在线视频免费观看 | 久久久亚洲一区 | 91久久国产精品 | 亚洲一区二区三区视频 | 久久久久久99 | 亚洲精品国产一区 | 免费看的av | 亚洲精品1区 | 亚洲精品丝袜日韩 | 精品蜜桃一区二区三区 | 久久久91精品国产一区二区三区 | 日韩精品一区二区三区视频播放 | 99精品在线 | 97久久精品午夜一区二区 | 岛国av免费观看 | 国产情侣激情 | 日韩在线一区二区三区 | 最新国产视频 | 中文字幕免费视频 | 久草在线青青草 | 久久久91| 国产精品日韩在线观看一区二区 | 91久久国产综合久久91精品网站 | 亚洲超碰在线观看 | 日韩精品一区二区三区在线播放 | 精品欧美乱码久久久久久1区2区 | 欧美日韩在线观看一区 | 欧美色综合一区二区三区 | 精品91av| 中文字幕在线观看一区 | 久久久精品一区二区三区 | 国产成人精品网站 | 欧美一级在线观看 | 国产精品高潮呻吟久久aⅴ码 | 免费在线看黄 | 99综合| 中国一级特黄真人毛片免费观看 |