成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

AI 發展是否正在放緩?AI 發展將駛向何方? 原創

發布于 2025-1-26 10:14
瀏覽
0收藏

編者按: 人工智能真的已經遇到發展瓶頸了嗎?隨著 OpenAI、Google 和 Anthropic 等頂級 AI 公司紛紛表示新模型開發收益在減少,這個問題引發了整個行業的深度思考。

我們今天為大家帶來的這篇文章,作者的核心觀點是:雖然傳統的模型規模擴展策略正在遭遇瓶頸,但這可能正是 AI 發展模式轉型的重要契機。

文章從多個維度深入剖析了當前 AI 發展面臨的挑戰:首先,訓練數據的增長已接近極限,因為“我們只有一個互聯網”;其次,簡單地增加模型規模帶來的收益正在遞減;第三,模型的"涌現"能力并不會隨著規模擴大而必然出現。面對這些挑戰,作者提出了幾個潛在的突破方向:探索合成數據的應用、發展推理層面的擴展能力,以及構建更智能的 Agent 系統。

作者 | Lan Chu

編譯 | 岳揚

無論人工智能是否能穿越炒作的迷霧,我都感到生活在人類歷史上這個有趣的時代是如此幸運。回想五年前我開始接觸神經網絡時,AI 連識別貓都顯得力不從心,那時的技術水平遠不如今日。

而如今,我們所做到的事情,對于我們的祖輩來說,恐怕就像是變戲法一樣神奇。人工智能行業的飛速發展,讓我深感敬佩。但接下來的問題是,這樣的發展勢頭能夠持續嗎?

AI 發展是否正在放緩?AI 發展將駛向何方?-AI.x社區

Image source: ??https://ia.samaltman.com/??

01 大膽預測

數月前,Sam 大膽預測“超級智能 AI 將在幾千天內成為現實”,并聲稱 AGI(盡管其定義尚不明確)是“現有硬件條件下就能達成的目標”。然而,行業領袖在 AI 發展預測上的表現并不總是那么可靠。一個典型的例子就是過去十年中對自動駕駛汽車的過分樂觀預期。因此,這樣的預測我們還是應該有所保留。

AI 發展是否正在放緩?AI 發展將駛向何方?-AI.x社區

Source. The Information

很快,情況就出現了變化。OpenAI、Google 和 Anthropic 等領先的 AI 公司紛紛表示,新模型開發的收益正在逐漸減少[1]。Ilya Sutskever 指出,我們在擴大預訓練規模上似乎已經觸碰到一個瓶頸。現在,一個新的觀點正在成為主流,那就是模型擴展似乎已經遇到了障礙。

02 那么,這是否標志著模型擴展的終結?

當前,關于模型擴展的終結似乎成為了熱門話題。

在 2010 年代和 2020 年代初期,我們見證了模型擴展的黃金時期。成功的秘訣似乎很簡單:將海量數據輸入大型神經網絡,經過長時間訓練,就能目睹奇跡的出現。然而,這種策略最終帶來的回報只會遞減。那么,未來幾年我們還能期待些什么呢?

“所有的傳統機器學習模型最終都會遇到增長瓶頸;大語言模型(LLMs)或許也不例外。”

2.1 盡管計算能力在增強,但數據并沒有同步增長

我們只有一個互聯網,而且已經挖掘了所有可用數據。

語言模型訓練數據量的快速增長(先是整個維基百科,接著是社交媒體,最后是大部分互聯網內容),如今似乎已經停滯不前。盡管有些公司正在與出版商合作以獲取更多數據,但我們必須承認:只有一個互聯網,訓練數據不可能再有顯著的增長。 除非,我們開始尋找其他數據源。互聯網上除了豐富的文本,還有大量的圖片、視頻和音頻資源。根據 Epoch AI 的一篇文章[2]估算,從在線多模態數據中提取的文本 tokens 數量,可能會比普通網絡爬蟲數據集多出 5 到 200 倍。

預訓練自回歸模型的時代終將落幕。— Ilya Sutskever

2.2 那么,接下來要提的就是合成數據了

在 2024 年的 NeurIPS 會議上,Ilya 提到了合成數據的使用是未來的發展方向之一,這當然也是經常被視為持續擴展模型規模的一條路徑。其核心思想是,在很多情況下,驗證數據的正確性以及評估數據質量相對容易。合成訓練數據在某些案例中已經取得了顯著成效,比如 AlphaGo[3] 在 2016 年戰勝了圍棋世界冠軍,以及 AlphaZero[4] 和 AlphaProof[5] 通過純粹在自我生成的數據上訓練,學會了玩游戲和解幾何題。

在編程領域,合成數據的一個成功案例是 CriticGPT[6]。OpenAI 在一個審查周期內使用兩個 ChatGPT 實例,一個負責生成代碼,另一個則批判性地審查以便找出代碼中的錯誤。這個想法雖然簡單,但正如我們在下圖中所見,效果顯著!CriticAI 系統發現的問題數量遠超人類。

AI 發展是否正在放緩?AI 發展將駛向何方?-AI.x社區

在編程和數學領域,我們可以生成大量示例,并迅速驗證哪些是正確的,從而創建一個較小的、更精細且高質量的數據集。但對于其他領域,合成數據的適用性可能就有所限制了。我認為,合成數據的應用程度很大程度上取決于具體領域。

2.3 大模型的收益遞減現象

模型的表現不僅會受到訓練數據集規模的影響,也會受到模型自身規模的影響(如下圖所示)。

AI 發展是否正在放緩?AI 發展將駛向何方?-AI.x社區

測試 loss 值與模型大小及訓練數據集規模之間的關系遵循冪律分布。圖片來源:作者根據 OpenAI 的數據制作的圖像。

長期以來,我們通過無腦地增加模型規模和數據量來提升模型性能,但這種策略的效果已經逐漸減弱。

目前,許多 AI 公司轉而致力于開發更小的模型。這些模型可能是性能適中但成本較低的“夠用”模型(比如谷歌的 Gemini mini系列),有時候這些小型模型甚至能超越某些旗艦模型(比如 OpenAI 的 GPT-4o 與 GPT-4 相比)。然而,這種性能提升是以更長的訓練時間為代價的。 我們還觀察到,新的架構設計帶來了意想不到的成果,例如 Claude 的 Haiku 所采用的“混合專家”模型。

2.4 模型規模的擴大并不必然帶來“涌現”能力

過去十年的經驗告訴我們,擴大模型規模、訓練計算量和數據集大小可以增強模型的性能。在大語言模型(LLMs)中,這一點通常體現在它們對序列中下一個單詞的預測能力上。

所謂“涌現”能力,指的是那些在小模型中未曾出現,而在大模型中得以展現的能力。

雖然人工智能在我們設定的各項基準測試中表現日益精進,但它仍舊無法進行真正的推理。人們曾寄希望于,只要模型足夠大,就能突然學會推理。

我們經常看到人工智能在數學和物理測試中超越博士生的報道,但同樣也會看到它在一些簡單測試中的失敗,而這些測試對小孩子來說卻是輕而易舉[7]。如果人工智能無法在其訓練數據之外進行有效泛化,那么繼續增加數據量最終也不會帶來實質性的改善。

03 人工智能將走向何方?

現在,我們再次步入了一個充滿奇跡與驚喜的時代。大家都在尋找下一個可以擴展(scale)的領域。如今,擴展正確的事物比以往任何時候都更為重要。——Ilya Sutskever

3.1 推理層面的擴展

在模型擴展是否已達極限的爭論中,部分焦點已經轉向了“推理擴展”[8]。OpenAI 的 o1[9] 就是這種推理擴展的一個實例。

與模型擴展側重于增加模型大小、訓練數據和計算資源不同,推理擴展著眼于優化模型在運行過程中的處理和推理能力。 這些模型經過微調,以便在給出答案前進行“推理”。

近期的一些創新,如先推理后行動的提示詞技術、智能體、混合模型、幻覺檢測與緩解等,還需要一些時間才能成熟,以進一步提升模型的表現。

3.2 展望未來

盡管我們看到了擴展能力的局限性,但仍有不少人對未來保持樂觀。據 Epoch AI 預測,未來 5 年內,我們有望繼續擴展數據、計算資源和硬件,足以訓練出計算能力是 GPT-4 十倍以上的新型模型。這一數字還有可能增長,但最大的挑戰恐怕是電力需求的激增。

AI 發展是否正在放緩?AI 發展將駛向何方?-AI.x社區

展望 2030 年,人工智能訓練的擴展將面臨哪些限制,以訓練所需的計算 FLOP 來衡量。數據來源:Epoch AI[2]

在 NeuroIPS 的最新演講中,Ilya 對未來發展趨勢做出了一些預測,盡管具體的實施時間和方式尚不明確:

  • 系統將變得智能體化:Agent 是今年人工智能的一大進步。例如,Anthropic 公司幾個月前推出的智能體模型,能夠與計算機互動并實現 AI 的全面控制,令人印象深刻。
  • 系統將能夠推理和理解。AI 的推理能力越強,其行為就越難以預測(頂尖的國際象棋 AI 對棋手來說就是不可預測的)。
  • 系統將擁有自我意識,因為它具備了推理和理解的能力。

讓 AI 具備推理能力將是重要的一步,或許 OpenAI 的 o1 模型已經為我們揭示了未來的發展方向:讓 AI 在給出答案前進行一段時間的思考和推理。AI 的推理能力越強,其不可預測性也就越高。然而,一旦我們擁有了強大的推理能力、完善的智能體系統,并且減少了幻覺現象,實現通用人工智能乃至超級智能將不再遙不可及。

04 結束語

或許模型規模的擴大已經到達極限,也可能尚未結束。大家都在探索下一步該如何走。但可以肯定的是,這種趨勢不會無限持續下去。模型規模擴大的終結,反而帶來了一系列正面效應:人工智能的發展將重新依賴于創新思維和重大突破。有一點共識是明確的:未來充滿了不確定性。

Thanks for reading!

Hope you have enjoyed and learned new things from this blog!

About the author

Lan Chu

Data Scientist | Write about data and AI.

?? LinkedIn ??https://www.linkedin.com/in/lanchuhuong/??

END

本期互動內容 ??

?在你看來,AI發展的下一個突破點最可能出現在哪個方向:數據、算法還是推理能力?

??文中鏈接??

[1]??https://www.bloomberg.com/news/articles/2024-11-13/openai-google-and-anthropic-are-struggling-to-build-more-advanced-ai?utm_source=substack&utm_medium=email&embedded-checkout=true??

[2]??https://epoch.ai/blog/can-ai-scaling-continue-through-2030#data-scarcity??

[3]??https://substack.com/redirect/1ee61e75-b473-46d8-a77e-779c555372aa?j=eyJ1IjoiMjd5a2xjIn0.chM1hwWw4vU3K5gsZ_gHy64h9V82IaY5MSB-0LClvpg??

[4]??https://deepmind.google/discover/blog/alphazero-shedding-new-light-on-chess-shogi-and-go/??

[5]??https://deepmind.google/discover/blog/ai-solves-imo-problems-at-silver-medal-level/??

[6]??https://arxiv.org/pdf/2407.00215??

[7]??https://arcprize.org/arc??

[8]??https://arxiv.org/pdf/2407.21787??

[9]??https://openai.com/o1/??

原文鏈接:

??https://medium.com/gitconnected/is-ai-progress-slowing-down-69d4f1215e49??


?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
標簽
收藏
回復
舉報
回復
相關推薦
主站蜘蛛池模板: 黄色免费在线观看网址 | 色婷婷在线视频 | 日韩在线欧美 | 在线午夜 | 在线a视频网站 | 色婷婷av久久久久久久 | 成人欧美一区二区三区黑人孕妇 | 国产xxx在线观看 | 欧美日韩在线不卡 | 国产成人午夜精品影院游乐网 | 久久久久99 | 日韩欧美天堂 | 日韩成人精品在线 | 操皮视频 | 99免费在线观看视频 | 中文字幕乱码亚洲精品一区 | 欧美区日韩区 | 91正在播放 | 二区欧美| 亚洲日韩视频 | 黄色片网此 | 天天射夜夜操 | 在线观看国产 | 国产综合久久久久久鬼色 | 黄色av免费 | 视频一区二区中文字幕 | 免费毛片在线 | 91精品国产高清一区二区三区 | 久久久91精品国产一区二区三区 | 亚洲天堂av网 | 亚洲成人第一页 | 欧美一级免费 | 91精品国产日韩91久久久久久 | 亚洲毛片在线观看 | 一级国产精品一级国产精品片 | 日本久久网 | 日韩av一区二区在线观看 | 久久av网站| 久久久在线视频 | 国产成人在线视频 | 久久精品超碰 |