AI再進化:系統(tǒng)二思維讓大模型學會深思熟慮
如果要問近幾年人工智能領域哪個研究方向火爆,恐怕非大模型莫屬。隨著2022年年底OpenAI推出ChatGPT產(chǎn)品,圍繞大模型的人工智能商業(yè)化進程駛入快車道,深刻地改變著各行各業(yè)的生產(chǎn)方式和服務模式。
根據(jù)市場調(diào)研機構Precedence?Research的數(shù)據(jù),2023年,全球人工智能市場規(guī)模已達約11879億元,預計到2030年,這一數(shù)字將飆升至114554億元,實現(xiàn)超過35%的復合增長率。但需要指出的是,模型的訓練需要海量的數(shù)據(jù),包括文本、圖像、語音等,并且在訓練過程中,可能還要調(diào)整模型的參數(shù)來優(yōu)化性能、提升準確性,這就要有強大的計算能力提供支撐。
數(shù)據(jù)顯示,ChatGPT一次完整的模型訓練成本超過8000萬元。如果進行10次完整的模型訓練,成本便高達8億元,這顯然成為了大模型發(fā)展的一大障礙。
??不過,近期OpenAI高級科學家Noam?Brown提出了一項引人注目的理論,為解決這一難題提供了新的思路。他表示,讓AI模型在每次決策前思考20秒,其性能提升相當于擴大模型體積和訓練時間至十萬倍,而“系統(tǒng)二思維”(System?2?thinking)正是實現(xiàn)這一突破的關鍵所在。
AI領域新的思維模式
系統(tǒng)二思維這一概念源于心理學,由諾貝爾獎得主Daniel?Kahneman提出。該理論認為,人類思維是由兩個截然不同的系統(tǒng)驅(qū)動的。系統(tǒng)一思維是快速、直觀和自動的,控制著我們的快速判斷,比如對突發(fā)事件的反應或?qū)κ煜つJ降淖R別。相比之下,系統(tǒng)二思維則是緩慢的、深思熟慮的、善于分析的,支持復雜的問題解決、計劃和推理。
盡管這兩個系統(tǒng)通常被分開對待,但它們在不斷地相互作用。系統(tǒng)一思維產(chǎn)生印象、直覺和意圖;系統(tǒng)二思維對建議進行評估,如果認同,就將其整合進深思熟慮的選擇中。這使得人類能夠無縫地駕馭各種情況,從日常生活到具有挑戰(zhàn)性的問題。
Brown將這一理論引入AI領域,并主張通過促使AI進行更深層次的分析與推理,能夠在不大幅增加資源的前提下,顯著提升模型的性能。具體來看:
第一,提升推理和解決問題的能力。具有系統(tǒng)二思維的大模型將在邏輯推理、理解復雜概念以及解決需要仔細思考和考慮的問題方面表現(xiàn)得更好。這可能包括從高級數(shù)學問題解決到更微妙的道德推理等方面。
第二,改善對上下文和細微差別的理解。當前的大模型在理解上下文和細微差別方面可能會遇到困難,尤其是在復雜或模棱兩可的情況下。系統(tǒng)二思維將使大模型更好地掌握人類語言的微妙之處和現(xiàn)實世界場景的復雜性。
第三,減少偏見和錯誤。雖然系統(tǒng)一思維反應迅速,但也更容易受到偏見和錯誤的困擾。通過納入系統(tǒng)二思維,大模型有可能減少這些偏見,導致更公平和準確的結果。
第四,更好制定決策。在商業(yè)或醫(yī)學等決策通常具有重大后果的領域,具有系統(tǒng)二思維的大模型可以分析大量數(shù)據(jù),權衡不同的選項,并根據(jù)邏輯推理和證據(jù)提出決策建議。
第五,增強學習和適應能力。大模型中的系統(tǒng)二思維可能會導致改進的學習能力,使其不僅能夠從數(shù)據(jù)中學習,而且能夠理解和應用各種情況下的抽象概念、原則和策略。
第六,更有效地人機協(xié)作。有了系統(tǒng)二思維,大模型能更好地理解和預測人類的需求和行為,從而帶來更有效和直覺的人機互動和合作。
發(fā)展未來可期
值得注意的是,在AI領域?qū)崿F(xiàn)真正的系統(tǒng)二思維是一項重大挑戰(zhàn)。這不僅需要改進算法方法和計算能力,還需要更好地理解人類的認知和推理過程。到目前為止,大模型主要以一種更接近人類系統(tǒng)一思維的方式運行,依賴于模式識別和快速反應生成,而不是深入的邏輯推理。
但我們也看到,已經(jīng)有科技企業(yè)邁出了探索的步伐。例如,OpenAI推出的o1模型融入了系統(tǒng)二思維,從而使得AI能夠執(zhí)行更為深入的推理過程。據(jù)悉,在國際數(shù)學奧林匹克資格考試中,該模型的正確率高達83%,遠超目前主流模型的13%。
同樣值得關注的,還有DeepMind推出的Talker-Reasoner框架。這一框架結合了兩種思維模式。其中,Talker組件負責處理與用戶和環(huán)境的實時交互,感知觀察,解釋語言,從記憶中檢索信息,并產(chǎn)生對話反應。Reasoner組件負責執(zhí)行復雜的推理和規(guī)劃,并與工具和外部數(shù)據(jù)源互動,以增加其知識并作出明智的決策。
我們認為,通過模擬人類的深思熟慮過程,大模型不僅能夠提高其解決問題的能力,還能更好地理解和適應復雜多變的環(huán)境。這種進步不僅限于技術領域內(nèi)的應用擴展,更意味著在更多的行業(yè)中實現(xiàn)更加人性化和高效的服務。
寫在最后:
毫不夸張地說,將系統(tǒng)二思維整合到大模型標志著AI迎來了進化的關鍵時刻。可以預見的是,隨著大模型的廣泛應用,將幫助我們解決更為復雜的問題、提供更加精準的服務,推動人類社會邁向一個全新的智能時代。