成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

從openAI最新模型GPT-o1再談思維鏈(Cot)技術,大模型該怎么提升其邏輯推理能力? 原創

發布于 2024-9-18 10:57
瀏覽
0收藏

“ 推理能力是大模型邁向AGI的必經之路 ”

最近openAI發布了號稱史上最強模型——o1,其具有強大的邏輯推理能力,號稱能達到人類的博士生水平。

而從o1模型的評測來看,o1模型在數學競賽,編碼,科學問答等方面表現良好,甚至高出了GPT4o一大截。

而且,o1在物理,化學,生物,邏輯學等其它領域,相比GPT4o都得到了巨大的提升。

而據介紹o1模型之所以具有如此強大的邏輯推理能力,就是因為使用了思維鏈技術;當然,目前官方并沒有公布o1的核心技術理論,因此也不排除o1模型使用了其它更加強大的邏輯推理技術。

大模型之思維鏈技術

在前面的文章中也簡單介紹過大模型的思維鏈技術——大模型推理引擎之思維鏈技術,里面介紹了思維鏈的基本邏輯以及其實現原理。

簡單來說,思維鏈技術就是模擬人類的思維方式,在面對復雜問題時,讓大模型像人類一樣思考,把復雜問題拆分成簡單的步驟,然后通過調用工具一步一步地去完成。

而大模型還有哪些能夠提升其邏輯推理能力的技術或方法?今天就來盤點一下提升大模型邏輯推理的黑科技。

初級推理技術

大模型初級推理技術的核心是,把大型復雜的任務,分解成一個一個的簡單的小任務。

主要包括,思維鏈(CoT),自洽性思維鏈(CoT-SC),思維樹(TOT-tree of thought)等技術。

思維鏈

思維鏈全稱Chain of Thought,就是把任務進行拆解,適用于各種推理任務,比如數學,邏輯判斷等,思維鏈的優點就是不用對模型進行訓練和微調。

在思維鏈技術中,可能還會使用到零樣本(zero-shot prompt)提示和少樣本提示(few-shot prompt)等技術。

從openAI最新模型GPT-o1再談思維鏈(Cot)技術,大模型該怎么提升其邏輯推理能力?-AI.x社區

自洽性思維鏈

所謂的自洽性思維鏈,是指對同一個問題,生成多個不同的思維鏈技術,并讓模型從中挑出最合適的方案。

思維鏈技術并不穩定,其效果取決于大模型的能力,而如果讓大模型進行發散性思維,通過多種不同的方式解決問題,然后從中找到最優解,這就是自洽性思維鏈。

思維樹

思維樹(TOT)是對思維鏈(CoT)的進一步擴展,在思維鏈的每一步,推理出多個分支,拓撲展開成一棵思維樹。使用啟發式的方法評估每個推理分支對問題解決的貢獻。

使用搜索算法,如廣度搜索或深度搜索算法等來探索思維樹,并進行前瞻和回溯。

中級推理技術

初級推理技術的優點是簡單,缺點是結果不可控,推理過程與結果完全由大模型本身自由發揮,即使出錯也沒有糾錯機制。

因此,以ReAct,Plan & Execute和Self Discover為代表的中級推理技術就出現了。

其會約束大模型的推理方向,并根據環境反饋進行糾錯。

ReAct

ReAct全稱Reasoning and Acting,意思就是推理與行動,來解決多樣化的語言推理與決策任務。

其典型的流程是Thought-思考——Action-行動和Observation-觀察;思考與行動都比較容易理解,觀察其實就是一個反饋的過程,把任務執行的步驟記錄下來進行觀察,根據觀察結果進行調整。

這樣經過思考——行動——觀察——再思考——再行動——再觀察的過程,經過多次循環,最終達到目的。

從openAI最新模型GPT-o1再談思維鏈(Cot)技術,大模型該怎么提升其邏輯推理能力?-AI.x社區

Plan & Execute 

Plan & Execute 方法的本質是先計劃再執行,從名稱就可以看出,計劃 & 執行,通過把問題拆分成一個一個的子任務,根據情況調整執行計劃。

Self-Discover 

Self-Discover主要包含兩個階段:

階段一:自發現特定任務的推理結構

階段二:應用推理結構

高級推理技術——Reflexion 和 LATS

初級推理和高級推理雖然能解決一些簡單的任務,但對一些更復雜,思維鏈路更長的任務就束手無策了。

因此,高級推理技術就出現了,Reflexion和LATS的核心思想就是通過強化學習的方式來解決更復雜的任務場景。

Reflexion

Reflexion 的本質是強化學習,它主要由三部分組成,參與者——Actor,評估者——Evaluator和自我反思——Self-Reflection。

Reflexion 旨在通過反思過去的錯誤,并把這些知識納入未來的決策,用以幫助Agent提升表現能力。因此,Reflexion非常適合那種通過反復實驗得到結果的任務,比如決策,推理,編程等。

從openAI最新模型GPT-o1再談思維鏈(Cot)技術,大模型該怎么提升其邏輯推理能力?-AI.x社區

LATS——Language Agent Tree Search

LATS技術全稱是——Language Agent Tree Search,簡單來說就是Tree search + ReAct + Plan&Execute+ Reflexion,因此可以說LATS技術是目前最強的推理技術,集百家之長。

這里的ReAct,Plan & Execute 和Reflexion在前面的內容中都簡單介紹過,這里要再介紹一下Tree Search。

Tree Search是一種樹搜索算法,LATS使用蒙特卡羅算法(MCTS),通過平衡搜索找到最優決策路徑。

總之,大模型的推理能力是邁向AGI的基礎,也是Agent未來應用的基石。


本文轉載自公眾號AI探索時代 作者:DFires

原文鏈接:??https://mp.weixin.qq.com/s/_8IQuXHPD1pjG1aaNh9q6w???

?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
已于2024-9-18 11:01:08修改
收藏
回復
舉報
回復
相關推薦
主站蜘蛛池模板: 一级黄色绿像片 | 国产成人在线视频 | 国产精品免费av | 91久久精品一区二区二区 | 国产精品99久久免费观看 | 欧美综合国产精品久久丁香 | 亚洲毛片在线观看 | www国产成人免费观看视频,深夜成人网 | 一区二区三区免费在线观看 | 日韩精品一区二区三区 | 一区二区影院 | 免费观看av | 99福利视频 | 国产一区二区三区视频免费观看 | 久久免费观看一级毛片 | 日韩中文字幕在线视频 | 成人综合视频在线观看 | 欧美福利 | 天堂一区二区三区 | 欧美精品久久 | 久草在线中文888 | 亚洲成人免费网址 | 一区二区欧美在线 | 国产a区| 韩日在线| 久久av一区| 精品美女 | 欧美在线a | 黄色av免费网站 | 99久久99| 中文字幕一级毛片视频 | 久久69精品久久久久久国产越南 | 操操操操操 | 丝袜美腿一区二区三区动态图 | 2020国产在线 | 91成人精品| 精品一区二区久久久久久久网站 | 日一区二区三区 | 在线观看视频中文字幕 | 亚洲欧美精品 | 亚洲精品国产第一综合99久久 |