大模型思維鏈升級之DoT框架 原創
本文介紹LLM大模型中其中一種思維鏈DoT。
盡管傳統的思維鏈方法使大型語言模型能夠進行“思考”,例如思維樹和思維圖方法通過引入分叉結構來探索多種推理路徑。然而,這些方法通常需要額外的控制機制或依賴多個模型的協同工作,這無疑增加了實現和部署的難度。
清華大學的研究團隊最近提出了一個新的思維鏈框架思維圖(Diagram of Thought, DoT),號稱是能夠超越線性思維的突破。
感興趣的小伙伴可以看看原文:??https://arxiv.org/pdf/2409.10038v1??
DoT框架
DoT框架的獨到之處體現在其將推理活動完整地構建為一個單一大型語言模型(LLM)內的有向無環圖(DAG)。這種策略有效地捕捉了推理過程中的非線性和遞歸性,同時確保了計算的高效率。
DoT框架在單個LLM內部通過管理三個關鍵角色來完成思維鏈的構建:
- 提議者(Proposers):負責提出新的論點或邏輯步驟,并將這些新內容作為節點加入到有向無環圖(DAG)中。
- 批評者(Critics):負責對提出的論點進行評估,識別其中的錯誤、不一致性或邏輯上的缺陷,并在DAG中添加相應的批評節點。
- 總結者(Summarizers):負責將經過驗證的論點整合成一個連貫的推理鏈條,這本質上是對DAG進行拓撲排序,以生成最終的推理結果。
DoT推理步驟
上圖為論文中的推理步驟過程圖,具體可以分為8個步驟:
- 起點設定:推理的起始點位于圖的頂部,通常由提議者角色來啟動。
- 初始命題形成:提議者負責提出初始命題P1,該命題在圖中以虛線圓圈表示,凸顯了提議者在推理啟動階段的核心作用。
- 評估與修正:批評者角色對初始命題P1進行審查,并提出批評C1。這一過程在圖中通過從P1指向C1的箭頭表示。基于批評,提議者再次介入,提出經過改進的命題P1'。
- 迭代優化:命題P1'繼續接受批評C2的檢驗。這一過程可能需要多次迭代,展示了提議者與批評者之間的動態互動,直至命題得到驗證(圖中標記為"P1' (Verified)")。
- 多路徑探索:DoT框架的優勢在于能夠并行探索不同的推理路徑。例如,命題P3代表了另一條推理路徑,并且也經歷了批評和驗證的過程。
- 驗證命題的匯總:當多個命題如P1' (Verified)和P3 (Verified)通過驗證后,總結者角色介入。在圖的底部,這些經過驗證的命題匯聚并進入總結階段。
- 無效命題的排除:圖中的虛線圓圈表示那些被判定無效的命題,這些命題不會被納入最終的總結,體現了批評者在確保推理質量中的關鍵角色。
- 綜合推理鏈:所有經過驗證的命題最終由總結者整合,形成完整的推理鏈。在圖中,這一過程體現在底部的"Summarization"節點。
總結
借助這種明確的角色分配和系統化的推理步驟,DoT框架能夠在單一的大型語言模型內部有效地處理復雜的推理任務。該框架不僅支持多條推理路徑的并行發展,還通過持續的批評和修正機制來保證推理的準確性。這種方法顯著提升了模型解決復雜問題的能力,同時確保了推理過程的清晰度和可解釋性。
文轉載自公眾號瓦力算法學研所,作者:喜歡瓦力的卷卷
?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
已于2024-10-29 15:23:40修改
贊
收藏
回復
分享
微博
QQ
微信
舉報

回復
相關推薦