o1蒙特卡洛樹的風又吹到了Agentic工作流！

發布于 2024-11-6 14:43

瀏覽

0收藏

?AFlow 是一個用于自動生成和優化Agentic工作流的框架。它使用蒙特卡洛樹搜索（Monte Carlo tree search）在代碼表示的工作流空間中查找有效的工作流，用機器工作取代手動開發。在各種任務上都顯示出超越手工工作流的潛力，由MetaGPT開源。

AFLOW（以黃色突出顯示）在所有六個基準測試中始終優于所有自動化工作流優化和手動設計的方法（IO、CoT、CoT SC、MedPrompt、MultiPersona、Self Refine、ADAS）

o1蒙特卡洛樹的風又吹到了Agentic工作流！-AI.x社區

AFLOW在GSM8K上的樹狀迭代過程：突出顯示了從初始輪次（第1輪）到表現最佳的工作流的路徑，報告了每個節點的得分及其與前一個節點的修改。提示兩側的紫色部分代表了本輪迭代中的主要提示修改。

o1蒙特卡洛樹的風又吹到了Agentic工作流！-AI.x社區

框架組件

節點：LLM 調用的基本單元。參考metagpt/actions/action_node.py用于控制 LLM、溫度、格式和提示的靈活接口。

Operator：預定義 Node 組合，提升搜索效率。封裝了 Generate、Format、Review、Revise、Ensemble、Test、Programmer 等常用操作。參考metagpt/ext/aflow/operator.py。支持定制自己的 Operator。
工作流：通過邊連接的一系列 LLM 調用節點。可以表示為圖形、神經網絡或代碼，以表達各種執行結構。參考metagpt/ext/aflow/workflow.py。
優化器：使用蒙特卡洛樹搜索變體中的 LLM 來探索和優化工作流程。根據性能迭代地選擇、擴展、評估和更新工作流程。參考metagpt/ext/aflow/scripts/optimizer.py。
評估器：評估給定任務的工作流程績效。提供反饋以指導優化過程實現更有效的工作流程。參考metagpt/ext/aflow/scripts/evaluator.py。

FLOW的整體框架：通過設置一個由只有提示參數靈活的節點組成的搜索空間，給定的操作符集合，以及表示邊緣的代碼，AFLOW在這個空間內執行基于MCTS的搜索。通過為工作流優化設計的MCTS變體，AFLOW迭代執行一個周期的軟混合概率選擇、基于LLM的擴展、執行評估和經驗反向傳播，直到達到最大迭代次數或滿足收斂標準。

o1蒙特卡洛樹的風又吹到了Agentic工作流！-AI.x社區

實驗數據集

對六個數據集（HumanEval、MBPP、GSM8K、MATH、HotpotQA、DROP）進行了實驗，并提供了它們的評估代碼。

經AFLOW優化的工作流平均超過所有手動設計方法5.7%，在自動化工作流優化工作中超越了19.5%。
在QA、代碼和數學領域的六個數據集上，AFLOW實現了平均80.3%的性能，標志著這種方法的能力和可用性。
值得注意的是，與類似工作相比，AFLOW在更具挑戰性的任務上表現更好，在MATHlv5*和MBPP任務上比ADAS提高了57%，展示了該模型在復雜數據集上的魯棒性。

o1蒙特卡洛樹的風又吹到了Agentic工作流！-AI.x社區

https://github.com/geekan/MetaGPT/tree/main/examples/aflow
https://arxiv.org/pdf/2410.10762
AFLOW:AUTOMATING AGENTIC WORKFLOW GENERATION

本文轉載自??PaperAgent??

標簽

Agentic

工作流

贊

回復

舉報

回復

相關推薦

吳恩達深度剖析：AI Agent 工作流的演進與前景

wsp_ping ? 8316瀏覽 ? 0回復
可信Agent構建之道：AI如何重塑工作流？

ermulong ? 2328瀏覽 ? 0回復
可信Agent構建之道：AI如何重塑工作流？

xuxiangda ? 2358瀏覽 ? 0回復
再談大模型工作流技術之——ComfyUI框架

AI探索時代 ? 9136瀏覽 ? 0回復
記一次ComfyUI工作流bug查找過程

AI探索時代 ? 2993瀏覽 ? 0回復
o1推理擴展的風吹到了RAG，性能飆升58.9%！

PaperAgent ? 2757瀏覽 ? 0回復
o1快慢思考的風又吹到了Agent！

PaperAgent ? 3091瀏覽 ? 0回復
深度解析 REAcT Agent 的實現：利用 LlamaIndex 和 Gemini 提升智能代理工作流

Halo咯咯 ? 7282瀏覽 ? 0回復
o1的風又吹到多模態，直接吹翻了GPT-4o-mini

PaperAgent ? 2401瀏覽 ? 0回復
RAG工作流哪種組合效果最佳？深入探究RAG領域最佳實踐

AI博物院 ? 2412瀏覽 ? 0回復
4種革新性AI Agent工作流設計模式全解析

大語言模型論文跟蹤 ? 3102瀏覽 ? 0回復
RAG工作流哪種組合效果最佳？深入探究RAG領域最佳實踐

AI博物院 ? 4110瀏覽 ? 0回復
Agent只是手段，工作流才是內容！

51CTO技術棧 ? 2110瀏覽 ? 0回復
工作流代理新突破：FlowAgent的合規性與靈活性解析

xuxiangda ? 2494瀏覽 ? 0回復
什么是工作流？如何創建和編排AI智能體工作流

數字化助推器 ? 6221瀏覽 ? 0回復
DeepSeek-R1的風吹到了多模態，Visual-RFT發布，視覺任務性能飆升20%

PaperAgent ? 2152瀏覽 ? 0回復
智能體（Agent）的三種表現類型：聊天助手、工作流與對話流

九歌AI大模型 ? 2006瀏覽 ? 0回復
AI Agents-5 | AI工作流與代理的深度剖析：從原理到實戰應用

Halo咯咯 ? 1891瀏覽 ? 0回復
如何在Dify工作流節點中使用Coze的插件商店

九歌AI大模型 ? 2436瀏覽 ? 0回復

PaperAgent

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

51CTO

51CTO博客

51CTO學堂

o1蒙特卡洛樹的風又吹到了Agentic工作流！

框架組件

實驗數據集

目錄