AutoGPT、AgentGPT、BabyAGI、HuggingGPT、CAMEL:各種基于GPT-4自治系統總結
ChatGPT和LLM技術的出現使得這些最先進的語言模型席卷了世界,不僅是AI的開發人員,愛好者和一些組織也在研究探索集成和構建這些模型的創新方法。各種平臺如雨后春筍般涌現,集成并促進新應用程序的開發。
AutoGPT的火爆讓我們看到越來越多的自主任務和代理利用了GPT-4的API。這些發展不僅增強了處理集成不同系統的復雜任務的能力,而且還推動了我們通過自主人工智能所能實現的界限。
我們這里將整理一些開源的類似AutoGPT的工具系統,這些工具和應用程序可以大致分為命令行接口(CLI)和基于瀏覽器的解決方案,HuggingGPT可以同時支持這兩種解決方案。
命令行:AutoGPT, BabyAGI
瀏覽器:AgentGPT, CAMEL, Web LLM
Auto-GPT
盡管Auto-GPT是一個實驗性的開源應用程序,但是它的增長是迅速的。該程序由GPT-4驅動,可以自主實現設定的任何目標。
GitHub: https://github.com/Significant-Gravitas/Auto-GPT
看看它的Github Star的增長幅度可以看到最近的火爆
AgentGPT
AgentGPT是一種基于web的解決方案。它允許配置和部署自治AI代理,并讓它完成任何目標。它將嘗試通過思考要做的任務、執行任務并從結果中學習來達到目標。
該平臺目前處于測試階段,正在開發以下功能:
- 通過矢量DB進行長期的記憶
- 通過LangChain(LangChain是一個用于構建基于大型語言模型LLM的應用程序的庫)進行web瀏覽
- 與網站和人的互動
- 用戶和身份驗證
Git?Hub: https://github.com/reworkd/AgentGPT
網站: https://agentgpt.reworkd.ai/
BabyAGI
BabyAGI任務驅動自治代理的精簡版本
它的主要思想是基于先前任務的結果和預定義的目標來創建任務。然后,腳本使用OpenAI的語言模型功能來創建基于目標的新任務,Pinecone來存儲和檢索上下文的任務結果,這可以說是最精簡的自治AI架構了,如果你對這個方向有興趣,可以看看他的代碼。
?GitHub: https://github.com/yoheinakajima/babyagi
網站: http://babyagi.org/
HuggingGPT
微軟的HuggingGPT,又名JARVIS,它包括一個LLM作為控制器和許多專家模型作為協作執行者(來自HuggingFace Hub)。它工作流程包括四個階段:
- 任務規劃:使用ChatGPT分析請求以了解意圖,并將其分解為可能的可解決任務。
- 模型選擇:使用ChatGPT根據描述選擇專家模型。
- 任務執行:調用并執行每個選定的模型,并將結果返回給ChatGPT。
- 響應生成:最后,使用ChatGPT集成所有模型的預測并生成響應。
?GitHub: https://github.com/microsoft/JARVIS
HF: https://huggingface.co/spaces/microsoft/HuggingGPT
Web LLM
Web LLM是一個基于LLM和基于LLM的聊天機器人,在沒有服務器支持的情況下在瀏覽器內運行,并通過WebGPU加速。從技術上講,Web LLM不是人工智能的自治解決方案,而是輕量級的網絡聊天機器人。
GitHub: https://github.com/mlc-ai/web-llm
CAMEL
CAMEL 是 ”Communicative Agents for ‘Mind’ Exploration of Large Scale Language Models“的縮寫,它提出了一種新穎的代理框架,即角色扮演,作為 AutoGPT 和 AgentGPT 的替代方案。
?GitHub: https://github.com/lightaime/camel
網站: http://agents.camel-ai.org/
GPTRPG
這個系統將游戲和大語言模型結合,主要包含2個部分
一個支持llm的AI代理的簡單的類似rpg的環境
通過OpenAI API將AI代理植入到游戲環境的角色中
這是基于最近發布的一篇論文,其中部署了多個代理來自主參與在線游戲。
?GitHub: https://github.com/dzoba/gptrpg
Arxiv:https://arxiv.org/abs/2304.03442
總結
集成ChatGPT和LLM到各種應用程序中只是使用語言模型的潛力的一部分。這些模型是為了處理自然語言任務而設計的,包括文本生成、翻譯、摘要、問答等等。未來的語言模型將更加先進和智能,能夠在更廣泛的應用領域中提供幫助。
例如,未來的語言模型可以用于更準確的機器翻譯,使人類之間的跨文化交流更加便利。他們也可以用于自動摘要和內容生成,以幫助作者和媒體機構更快地創建和發布內容。此外,語言模型也可以用于語音識別和自然語言處理,以便人們能夠更好地與計算機交互。
總之,隨著語言模型技術的不斷進步,我們可以期待看到更多的創新和進步。這些模型將成為人工智能領域的核心技術,為我們提供更好的解決方案和更廣泛的應用場景。