任意場景,動嘴就能創(chuàng)建專屬AI智能體小隊的AutoAgents來了
近日,GitHub 上線了一個新的 AI 智能體項目:AutoAgents,該項目是由 Llama2 大模型發(fā)布第二天就發(fā)布了中文版模型下載 [1] 的 LinkSoul.AI 團(tuán)隊牽頭,北大、港科大、智源、滑鐵盧大學(xué)共同發(fā)起。相比 AutoGPT [2]、MetaGPT [3] 這些使用門檻較高、使用場景受限的方案,AutoAgents 致力于將 AI 智能體應(yīng)用于任意場景,自動針對目標(biāo)場景設(shè)計合理的智能體組合,將復(fù)雜任務(wù)解構(gòu)為角色、任務(wù),實現(xiàn)合適的角色解決匹配的任務(wù)。
- 項目鏈接:https://github.com/LinkSoul-AI/AutoAgents
- 在線體驗:https://huggingface.co/spaces/LinkSoul/AutoAgents
任意場景,自動規(guī)劃合理的智能體組合
AutoAgents 致力于提供任意場景的通用解決方案,只需輸入用戶的一句話需求,就能針對目標(biāo)場景快速組建合理的智能體小隊,自動解構(gòu)復(fù)雜的任務(wù),并由合適的智能體分工協(xié)作完成對應(yīng)的任務(wù)。
編寫小說
比如,輸入
「寫一本關(guān)于人工智能覺醒的小說(Write a novel about the awakening of artificial intelligence)」
AutoAgents 會啟動一個 「項目經(jīng)理」(Planner)來設(shè)計完成當(dāng)前任務(wù)所需的其他角色和各角色完成任務(wù)所需要的具體動作。
為了完成這個任務(wù),Planner 設(shè)計需要的幾位專家:一名研究人員(Researcher)收集有關(guān)人工智能及其潛在覺醒的信息,一名故事策劃者(Story Planner)概述小說,以及一名角色開發(fā)人員創(chuàng)造引人入勝的角色,最后,需要一名作家負(fù)責(zé)撰寫敘事。
這些不同領(lǐng)域?qū)<揖?AI 智能體扮演,并依據(jù)計劃執(zhí)行自己的任務(wù)。例如,故事策劃者利用研究人員提供的檢索信息編寫了故事的起承轉(zhuǎn)合,既有高潮也有轉(zhuǎn)折,使得故事更加引人入勝。
最后,由作家完成故事的撰寫。通過各個角色智能體的分工合作,高效完成了小說撰寫任務(wù)。
小游戲快速實現(xiàn)
有了 AutoAgents,任何人都能夠輕松地以極低成本構(gòu)建一個小游戲開發(fā)團(tuán)隊,AutoAgents 會幫你「招募」項目經(jīng)理、程序員、測試員等角色。不同于已有的常見方案,包括 ChatGPT,我們需要手動編寫提示詞(Prompt),在不斷和程序交互過程中自行確認(rèn)要使用的編程語言、項目規(guī)劃、設(shè)計游戲角色等等一系列麻煩事,在 AutoAgents 里,我們只需要明確我們的任務(wù)目標(biāo)即可,非常簡單,就像下面這樣:
寫一段命令行貪吃蛇小游戲的代碼(Show me a code snippet for a cli snake game)
隨后,AutoAgents 會為你創(chuàng)建需要的角色,并為角色賦予職責(zé)和能力,確定每個角色能使用的外部工具列表。之后,各角色根據(jù)規(guī)劃開始有序執(zhí)行任務(wù),互相協(xié)作,并最終實現(xiàn)目標(biāo)。
謠言驗證
不只是軟件或游戲開發(fā)場景,具有極強(qiáng)的場景適應(yīng)能力的 AutoAgents,可以為任何新的場景,自動設(shè)計合理的「新智能體組合」,來解決你的問題。日常生活中,你或許也會被謠言所困擾。我們可以求助于 AutoAgents ,AutoAgents 會自動創(chuàng)建領(lǐng)域?qū)<液驼Z言專家實現(xiàn)謠言的驗證。以最近爆火的 LK-99 超導(dǎo)事件為例,我們只需要向 AutoAgents 提出需求:
LK-99 真的是室溫超導(dǎo)材料嗎?(Is LK-99 really a room temperature superconducting material?)
AutoAgents 便會自動創(chuàng)建材料科學(xué)家和語言專家,并自動在互聯(lián)網(wǎng)整理已知資料,確認(rèn) LK-99 的狀態(tài)。
以上只是 AutoAgents 技術(shù)的簡單嘗試,實際上,其應(yīng)用的可能性只受限于我們的想象。不論是哪一個場景,AutoAgents 都能夠創(chuàng)建出最適合的角色,完成分工,幫助我們高效地完成任務(wù)。
朝著太陽前進(jìn)的年輕團(tuán)隊
上周末(8 月 26 日),LinkSoul.AI 創(chuàng)始人兼 CEO 史業(yè)民博士在機(jī)器之心舉辦的 「Llama 2 大模型算法與應(yīng)用實踐」活動 [7] 上分享了 LinkSoul.AI 發(fā)布的多模態(tài)大模型技術(shù),并接受了機(jī)器之心的采訪。
史業(yè)民本科及博士畢業(yè)于北京大學(xué),師從黃鐵軍教授,從 2013 年便開始進(jìn)行深度學(xué)習(xí)及預(yù)訓(xùn)練模型的研究,作為智源研究院創(chuàng)新應(yīng)用實驗室負(fù)責(zé)人參與了悟道 3.0 的研發(fā),是最大可商用中文指令數(shù)據(jù)集 COIG、COIG-PC 的發(fā)起者和組織者之一,曾獲 CAMEO 蛋白質(zhì)結(jié)構(gòu)預(yù)測年度第一名,主導(dǎo)了第一個中文 Llama 2 模型 Chinese Llama 2 7B [4] 的開發(fā),開源了中英圖文多模態(tài)模型 Chinese LLaVA [5] 和第一個支持中英雙語語音 - 文本多模態(tài)對話模型 LLaSM [6]。
機(jī)器之心:可以簡單介紹一下你們團(tuán)隊背景嗎?
感謝機(jī)器之心的采訪,我們是一家初創(chuàng)公司,叫做 LinkSoul.AI,含義是希望實現(xiàn)人與 AI、AI 與 AI 的心靈連接,樸素點說就是希望 AI 服務(wù)人可以服務(wù)到心坎里。我們的目前團(tuán)隊還比較初期,人不多,團(tuán)隊成員主要來自北京大學(xué)、智源研究院、華為、字節(jié)跳動等頭部頂尖的企業(yè)、高校、研究院所,是國內(nèi)少有的完整經(jīng)歷算子開發(fā)、集群搭建、大模型預(yù)訓(xùn)練、指令微調(diào)、多模態(tài)大模型訓(xùn)練、產(chǎn)品研發(fā)與上線的團(tuán)隊,具備大模型研發(fā)、改進(jìn)、上線能力。
機(jī)器之心:LinkSoul.AI 選擇快速開源多個模型,如今又開源 AutoAgents 技術(shù),是基于什么考慮?會浪費團(tuán)隊時間嗎?
我們并無意將 LinkSoul.AI 打造成一家以開源項目為主的公司。中文 Llama 2 模型是團(tuán)隊業(yè)余時間進(jìn)行的嘗試,當(dāng)時恰逢 Llama 2 發(fā)布,所以順手進(jìn)行了訓(xùn)練和開源。而團(tuán)隊選擇開源圖像、語音多模態(tài)模型則是希望社區(qū)可以多關(guān)注多模態(tài)模型及其技術(shù)應(yīng)用,團(tuán)隊認(rèn)為多模態(tài)模型將會扮演越來越重要的角色,并在游戲、社交、AR/VR/MR 等領(lǐng)域發(fā)揮越來越重要的作用。如今開源 AutoAgents 也是希望團(tuán)隊在 AI 智能體方向的長期積累可以為開源社區(qū)做出貢獻(xiàn)。LinkSoul.AI 可以快速發(fā)布新成果主要是基于團(tuán)隊前期的研究積累,是日常工作的延續(xù),且大量依靠跟高校、研究院所、企業(yè)的聯(lián)合研發(fā),不會分散團(tuán)隊的精力。
機(jī)器之心:現(xiàn)在 Llama 等開源模型進(jìn)展迅速,會如何影響國內(nèi)大模型尤其是 foundation 模型的發(fā)展路線?大家自己訓(xùn)模型是否已成為歷史?
我認(rèn)為開源和閉源都是很重要的分支,尤其是開源模型很難在超大規(guī)模模型上進(jìn)行嘗試,而閉源模型很難進(jìn)行二次開發(fā)和訓(xùn)練。另一方面,Llama 系模型目前主要是以英文為主,對于中文的支持仍然不夠好,現(xiàn)有對于 Llama 進(jìn)行的漢化嘗試都很難說成功。因此,即使只考慮中文大模型的需求,國內(nèi)進(jìn)行大模型訓(xùn)練也仍然很有價值。
機(jī)器之心:你們這次開源的 AutoAgents 技術(shù)有哪些創(chuàng)新?
現(xiàn)有基于大型語言模型的多智能體系統(tǒng)大部分依賴于預(yù)定義的智能體來完成任務(wù),但這些預(yù)定義的智能體限制了對不同場景的適應(yīng)性。AutoAgents 則根據(jù)不同任務(wù)自適應(yīng)地創(chuàng)建 AI 智能體小隊來適應(yīng)不同任務(wù)場景,并基于生成的 AI 智能體組合為當(dāng)前任務(wù)規(guī)劃解決方案。通過自動規(guī)劃多個智能體的相互協(xié)作,高效地完成任務(wù)。同時,執(zhí)行環(huán)境中存在觀察員根據(jù)執(zhí)行結(jié)果動態(tài)改進(jìn)執(zhí)行計劃,從而生成更準(zhǔn)確的解決方案。AutoAgents 突出了在團(tuán)隊合作中為不同任務(wù)分配不同角色的重要性,為處理復(fù)雜任務(wù)提供了全新視角。
機(jī)器之心:AutoAgents 對于 LinkSoul.AI 有何價值?
LinkSoul.AI 致力于提供服務(wù)于所有人的 AI,希望通過構(gòu)建人與 AI、AI 與 AI 的溝通中間件使得調(diào)用 AI 的能力不再是某些人的特權(quán)。而 AutoAgents 是團(tuán)隊在 AI 與 AI 溝通方向的一次嘗試,希望能將調(diào)用 AI 智能體的門檻降低到人人可用。現(xiàn)階段的 AutoAgents 仍依賴于收費的大模型 API 服務(wù),未來團(tuán)隊會嘗試通過開發(fā)專用的智能體生成模型、智能體調(diào)度模型等實現(xiàn)對于 API 的替代。同時,LinkSoul.AI 還會在更多人與 AI、AI 與 AI 方向進(jìn)行嘗試,希望能為人們帶來最極致的 AI 體驗。
AutoAgents 本地部署
最后,本地部署 AutoAgents 也十分便捷。按照如下步驟即可輕松在本地完成 AutoAgents 部署。
步驟 1:下載項目倉庫
git clone https://github.com/LinkSoul-AI/AutoAgents
cd AutoAgents
步驟 2:創(chuàng)建 Docker 鏡像
IMAGE="linksoul.ai/autoagents"
VERSION=1.0
docker build -f docker/Dockerfile -t "${IMAGE}:${VERSION}" .
步驟 3:啟動 Docker 容器
docker run -it --rm -p 7860:7860 "${IMAGE}:${VERSION}"
在這三個步驟執(zhí)行成功后,即可在瀏覽器打開鏈接 http://127.0.0.1:7860 開啟你的 AutoAgents 之旅。
總結(jié)
AutoAgents 作為一個剛剛發(fā)起的項目,目前還處于非常早期,非常歡迎開源社區(qū)和開源愛好者積極參與貢獻(xiàn)。AI 智能體技術(shù)作為目前大模型最重要的發(fā)展方向,未來必將在社交、游戲等領(lǐng)域發(fā)揮重大作用。期待更多像 LinkSoul.AI 一樣的團(tuán)隊出現(xiàn),推動人工智能技術(shù)服務(wù)于所有人,實現(xiàn) AI 平權(quán)。