成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

清華版「AutoGPT」登GitHub熱榜!復雜任務輕松搞定,還能自己訓練模型

人工智能 新聞
將一個數據包上傳到XAgent,讓它分析數據并生成一個報告,它就能迅速將任務分解為數據理解、驗證Python環境、編寫數據分析代碼、編寫報告4個子任務。

清華開源通用智能體XAgent,登上GitHub熱榜,狂攬1400+??

圖片

各種任務都能做,讓它使用python來分析給定的數據,分分鐘搞定:

圖片

數學題也難不倒它:

圖片

編制最有影響力的心理學讀書清單,并對每本書做簡要總結這種操作就更不在話下:

圖片

(上圖中的翻譯均為機器翻譯)

通過展示可以看到,XAgent在回答問題時會分條縷析,逐步給出回答,這是開發專門為其設計的雙循環機制

這種設計下,XAgent的自主性非常高,處理復雜任務也“得心應手”,關鍵安全性也很高。

在各項基準測試下,XAgent表現都完全優于AutoGPT、GPT-4。

更多細節我們接著往下看。

各種任務都能做

將一個數據包上傳到XAgent,讓它分析數據并生成一個報告,它就能迅速將任務分解為數據理解、驗證Python環境、編寫數據分析代碼、編寫報告4個子任務

最后繪制出來的圖是這樣嬸兒的:

圖片

再來讓XAgent推薦一些適合好友聚會的餐廳,但這次故意不提供具體細節。XAgent識別到提供的信息不足,立刻采用了“請求人類幫助”工具,讓用戶介入表明自己喜歡的位置、預算限制、烹飪偏好、有無忌口等。

如此一來,XAgent就能生成一份定制化的餐廳推薦名單。

圖片

此外,XAgent處理起復雜任務也是有兩把刷子在身上的,比如訓練模型

開發者展示了一個希望XAgent分析電影評論并評估特定電影周圍公眾情感的情景。收到這一指令,XAgent迅速啟動下載IMDB數據集,訓練一款先進的BERT模型。

擁有了這個訓練有素的BERT模型,XAgent就能夠輕松應對電影評論的復雜細節,提供關于公眾對各種電影看法的見解性預測。

圖片

總的來說,開發者表示XAgent具有五大特點:自主性、安全性、可擴展性、GUI、人機協同

自主性是指XAgent可以在沒有人類參與的情況下自動解決各種任務。

而安全性則是因為它的所有行為都被設計限制在一個docker容器(ToolServer )內,不用擔心主機環境會受影響。

docker容器內包含了可以寫入、讀取和修改文件的文件編輯器,可運行Python代碼的Python筆記本,可搜索和訪問網頁的網頁瀏覽器,還有一個bash shell工具以及Rapid API

所以,使用者也可以輕松地添加新工具來增強智能體的能力,甚至打造一個全新智能體。

開發者還為用戶提供了友好的圖形用戶界面來與XAgent交互,當然也可以使用命令行界面。

人機協同這方面主要是指XAgent不僅有能力按照人類的要求來解決復雜的任務,而且在遇到挑戰時還可以尋求用戶幫助。

圖片

能夠擁有這些特點,還要得益于XAgent的核心設計。XAgent主要由三大部分組成:

  • 調度器:負責動態實例化和分派任務給不同的智能體,允許用戶添加新的智能體以及改進智能體的能力。
  • 規劃器:負責為任務生成和校正計劃,將任務分解為子任務,并為它們生成步驟,使智能體能夠逐步解決任務。
  • 行動者:負責采取行動實現目標和完成子任務。行動者利用各種工具來解決子任務,也可以與人類合作來解決任務。

設計上,開發者刻意避免將人類的先驗知識注入到XAgent系統設計中,而是賦予了智能體自己規劃、決策過程的能力,進一步發掘智能體的潛力。

另外,XAgent框架設計還采用了雙循環機制:外循環(Outer-Loop)用于高級任務管理,內循環(Inner-Loop)用于低級任務執行。

圖片

外循環使智能體能夠識別總體任務,然后將其劃分為更小、更具可操作性的子任務。相比之下,內循環過程作為詳細的執行器,專注于處理被劃分的任務。

開發者表示:

XAgent反映了人類采用的自然認知層次結構,并可以根據執行結果反復迭代優化計劃。

全面優于AutoGPT

開發者還對基于GPT-4所打造的XAgent進行了一套基準測試,主要測試XAgent推理、規劃和使用外部工具的能力。

測試內容包括:在FreshQA和HotpotQA上測試Web搜索問答能力;在MBPP上測試Python編程能力;在MATH上測試數學推理能力;在InterCode上測試交互式編碼能力;在ALFWorld上測試文本游戲中的具身推理。

以下是與原版GPT-4的比較,XAgent全面優于GPT-4:

圖片

考慮到缺乏合適的針對AI智能體的高質量基準測試,開發者還手動策劃了50條復雜的指令,可以分為5個類別:搜索與報告,編碼與開發,數據分析,數學和生活助手。

然后將指令它們輸給了XAgent和AutoGPT,并邀請了多位專家來評估對XAgent和AutoGPT輸出結果的偏好(勝率)。

圖片

結果XAgent全面取勝,不僅在傳統的AI基準測試中表現出色,而且還在處理復雜指令方面表現出卓越的適應性、效率和精度。

GitHub鏈接:https://github.com/OpenBMB/XAgent

責任編輯:張燕妮 來源: 量子位
相關推薦

2019-12-04 15:00:04

GitHub 技術開源

2024-05-28 14:46:00

2024-08-09 08:52:26

2020-09-07 15:46:48

GitHubVim開發

2023-02-22 15:02:52

GitHub指南

2025-05-28 09:09:00

2024-01-04 14:46:10

AI開發者GPT

2023-10-10 07:19:07

Github開源庫系統

2019-12-26 15:31:17

騰訊框架開源

2024-04-15 12:28:00

AI模型

2024-02-19 13:46:04

多模態信息LWMtoken

2024-09-04 15:09:58

AI模型

2024-02-21 12:19:00

AI模型

2023-04-19 08:14:24

2020-01-03 16:00:28

谷歌GitHub機器學習

2022-09-20 15:24:09

程序員項目

2023-07-10 19:13:19

代數課程Strang

2019-08-08 16:37:31

開源技術 數據

2021-12-14 15:54:01

AI 數據人工智能

2024-11-20 14:10:00

搜索AI
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产h视频| 羞羞视频网站在线观看 | 国产不卡在线播放 | 91精品久久久久久久久中文字幕 | 狠狠躁18三区二区一区 | 一级毛片免费完整视频 | 国产婷婷 | 欧美日韩一 | julia中文字幕久久一区二区 | 伊人久久综合 | 欧美区日韩区 | 久久国产精品亚洲 | 日韩av在线免费 | 日本一区二区三区免费观看 | 一区二区三区四区av | 91在线电影 | 最新黄色在线观看 | 亚洲精品中文字幕 | 九九九视频在线观看 | 97色在线视频 | 欧美一级黑人aaaaaaa做受 | 黄色片a级| a国产视频| 国产精品mv在线观看 | 久久91av | 亚洲二区在线观看 | 亚洲成人网在线播放 | 日日摸天天添天天添破 | 伊人网综合在线观看 | 欧美无乱码久久久免费午夜一区 | 北条麻妃av一区二区三区 | 日本不卡高字幕在线2019 | 日韩电影一区 | 91精品久久 | 成人国产精品视频 | 日日摸日日碰夜夜爽2015电影 | 一区二区免费看 | 日韩欧美在线免费观看 | 91直接看 | 黄色一级大片在线免费看产 | 91福利网 |