成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

<rt id="u4o4u"><delect id="u4o4u"></delect></rt>

<li id="u4o4u"><source id="u4o4u"></source></li>

<rt id="u4o4u"><pre id="u4o4u"></pre></rt>

<bdo id="u4o4u"><source id="u4o4u"></source></bdo>

<code id="u4o4u"><tr id="u4o4u"></tr></code><cite id="u4o4u"><acronym id="u4o4u"></acronym></cite>

<li id="u4o4u"></li>

鴻蒙開發者社區

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發者社區

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發者社區訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業版APP

鴻蒙開發者社區視頻號

51CTO軟考題庫

AI.x社區

登錄/注冊
51CTO

中國優質的IT技術網站

51CTO博客

專業IT技術創作平臺

51CTO學堂

IT職業在線教育平臺

SealTool：Agent微調與評測的開源項目（14k樣本，4k工具），比ToolBench等更全面！

發布于 2024-5-17 14:12

瀏覽

0收藏

大型語言模型（LLMs）在多種任務中展現了強大的能力，研究者嘗試將其作為代理，通過使用外部工具或插件幫助用戶完成任務。為了提高LLMs的工具理解和使用能力，需要準備高質量的工具學習數據集。現有的工具學習數據集存在一些限制：例如工具數量有限、評估方法不精確或成本高昂。

提出了一種自指導（self-instruct）方法，通過LLMs生成工具和實例。該方法首先生成不同領域的工具，然后生成調用這些工具的實例，包括單工具實例和多工具實例。

數據集構建方法的流程圖

SealTool：Agent微調與評測的開源項目（14k樣本，4k工具），比ToolBench等更全面！-AI.x社區

工具模板：設計了工具模板，用于生成具有輸入參數和輸出響應的API樣式工具。

Seal-Tools工具模板以及以“getTemperature”工具為例：

SealTool：Agent微調與評測的開源項目（14k樣本，4k工具），比ToolBench等更全面！-AI.x社區

實例生成：生成實例包括用戶查詢和工具調用，通過多步驟生成并設置檢查點以減少錯誤。

一些生成的字段/子字段和工具的示例：

SealTool：Agent微調與評測的開源項目（14k樣本，4k工具），比ToolBench等更全面！-AI.x社區

單工具調用的實例模板

SealTool：Agent微調與評測的開源項目（14k樣本，4k工具），比ToolBench等更全面！-AI.x社區

多工具嵌套調用的實例模板

SealTool：Agent微調與評測的開源項目（14k樣本，4k工具），比ToolBench等更全面！-AI.x社區

設計了三個評估維度：輸出格式、工具選擇和工具參數填充，以進行詳細評估。

Seal-Tools與幾個工具學習數據集的比較。? 格式混亂。? 多步驟。

SealTool：Agent微調與評測的開源項目（14k樣本，4k工具），比ToolBench等更全面！-AI.x社區

對幾種流行的LLMs和微調模型在Seal-Tools上進行了評估，結果顯示基于Seal-Tools微調的模型顯示出很大的競爭力，但是當前的Agent系統在工具選擇和參數填充方面仍有改進空間，Seal-Tools可以作為推動LLMs工具學習研究的新基準。。

SealTool：Agent微調與評測的開源項目（14k樣本，4k工具），比ToolBench等更全面！-AI.x社區

SealTool：Agent微調與評測的開源項目（14k樣本，4k工具），比ToolBench等更全面！-AI.x社區

https://arxiv.org/abs/2405.08355
Seal-Tools: Self-Instruct Tool Learning Dataset for Agent Tuning and Detailed Benchmark
https://github.com/fairyshine/Seal-Tools

本文轉載自?? PaperAgent??，作者： PaperAgent

標簽

贊

收藏

回復

舉報

回復

相關推薦

開源版AI程序員來了：GPT-4加持，能力比肩Devin，一天1.4k Star

輕薄滴假象 ? 4041瀏覽 ? 0回復
輕松拿捏4K高清圖像理解！這個多模態大模型自動分析網頁海報內容，打工人簡直不要太方便

Crystalcxt ? 4554瀏覽 ? 0回復
融匯14個AI工具構建完美應用

51CTO內容精選 ? 3846瀏覽 ? 0回復
靠Scaling Laws煉出4D版視頻生成模型，多倫多大學北交大等攜手開源81K高質量數據集

Crystalcxt ? 2426瀏覽 ? 0回復
LazyLLM：低代碼構建多Agent大模型應用的開源項目

PaperAgent ? 3734瀏覽 ? 0回復
渲染速度比ENeRF快30倍！4K4D:實時4K分辨率4D視圖合成

angel ? 2872瀏覽 ? 0回復
快手可靈團隊最新開源項目火了：大叔實時變身少女，GitHub狂攬7.5K星

Crystalcxt ? 3052瀏覽 ? 0回復
清華大學最新深度時序模型綜述+5k star開源代碼！

海因斯DK ? 5142瀏覽 ? 0回復
NeedleBench 超長文本評測基準：大語言模型能否在 1000K 長度上檢索推理？

戀戀青鳥 ? 3029瀏覽 ? 0回復
如何全面評估多模態大模型能力？MLLM評測任務與指標總結

shizhi02 ? 7791瀏覽 ? 0回復
全面對比AI Agent 與 Agentic AI

AI應用探索 ? 3972瀏覽 ? 0回復
用強化學習重塑多模態AI：解讀Kimi k1.5的突破與創新

Halo咯咯 ? 2781瀏覽 ? 0回復
從低清到4K的魔法：FlashVideo突破高分辨率視頻生成計算瓶頸(港大&港中文&字節)

angel ? 2113瀏覽 ? 0回復
K-LoRA巧用Top-K策略，讓風格與主體完美融合

angel ? 2273瀏覽 ? 0回復
3.4K Star 港大開源AutoAgent登頂GAIA全球評測，成本直降50%碾壓商業巨頭

CourseAI ? 1441瀏覽 ? 0回復
Crawl4AI：GitHub榜首40K星標！LLM專屬極速開源爬蟲神器

穿越時空111 ? 2551瀏覽 ? 0回復
開源數字人克隆神器HeyGem：1秒視頻生成4K超高清AI形象，用AI重塑數字人創作生態！

AIGCStudio ? 1468瀏覽 ? 0回復
分享 Github 上收獲 4k stars 的 12 條原則

Baihai_IDP ? 649瀏覽 ? 0回復
探索 RAGFlow：開源 RAG 引擎的新力量，star高達55k+的開源項目

AI小新 ? 520瀏覽 ? 0回復

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

最近發布

Doc2X：為知識庫RAG接上高精度文檔解析的“智能引擎” 2天前發布
RAG-Anything：全面的一體化多模態文檔處理 RAG 系統 2天前發布

熱門推薦

AI Agents開源工具棧全解析~ 1回復

從原理到調參，小白也能讀懂的大模型微調LoRA，不懂線性代數也沒問題 0回復

Deepseek R1 0528實測：性能直逼頂尖，普通電腦本地運行全攻略 0回復

本命周！MiniMax M1有多猛？網友：僅用40k思考預算就干翻Gemini，實測：真·超DS！ 1回復

DeepSeek 新模型 R1-0528 悄悄開源，與o3 相當，實測來了 0回復

上一篇：阿里RAG新框架R4：增強檢索器-重排序-響應器，5個知識密集任務上都超過Self-RAG等！

下一篇： ERAGent：集成5個先進組件與技術的增強型RAG Agent，顯著提升3類問答任務效果

社區精華內容

目錄

主站蜘蛛池模板： 91日韩 | 日韩av福利在线观看 | 91精品国产日韩91久久久久久 | 国产欧美一区二区三区在线看 | 综合色站导航 | www97影院| av在线一区二区三区 | 伊人精品一区二区三区 | 神马久久久久久久久久 | 日韩日韩日韩日韩日韩日韩日韩 | 亚洲经典一区 | 婷婷久久精品一区二区 | 久久夜视频 | m豆传媒在线链接观看 | 毛色毛片免费看 | 欧美国产日韩一区二区三区 | 午夜精品一区二区三区免费视频 | 91免费在线看 | 91精品久久久久久久久 | 伊人免费视频二 | 国产精品成人一区二区三区 | 在线观看视频中文字幕 | 99久久99| 国产91在线播放精品91 | 精品国产18久久久久久二百 | 亚洲人成一区二区三区性色 | 亚洲人成人一区二区在线观看 | 91免费在线 | 91高清在线观看 | 久久亚洲精品国产精品紫薇 | 视频一区二区三区中文字幕 | 久久高清 | 久久lu| 亚洲国产一区在线 | 国产精品123区 | 日韩专区中文字幕 | 亚洲欧洲在线看 | 欧美日韩中文在线 | 亚洲国产成人精品女人久久久 | 亚洲综合大片69999 | 欧美日韩精选 |

<code id="k44qo"></code>

<rt id="k44qo"><delect id="k44qo"></delect></rt><li id="k44qo"></li>

<strike id="k44qo"><acronym id="k44qo"></acronym></strike>

<rt id="k44qo"></rt>