成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

<kbd id="etcmu"></kbd>

<tfoot id="etcmu"><font id="etcmu"><big id="etcmu"></big></font></tfoot>

<tfoot id="etcmu"><source id="etcmu"><ol id="etcmu"></ol></source></tfoot><big id="etcmu"></big>

鴻蒙開發者社區

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發者社區

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發者社區訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業版APP

鴻蒙開發者社區視頻號

51CTO軟考題庫

AI.x社區

登錄/注冊
51CTO

中國優質的IT技術網站

51CTO博客

專業IT技術創作平臺

51CTO學堂

IT職業在線教育平臺

面試題：大模型的FunctionCalling如何訓練得到？

發布于 2025-5-8 06:32

瀏覽

0收藏

主要來說，Function Calling 的訓練主要涉及數據構造、模型架構適配、多階段微調等關鍵環節。

主要開源方案可以參考Llama3.1或者Qwen-Agent，基本上在Llama3的技術報告（ https://arxiv.org/pdf/2407.21783）中就可以知道FunctionCalling的實現路徑。

以下是Llama3的技術報告里面如何用二階段訓練來提升Function Calling的準確性。

面試題：大模型的FunctionCalling如何訓練得到？-AI.x社區

一、數據預處理

Llama3設計了一套多階段數據篩選策略，通過質量評估與內容優化提升訓練數據價值：

1. 主題分級體系

構建基于Llama 3 8B的層級分類系統，首先將數據劃分為"數學推理"等宏觀類別；
在頂層分類下建立細粒度子類別（如"幾何與三角學"），形成樹狀知識結構。

2. 多維質量評估

混合評估模型：結合獎勵模型(RM)與Llama質量判別器

通用文本：準確性、指令合規性、表達規范（三級評分）

編程數據：錯誤識別度、需求匹配度（二級評分）

RM篩選：保留評分前25%的高質量樣本
智能質量檢測：通過Llama 3進行多維度評估
采用聯合篩選機制，保留至少一個評估體系認證的高質量樣本

3. 難度量化建模

復雜性雙因素評估：

意圖密度分析(Instag)：通過Llama 3 70B標記對話意圖數量

難度分級系統：基于三階難度評分框架（簡易/中等/復雜）

生成綜合難度指標：意圖數量 × 人工難度分級

4. 語義優化處理

特征聚類：采用RoBERTa構建對話語義向量空間
分級去重策略：

按質量×難度綜合得分降序排列

動態相似度閾值過濾（余弦相似度<0.85）

貪婪選擇算法保留最具代表性的樣本

該方案通過質量-難度聯合建模與語義空間優化，在保證數據多樣性的前提下，顯著提升訓練數據的有效信息密度。

實證研究表明，該方法可使模型在復雜推理任務上的準確率提升17%，同時減少28%的訓練收斂時間。

二、訓練流程

構建數據集

主要是將函數名、參數類型、功能說明等以結構化文本輸入模型（如JSON格式）。

[
  {"role": "user", "content": "查詢北京明天天氣"},
  {"role": "assistant", "tool_calls": [{"name": "get_weather", "arguments": {"location": "北京"}}]},
  {"role": "tool", "name": "get_weather", "content": "{\"temperature\": 22}"},
  {"role": "assistant", "content": "北京明天氣溫22℃"}
]

其中，tool這一層就是給大模型當做參數判斷邏輯輸入，模擬調度??獲取天氣接口??后返回最終結果。

二階段訓練

預訓練階段：模型在通用語料庫上進行基礎語言建模訓練，未涉及工具調用能力；
后訓練微調（Post-Training）：

合成數據生成：通過預訓練模型生成包含函數調用的對話數據，例如模擬用戶提問和對應的工具調用參數；

人工標注迭代：標注員逐步標注復雜場景，例如從單輪工具調用過渡到多輪交互，并加入異常參數處理樣本（如無效參數、多工具選擇等）。

三、訓練方法

監督微調（SFT）

使用標注數據對模型進行指令微調，強化其對工具調用的格式理解和參數生成能力。（示例：模型輸入包含工具定義的Prompt，輸出需嚴格匹配函數名及參數格式。）

強化學習（RLHF/DPO）

對工具調用的準確性和結果整合能力進行偏好排序，例如標注員對模型的工具調用決策打分，優化模型生成質量。

多任務學習

同時訓練模型完成常規對話和工具調用任務，避免單一任務過擬合。在報告中，Llama發現 PPO 沒有 DPO 好，所以只用了 DPO，在preference data 中，有5.89%是和reasoning以及tool相關的。面試題：大模型的FunctionCalling如何訓練得到？-AI.x社區

本文轉載自???沐白AI筆記???，作者：楊沐白

標簽

FunctionCalling

贊

收藏

回復

舉報

回復

相關推薦

七個很酷的GenAI & LLM技術性面試問題

51CTO內容精選 ? 3178瀏覽 ? 0回復
如何靠AI變身“六邊形戰士”｜得到快刀青衣&中國AIGC產業峰會

Crystalcxt ? 4406瀏覽 ? 0回復
大模型應用落地：如何選擇合適的 Embedding 模型？

玄姐聊AGI ? 5055瀏覽 ? 0回復
大模型所謂的參數是什么？大模型為什么需要訓練？大模型訓練到底干了什么？

AI探索時代 ? 6899瀏覽 ? 0回復
大模型訓練完成之后可以直接使用嗎？該怎么使用訓練好的大模型？

AI探索時代 ? 5110瀏覽 ? 0回復
汽車長翅膀：GPU 是如何加速深度學習模型的訓練和推理過程的？

Baihai_IDP ? 3062瀏覽 ? 0回復
如何優化PyTorch以加快模型訓練速度？

51CTO內容精選 ? 2998瀏覽 ? 0回復
大模型的核心之一——大模型預訓練之數據預處理

AI探索時代 ? 5075瀏覽 ? 0回復
GPU和CPU如何混合訓練？大模型訓練的GPU聯手CPU顯存優化分析方法

angel ? 4764瀏覽 ? 0回復
大模型訓練集群的存儲設計

夜行神魚 ? 3280瀏覽 ? 0回復
關于大模型微調與訓練的問題，大模型訓練的難點在哪里？

AI探索時代 ? 2608瀏覽 ? 0回復
大模型訓練的本質是什么？以及大模型訓練的核心要點

AI探索時代 ? 2788瀏覽 ? 0回復
大模型面試實戰！Prompt調優

ermulong ? 3014瀏覽 ? 0回復
云計算與大模型訓練的結合

AI探索時代 ? 2176瀏覽 ? 0回復
阿里面試驚現難題：大模型服務吞吐率太小咋整？

丁師兄大模型 ? 2085瀏覽 ? 0回復
大模型訓練之訓練數據準備，即怎么準備高質量的訓練數據集？

AI探索時代 ? 3757瀏覽 ? 0回復
DeepSeek 爆了，普通人如何3小時完全從0訓練自己的大模型

玄姐聊AGI ? 7167瀏覽 ? 0回復
強化學習與大模型后訓練：DeepSeek R1 如何獲得推理能力？

lintoms ? 4798瀏覽 ? 0回復
4000+實驗揭秘：如何在512個GPU上訓練大語言模型？

sbf_2000 ? 2158瀏覽 ? 0回復

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

最近發布

一文講透深入理解邏輯回歸 2025-06-17 06:35:55發布
如何有效降低機器學習模型過擬合？ 2025-06-04 07:02:18發布

熱門推薦

AI Agents開源工具棧全解析~ 1回復

從原理到調參，小白也能讀懂的大模型微調LoRA，不懂線性代數也沒問題 0回復

Deepseek R1 0528實測：性能直逼頂尖，普通電腦本地運行全攻略 0回復

本命周！MiniMax M1有多猛？網友：僅用40k思考預算就干翻Gemini，實測：真·超DS！ 1回復

DeepSeek 新模型 R1-0528 悄悄開源，與o3 相當，實測來了 0回復

上一篇： ControlNet作者：視頻生成論文Frameback，超低顯存生成高質量視頻，ComfyUI必備組件！

下一篇： AdaptiVocab：使用輕量級框架自適應降低LLM Token數！

社區精華內容

目錄

主站蜘蛛池模板：日本精品视频 | 亚洲一区视频在线 | 成人精品久久日伦片大全免费 | 在线观看视频一区二区三区 | 国产精品欧美一区二区 | 日韩中文字幕一区 | 91久久久久久久 | 国产精品久久久久久妇女 | 少妇精品亚洲一区二区成人 | 伊人网影院 | 国产成人91视频 | 国产精品久久久久久久久久久久久 | 一级a性色生活片久久毛片午夜精品在线观看 | 亚洲视频免费观看 | 亚洲第一在线 | 久久国产精彩视频 | 一区二区三区四区不卡视频 | 草久视频| 欧美国产日韩在线观看成人 | 奇米影视在线 | 国产精品区二区三区日本 | 超碰免费在线 | а天堂中文最新一区二区三区 | 欧洲精品码一区二区三区免费看 | 国产精品亚洲一区二区三区在线 | 色视频网站免费 | 中文二区 | 免费一区| 亚洲日本一区二区三区四区 | 精品一区二区久久久久久久网站 | av中文字幕网站 | 国产精品免费一区二区三区四区 | 中文字幕福利视频 | 午夜男人的天堂 | 在线一区| 欧美日韩国产一区 | 亚洲精品一 | 国精日本亚洲欧州国产中文久久 | 国产精品美女久久久久久不卡 | 日本成人中文字幕 | 成人欧美一区二区三区在线播放 |

<table id="mllce"></table>

<kbd id="mllce"><th id="mllce"></th></kbd>

<style id="mllce"></style>

<tfoot id="mllce"></tfoot>