成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

關(guān)于大模型智能體意圖識(shí)別不準(zhǔn)確問(wèn)題——function call的缺陷 原創(chuàng)

發(fā)布于 2025-4-2 07:39
瀏覽
0收藏

“ 意圖識(shí)別不準(zhǔn)確只是智能體應(yīng)用過(guò)程中的一個(gè)問(wèn)題,在實(shí)際操作中還會(huì)有其它更多的問(wèn)題存在;因此,我們不能太信任技術(shù)本身,而是需要完善的解決方案去規(guī)避技術(shù)風(fēng)險(xiǎn)。”

最近在研究大模型智能體也就是Agent的過(guò)程中,遇到了一個(gè)很嚴(yán)重的問(wèn)題,直接影響到Agent的質(zhì)量和效果;那就是意圖識(shí)別不準(zhǔn)確,也可以說(shuō)是Agent的幻覺(jué)問(wèn)題。

其產(chǎn)生的原因就在于大模型有時(shí)無(wú)法準(zhǔn)確識(shí)別出用戶意圖,無(wú)法準(zhǔn)確調(diào)用相應(yīng)的函數(shù)。

意圖識(shí)別不準(zhǔn)確

現(xiàn)在大模型技術(shù)在應(yīng)用方面,主要有兩大方向;其一就是大模型的創(chuàng)作能力,簡(jiǎn)單來(lái)說(shuō)就是內(nèi)容生成方面,如生成圖片,文字,視頻,也包括RAG等。另一方向就是智能體,其目的是使大模型能夠像人類一樣,通過(guò)思考加使用外部工具的方式,能夠自動(dòng)化處理一些問(wèn)題。

比如說(shuō),讓大模型遇到不懂的問(wèn)題,可以自己上網(wǎng)搜索;需要使用一些第三方工具,比如說(shuō)調(diào)用高德的地圖接口或者調(diào)用美團(tuán)的下單接口去自主規(guī)劃旅行路線并訂購(gòu)門票,酒店等。

這就是大模型的主要應(yīng)用方向——智能體。

關(guān)于大模型智能體意圖識(shí)別不準(zhǔn)確問(wèn)題——function call的缺陷-AI.x社區(qū)


以上是關(guān)于大模型智能體的功能介紹,下面我們從技術(shù)實(shí)現(xiàn)的角度來(lái)研究智能體。

從技術(shù)的角度來(lái)說(shuō),實(shí)現(xiàn)智能體首先大模型需要具備“思考”的能力,也就是能夠自主規(guī)劃和拆解目標(biāo),把需求變成可行性的步驟;而這就是思維鏈技術(shù)。

而要想實(shí)現(xiàn)智能體不僅僅需要大模型具備“思考”的能力,同時(shí)還需要大模型能夠使用外部工具,簡(jiǎn)單來(lái)說(shuō)就是第三方接口。而這個(gè)在技術(shù)上怎么實(shí)現(xiàn)呢?

關(guān)于大模型調(diào)用外部工具接口的技術(shù),就叫做function call 也就是函數(shù)調(diào)用;是通過(guò)給大模型提供一個(gè)函數(shù)列表,這個(gè)函數(shù)列表中描述了每個(gè)函數(shù)的功能,參數(shù)等;比如需要看地圖就調(diào)用地圖接口,需要看天氣就調(diào)用天氣接口等等。

關(guān)于大模型智能體意圖識(shí)別不準(zhǔn)確問(wèn)題——function call的缺陷-AI.x社區(qū)

雖然說(shuō)函數(shù)調(diào)用從技術(shù)上來(lái)看挺簡(jiǎn)單,但等到真正操作起來(lái)卻是很復(fù)雜的一件事;比如說(shuō)作者目前就遇到了一個(gè)很嚴(yán)重的問(wèn)題,就是意圖識(shí)別不明確問(wèn)題。

簡(jiǎn)單來(lái)說(shuō),你想實(shí)現(xiàn)一個(gè)Agent智能體,然后根據(jù)功能定義了一堆函數(shù)列表;然后告訴大模型根據(jù)用戶輸入的問(wèn)題,去自主判斷調(diào)用那個(gè)函數(shù)。

也就是說(shuō),你要查天氣就去調(diào)用天氣接口,你要查地址就去調(diào)用地圖接口;而不是在查天氣的時(shí)候調(diào)用地址接口或者在查地址的時(shí)候調(diào)用天氣接口,這就是意圖識(shí)別。

如果說(shuō)你的智能體涉及的功能比較少,需要調(diào)用的接口也比較少;可能還不會(huì)出現(xiàn)這個(gè)問(wèn)題,但如果當(dāng)你智能體的功能比較復(fù)雜時(shí),需要調(diào)用多個(gè)不同的接口;這時(shí)大模型可能就會(huì)偶爾抽風(fēng),出現(xiàn)不知道或者調(diào)用錯(cuò)誤的接口。

當(dāng)然,這種現(xiàn)象并不僅僅只是大模型的問(wèn)題,我們?nèi)祟愅瑯右灿锌赡艹霈F(xiàn)這種問(wèn)題。

舉例來(lái)說(shuō),有一輛三輪車和一輛小貨車,然后我說(shuō)要拉東西你去把車開(kāi)過(guò)來(lái)一下;這時(shí)你應(yīng)該開(kāi)三輪車還是小貨車?

作為一個(gè)需求來(lái)說(shuō),如果東西比較多,可能三輪車就無(wú)法滿足你的需求;而如果東西比較少,三輪車和貨車都可以滿足你的需求;當(dāng)然,在實(shí)際操作的過(guò)程中,還需要考慮東西的體積,質(zhì)量,路程等等。

但對(duì)大模型來(lái)說(shuō),三輪車和小貨車都是拉貨的,這時(shí)它可能就會(huì)識(shí)別出錯(cuò),在應(yīng)該使用小貨車的時(shí)候,它開(kāi)了一輛三輪車過(guò)來(lái)。

關(guān)于大模型智能體意圖識(shí)別不準(zhǔn)確問(wèn)題——function call的缺陷-AI.x社區(qū)

而這就是智能體函數(shù)調(diào)用中可能會(huì)經(jīng)常出現(xiàn)的問(wèn)題;但應(yīng)該怎么解決這個(gè)問(wèn)題呢?

說(shuō)實(shí)話這種問(wèn)題目前還沒(méi)有一個(gè)完美的解決方案,即使放到我們?nèi)祟惿砩吓紶栆矔?huì)因?yàn)闇贤ɑ蚶斫獾膯?wèn)題導(dǎo)致出錯(cuò),在大模型上這種錯(cuò)誤概率更是會(huì)被無(wú)限放大。

而我們只能盡可能的去避免這種問(wèn)題的出現(xiàn),而具體的解決辦法大概有以下幾種:

使用準(zhǔn)確清晰的描述

那個(gè)函數(shù)到底的干啥的,有什么具體的功能,最好使用最細(xì)致的描述,使歧義盡可能的降低

使用多輪對(duì)話

通過(guò)多次交流,使得能夠更準(zhǔn)確的理解需求;而這也是我們平常溝通過(guò)程中經(jīng)常用的的方法。

使用分類模型

說(shuō)白了意圖識(shí)別問(wèn)題,本質(zhì)上就是一個(gè)分類問(wèn)題;你的描述越模糊分類越困難,因此可以使用專業(yè)的分類模型,來(lái)讓大模型確定自己的需求。

使用規(guī)則引擎

幫助大模型設(shè)計(jì)一套規(guī)則引擎,簡(jiǎn)單來(lái)說(shuō)就是當(dāng)大模型出現(xiàn)模糊判斷的時(shí)候,應(yīng)該怎么進(jìn)行兜底;比如說(shuō)增加人工判斷或者重新選擇的機(jī)會(huì)等。或者使用某種規(guī)則,不管意圖什么樣,只要滿足規(guī)則需求就去執(zhí)行。

總之,大模型智能體在具體實(shí)踐和技術(shù)研究中存在較大的事實(shí)差距;我們?cè)谑褂玫倪^(guò)程中需要根據(jù)具體的場(chǎng)景和問(wèn)題,去優(yōu)化和完善我們的解決方案;而不是全部依賴于技術(shù)本身。


本文轉(zhuǎn)載自公眾號(hào)AI探索時(shí)代 作者:DFires

原文鏈接:??https://mp.weixin.qq.com/s/cQERjD02YPEZKiocsSaqAQ??

?著作權(quán)歸作者所有,如需轉(zhuǎn)載,請(qǐng)注明出處,否則將追究法律責(zé)任
已于2025-4-2 07:39:06修改
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦
主站蜘蛛池模板: 蜜臀久久99精品久久久久久宅男 | 国产高清免费 | 欧美一区二区三区免费电影 | 欧美日韩国产高清 | 一级黄色夫妻生活 | 伊人狠狠干 | 久久av一区二区三区 | 久久88 | 成人网址在线观看 | 久久亚洲国产精品 | 黄色三级免费 | 日韩高清三区 | 夜夜干夜夜操 | 女同av亚洲女人天堂 | av中文字幕在线播放 | 久久精品成人一区 | 91婷婷韩国欧美一区二区 | 欧美日韩在线观看一区 | 操人网| 国产一区二区三区 | 国产精品一区二区三区在线 | 在线中文字幕视频 | 国产精品精品久久久 | 国产欧美精品区一区二区三区 | 亚洲女人天堂成人av在线 | 91在线视频免费观看 | 最新中文字幕在线 | 久久国产区 | 亚洲精品免费在线观看 | 三级视频在线观看 | 天天色影视综合 | 91精品国产91久久久久青草 | 中文字幕国产日韩 | 欧美精品综合在线 | 亚洲欧洲精品一区 | 国产乱码精品一区二区三区av | 国产一区在线免费 | 一级片免费观看 | 香蕉久久久久久 | 91精品国产综合久久久久久蜜臀 | 青青草网 |