成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

基于大模型的群體智能解決方案

人工智能
目前最炙手可熱的大模型應(yīng)用應(yīng)該是 Agent,它是一個能夠自主完成目標(biāo)的智能體,具有規(guī)劃和執(zhí)行的能力。用車類比的話,大模型的推出相當(dāng)于汽車引擎的技術(shù)突破。而 Agent 就像一個整車,只有引擎是不夠的,還需要配骨架、座位、方向盤才能搭載人從一個地方駛向另外一個地方。

易慧智能成立時間不長,背后依托的是易車公司 20 多年來積累的客戶、數(shù)據(jù)以及行業(yè)經(jīng)驗(yàn)。公司圍繞智能體以及群體智能方向于今年初與清華大學(xué)自然語言處理實(shí)驗(yàn)室、面壁智能達(dá)成戰(zhàn)略合作,結(jié)合他們先進(jìn)的技術(shù)與易車的數(shù)據(jù)積累以及行業(yè) Know-How,推出了面向 ToB 端的基于大模型的汽車行業(yè)群體智能解決方案以及相應(yīng)的技術(shù)白皮書,白皮書中對于群體智能的整體方案有比較詳細(xì)的解讀。

一、群體智能解決方案概覽

1. LLM 與 Agent

圖片

群體智能,與其緊密相關(guān)的兩大模塊為:LLM(大模型)和 Agent(智能體)。如果說 2023 年是大模型技術(shù)元年,那 2024 年應(yīng)該是大模型應(yīng)用的元年。目前最炙手可熱的大模型應(yīng)用應(yīng)該是 Agent,它是一個能夠自主完成目標(biāo)的智能體,具有規(guī)劃和執(zhí)行的能力。用車類比的話,大模型的推出相當(dāng)于汽車引擎的技術(shù)突破。而 Agent 就像一個整車,只有引擎是不夠的,還需要配骨架、座位、方向盤才能搭載人從一個地方駛向另外一個地方。所以 Agent 是基于大模型之上包了個外殼,使它能夠做一些具體的事情。

2. AI 傳統(tǒng)工具 VS AI Agent

圖片

Agent 與傳統(tǒng)人工智能的差別是什么呢?其差別在于傳統(tǒng)工具是人定義好一個流程,比如要質(zhì)檢一通邀約客戶到店的對話,我們首先需要行業(yè)專家去定義質(zhì)檢流程及質(zhì)檢項(xiàng)。人工智能在這個過程中能在某個質(zhì)檢項(xiàng)的檢測中提升質(zhì)檢的準(zhǔn)確率,但整個流程和質(zhì)檢規(guī)則實(shí)際上還是人類主導(dǎo)。而 Agent 是不需要人去干預(yù),它自己做規(guī)劃,包括判斷通話流程是否專業(yè),中間有哪些不合規(guī)的地方。所以 Agent 相對 AI 傳統(tǒng)工具根本性的一個差別就是原來是以人為主導(dǎo),現(xiàn)在則是以大模型 AI 為主導(dǎo)。

3. 超級個體 VS 群體智慧

圖片

那是不是可以認(rèn)為有一個超級智能體就能解決所有問題?從人類社會、自然界角度來看,通過多個個體共同去完成一件事,往往能夠比超級個體達(dá)到更好的效果,中國有句老話:三個臭皮匠,頂個諸葛亮,就是這個意思。自然界的例子是蟻群效應(yīng):整個蟻群能夠根據(jù)環(huán)境變化快速進(jìn)行調(diào)整,并不是依賴于既有的分工和流程。例如,當(dāng)螞蟻在同時發(fā)現(xiàn)食物后,會分別走兩條路線回到巢穴,并釋放信息素,最終整個蟻群會選擇最近的路線去搬運(yùn)食物,這個就是群體智慧的體現(xiàn)

圖片

當(dāng)前學(xué)術(shù)界群體智能方向的進(jìn)展也非??欤热缬袀€ paper 設(shè)計(jì)了一個實(shí)驗(yàn),通過構(gòu)造 2 個 Agent,去解決同一個問題,其中一個 Agent 扮演負(fù)責(zé)人,另外一個 Agent 扮演咨詢師,他們通過多輪對話、啟發(fā)、討論的方式去把解決方案從 0 到 1 的打磨完善出來。這個最終的解決方案對比只用單一 Agent 生成的解決方案要更加專業(yè)。我們認(rèn)為這是“智能的第二次涌現(xiàn)”,即群體智能。智能的第一次涌現(xiàn)是大模型,現(xiàn)在是多個 Agent 去交互碰撞,產(chǎn)生第二次智能。

圖片

兩次智能涌現(xiàn)的本質(zhì)是什么呢?第一次智能涌現(xiàn)是神經(jīng)網(wǎng)絡(luò)的神經(jīng)元達(dá)到一定量級后產(chǎn)生了質(zhì)變,大模型技術(shù)其實(shí)已經(jīng)發(fā)展很多年了,包括最早 2018 年 Bert 本身也是大模型,之所以 GPT 帶來革命性的影響,是因?yàn)槠鋮?shù)超過了一定量級,突破了 100 億、1000 億,甚至到 1 萬億,量變產(chǎn)生質(zhì)變。第二次群體智能的涌現(xiàn)的本質(zhì)是,當(dāng)單體 Agent 足夠多,各行各業(yè)都有專業(yè)的 Agent,如果把這些 Agent 都聚集起來,協(xié)同合作的去完成某項(xiàng)任務(wù),這個過程中有可能會產(chǎn)生新的發(fā)現(xiàn)。我們預(yù)判接下來群體智能技術(shù)將會受到更多關(guān)注。

圖片

從實(shí)踐上看也是會經(jīng)歷這樣的過程,比如有一個具體任務(wù),寫行業(yè)報(bào)告,現(xiàn)在通過單智能體,可能需要準(zhǔn)備一個非常復(fù)雜的 prompt,里面需要涵蓋如何去寫摘要,框架、調(diào)研、總結(jié),每個篇章要去找數(shù)據(jù)支撐,然后完善篇章內(nèi)容,整理成報(bào)告。這樣一個任務(wù)用一個 Agent 是很難實(shí)現(xiàn)的。但是如果我們把任務(wù)進(jìn)行拆分,比如設(shè)計(jì) 4 個 Agent,第一個 Agent 專注去做需求分析;第二個 Agent 去找素材和論據(jù);第三個 Agent 把前面素材整理成報(bào)告;最后一個 Agent 審核校驗(yàn)。實(shí)際上現(xiàn)實(shí)中人們也是這么做的,用多個 Agent 實(shí)現(xiàn),每個 Agent 只需要把一項(xiàng)技能在 Prompt 中描述清楚,把單個 Agent 的能力做到極致。所以在真正落地的時候,我們自然就會向群體智能方向走。從理論和實(shí)踐上來看,群體智能一定是未來的一個發(fā)展方向。

4. 基于大模型的汽車行業(yè)群體智能業(yè)務(wù)架構(gòu)

圖片

如上圖所示是基于大模型的汽車行業(yè)群體智能整體的業(yè)務(wù)架構(gòu)。主要分為三層:

最底層是 YiCPM 汽車行業(yè)大模型,它不是某一個具體的模型,而是多個大模型的集合,包括語言模型、圖像模型、視頻模型、語音模型等,考慮到大模型發(fā)展日新月異,一方面我們會積極擁抱和嘗試技術(shù)領(lǐng)先的開源大模型,另一方面我們也會探索自研,自研還是往能交付的小參數(shù)模型方向走。因?yàn)閹资畠|、上百億參數(shù)的模型成本太高,企業(yè)不會買單,所以為了降低交付成本我們主要在小模型方向進(jìn)行探索。

中間層是整個解決方案的核心,智能體平臺。我們與清華大學(xué)自然語言處理實(shí)驗(yàn)室、面壁智能公司合作,依托于 XAgent 和 AgentVerse 兩個開源框架,構(gòu)建了我們自研的 YiAgents 群體智能框架。

再往上是依托于這個框架的上層應(yīng)用,主要是從營銷場景出發(fā)找到的五個落地場景。

上圖右側(cè)是生態(tài)矩陣,數(shù)據(jù)和行業(yè) know how 對于做大模型很關(guān)鍵,真正要解決行業(yè)具體的問題,需要行業(yè)的一些工具和能力,這是一個共創(chuàng)的過程。

二、Yi Agents 群體智能平臺

1. 構(gòu)建多智能體框架面臨的關(guān)鍵問題

圖片

要設(shè)計(jì)多智能體的框架,會面臨以下幾個比較關(guān)鍵的問題:

  • 要做群體智能,先得有單體的 Agent,再利用單體智能組合產(chǎn)生群體智能,對單智能體進(jìn)行設(shè)計(jì)和劃分,單體智能體劃分得越明確,群體智能方案越好做。
  • 有了多個單智能體之后,智能體們所在的環(huán)境也需要做定義,所有的智能體都在一個環(huán)境里面工作。
  • 最后是多個智能體之間如何交流,需要定義他們之間的交流鏈,是串行的或者并行的,要考慮不同應(yīng)用場景智能體間的通信方式。

2. 設(shè)計(jì)多智能體交互框架的四大關(guān)鍵要素

圖片

設(shè)計(jì)多智能體交互有四個關(guān)鍵要素:

  • 基礎(chǔ)設(shè)施:是否足夠通用。
  • 協(xié)作模式:需要支持多種協(xié)作模式,人類社會也是如此,比如有串行、并行,先串行再并行,兩個智能體之間是合作還是競爭等等。
  • 執(zhí)行能力:需要有能夠使用工具的能力。垂直領(lǐng)域的壁壘就在于其不是解決一個通用的問題,需要用行業(yè)特有的一些工具去實(shí)現(xiàn)。如果沒有工具,就要能夠創(chuàng)造工具。
  • 人類參與:系統(tǒng)是否允許人類在執(zhí)行過程中參與以及如何參與。

3. 技術(shù)框架

圖片

上圖所示是白皮書里偏流程的技術(shù)框架,包括五個具體的技術(shù)點(diǎn):

  • 首先做目標(biāo)和任務(wù)拆解,即任務(wù)分成幾步,每一步驟怎么做。
  • 拆解出的每一個任務(wù),誰去做,這里需要有單體智能,每一個智能體要足夠?qū)I(yè)能去完成這個任務(wù),這里涉及到智能體的技術(shù)。
  • 多個智能體協(xié)作:多個智能體之間要有交流鏈和 workflow,它們之間是怎么交流的。
  • context:即環(huán)境,多個智能體在一起需要共享和沉淀一些信息。
  • 對齊技術(shù):大模型的優(yōu)勢是很有創(chuàng)造性,但又可能容易產(chǎn)生幻覺,這是一對不可調(diào)和的矛盾,這兩者之間要有一個 trade off。

圖片

多智能體技術(shù)框架按上述五個點(diǎn)拆解來講。

(1)目標(biāo)驅(qū)動的任務(wù)管理

圖片

群體智能如何保證多個單智能體都能完成任務(wù)?利用通用的群體智能框架,它讓不同角色完成不同的任務(wù)。首先對任務(wù)進(jìn)行規(guī)劃,根據(jù)任務(wù)的 know-how 和經(jīng)驗(yàn)知識,拆解成一個工作流,分配好任務(wù)需要多少角色去完成,每個角色干什么。任務(wù)規(guī)劃完之后開始執(zhí)行,Agent 需要按照任務(wù)規(guī)劃的每一步驟去執(zhí)行。Agent 的輸入來自 prompt,因?yàn)榇竽P退械妮斎攵际?prompt, 為了讓其通用化,需要把大模型 prompt 的 template 實(shí)例化。所以當(dāng)需要執(zhí)行一個任務(wù)時,流程執(zhí)行到了哪個步驟,把該步驟的 prompt 實(shí)例化,然后去執(zhí)行即可。最后是任務(wù)總結(jié),目的是不斷地反思以做得更好,可以迭代一輪或者迭代多輪,依據(jù)實(shí)際應(yīng)用場景而定。

(2)LLM 驅(qū)動的智能體

圖片

群體智能的核心就是單體 Agent,而 Agent 的核心要素包括記憶、規(guī)劃、感知、執(zhí)行和使用工具的能力等。這些能力都是大語言模型提供的,上述架構(gòu)也是當(dāng)前 Agent 比較通用的技術(shù),未來隨著發(fā)展,會擴(kuò)展記憶,記憶越多,能容納的知識經(jīng)驗(yàn)就更多,但是大模型上下文空間始終是有限的,因此會更多考慮擴(kuò)展上下文長度,比如當(dāng)前的 Kimi,如果空間仍然不夠就會考慮壓縮。

圖片

我們的底層框架是 XAgent,XAgent 在基礎(chǔ) Agent 框架基礎(chǔ)上引入了自我反思的過程。類比人類也是如此,優(yōu)秀員工和普通員工的差別在于優(yōu)秀員工干完一件事自己就會總結(jié)反思。XAgent 框架在單體 Agent 的基礎(chǔ)上加了兩個循環(huán),即內(nèi)外循環(huán),內(nèi)循環(huán)是執(zhí)行+自我反思,即任務(wù)執(zhí)行完畢后自我反思這個結(jié)果是否滿意,是否還能再優(yōu)化。外循環(huán)是通過多輪反思實(shí)現(xiàn)整個迭代過程。

(3)多智能體協(xié)作

圖片

多智能體協(xié)作本質(zhì)是一個 workflow,從一個 Agent 到下一個 Agent 要解決的最關(guān)鍵的問題是 prompt 實(shí)例化,即要把 Prompt Template 里面的占位符具體化。目前業(yè)內(nèi)一般通過消息總線存儲信息,比如從任務(wù)下達(dá),任務(wù)拆解,到第一個 Agent 執(zhí)行完,第二個 Agent 執(zhí)行完、人類交互等所有這些信息都可以以 message 形式存在于消息總線里面,當(dāng)某個 Agent 準(zhǔn)備執(zhí)行時,它的上下文就是當(dāng)前消息總線里面的所有消息歷史,Agent 可以自己分析現(xiàn)在處于哪個環(huán)節(jié),累計(jì)產(chǎn)出了哪些中間成果,接下來干什么,所以協(xié)作的本質(zhì)就是通過消息總線傳遞信息。如果信息復(fù)雜的話可以再用一個單獨(dú)的 Agent 把信息進(jìn)行提煉總結(jié)抽取,把 Prompt Template 實(shí)例化,這樣每個 Agent 自然就能串起來。

(4)上下文交互

圖片

消息總線等同于上下文、全局變量、智能體執(zhí)行的環(huán)境,消息總線可以用 message 隊(duì)列簡單實(shí)現(xiàn)。智能體執(zhí)行過程中產(chǎn)生的所有信息都是 message,message 包含以下元素:

  • 發(fā)送者:可能是用戶發(fā)的,也可能是上一個 Agent 發(fā)的,還可能是系統(tǒng)發(fā)的。
  • 接收者:要定義好一個 workflow,得知道下游是誰,誰能接收該消息,誰可以忽視。
  • 消息類型:消息類型有很多,任務(wù)描述、Agent 輸出結(jié)果、系統(tǒng)的狀態(tài)等。
  • 消息內(nèi)容

(5)平衡自主性與一致性

圖片

大模型非常具有創(chuàng)造性,但問題是太讓其自主發(fā)揮會出現(xiàn)幻覺、前后表述不一致等現(xiàn)象,所以需要考慮自主性和一致性的折中,當(dāng)前階段它還是離不開人的干預(yù)和反饋,需要不斷的進(jìn)化,找到一個平衡點(diǎn)。

圖片

群體智能框架的技術(shù)實(shí)現(xiàn)如上圖所示:首先有一個 Planner 生成計(jì)劃,然后分配任務(wù)給 performer 或叫 executor,來對每個 Agent 進(jìn)行 Prompt Template 實(shí)例化,等所有 Agent 執(zhí)行完畢后,由 Reviewer 對整個任務(wù)執(zhí)行過程和結(jié)果進(jìn)行復(fù)盤總結(jié),依復(fù)盤情況可以執(zhí)行多輪。

三、群體智能技術(shù)在行業(yè)中的應(yīng)用

圖片

大模型為汽車行業(yè)帶來的價值包括:

  • 高效的流程管理
  • 定制化的營銷體驗(yàn)
  • 增強(qiáng)用戶服務(wù)感受
  • 市場分析與預(yù)測
  • 跨部?協(xié)作的促進(jìn)

圖片

以營銷場景為例,營銷首先是要獲客,獲客后要做線索清洗,一般業(yè)內(nèi)是根據(jù) DCC 電話進(jìn)行第一輪篩選,區(qū)分高意向、低意向客戶,針對高意向客戶直接邀約到店,低意向就開展后續(xù)的用戶運(yùn)營,比如通過加企業(yè)微信通過 IM 做一些轉(zhuǎn)化,轉(zhuǎn)換成高意向,再邀約到店,最后購車成交。

圖片

整個流程里衍生出來五個核心落地場景:

  • 數(shù)智研究院:整個造車流程有新車設(shè)計(jì)、研發(fā)生產(chǎn)、新車發(fā)售、口碑反饋,行業(yè)調(diào)研、戰(zhàn)略規(guī)劃等等需要數(shù)據(jù)決策的環(huán)節(jié),之前可能需要咨詢公司專業(yè)人士去做,現(xiàn)在可以把它拆成幾個 Agent 協(xié)作完成,比如業(yè)務(wù)分析、數(shù)據(jù)抓取、數(shù)據(jù)分析、報(bào)告整理和校對。
  • 輿情運(yùn)營:輿情運(yùn)營比如說對于公關(guān)部門,有時候需要危機(jī)公關(guān),我們可以幫助車企及時發(fā)現(xiàn)有風(fēng)險(xiǎn)的輿情能挽回很多損失。這部分需要監(jiān)控主流社交媒體上的輿情數(shù)據(jù),Agent 需要對評論做正向、負(fù)向、中性的判斷評估,找到熱點(diǎn)事件,評控引導(dǎo)輿論,并提醒廠商人員介入。
  • 新媒體運(yùn)營:主要用于生產(chǎn)營銷素材,比如當(dāng)前依賴人工生產(chǎn)短視頻和海報(bào),現(xiàn)在機(jī)器可以生成素材,生成后到社交媒體上投放,然后關(guān)注投放效果,查找數(shù)據(jù)并進(jìn)行效果分析。
  • 用戶運(yùn)營
  • 集約 DCC

圖片

以用戶運(yùn)營為例的話,主要有以下 Agent:用戶運(yùn)營專員、質(zhì)檢專員、標(biāo)注專員、建檔專員等。

圖片

如上圖中的案例,要邀約一個用戶到店,首先提供一些用戶信息,智能助手會給出一個工作流,這個任務(wù)需要 5 個步驟去完成。先給客戶評級,接著生成邀約的開口話術(shù),參照話術(shù)進(jìn)行客戶對話邀約。對話結(jié)束后進(jìn)行建檔,最后進(jìn)行質(zhì)檢。全部流程都是自動執(zhí)行的。

圖片

接下來按照流程逐一完成各個步驟。

圖片

整個任務(wù)完成之后,做復(fù)盤總結(jié),自我反思是否存在漏洞,哪些環(huán)節(jié)可以改進(jìn)。

(是否需要插入視頻演示)

四、汽車行業(yè)群體智能技術(shù)生態(tài)

圖片

汽車行業(yè)群體智能生態(tài)包括 4 個部分:

1. 行業(yè)解決方案伙伴

圖片

需要依賴一些行業(yè) know how,比如專業(yè)的調(diào)研報(bào)告、分析用戶群體等,需要基于行業(yè)方法論。當(dāng)前在某些具體場景,我們希望能夠得到行業(yè)伙伴們提供的一些行業(yè)經(jīng)驗(yàn),并將其放入知識庫。隨著 Agent 積累的經(jīng)驗(yàn)越來越多,其能力也會不斷提升。

2. 行業(yè)數(shù)據(jù)伙伴

圖片

大模型本身差異不大,而影響其效果的核心還是數(shù)據(jù)。易車更多偏 C 端的數(shù)據(jù),我們也希望獲得一些車企經(jīng)銷商對話的語料,以及機(jī)構(gòu)的行業(yè)咨詢報(bào)告等,有了這些數(shù)據(jù)才能訓(xùn)練模型。

3. 大模型伙伴

圖片

我們系統(tǒng)底層模型是一系列語言模型、多模態(tài)模型的集合,我們會持續(xù)接納業(yè)內(nèi)專業(yè)的大模型,因?yàn)椴煌P驮诓煌蝿?wù)上的效果是不一樣的,不可能用一個模型解決所有問題。

企業(yè)側(cè)模型選型,考慮到成本因素,未來還是將會向小參數(shù)量模型方向發(fā)展。

4. 行業(yè)工具伙伴

圖片

當(dāng)前業(yè)內(nèi)做 Agent 的企業(yè)很多,最終的壁壘有一部分會體現(xiàn)在行業(yè)工具上,比如營銷場景需要托管企微、生成海報(bào)等,很多公司在某些領(lǐng)域已經(jīng)深入,沒有必要所有工具都自行研發(fā),每一個環(huán)節(jié)應(yīng)該由更專業(yè)的人去完成,才能最終把事做成做好。所以希望整個生態(tài)能夠?qū)崿F(xiàn)開放共贏。

圖片

各個企業(yè)貢獻(xiàn)各自的力量,才能合作共贏,促進(jìn)整個生態(tài)的發(fā)展。

五、總結(jié)和展望

技術(shù)的飛速發(fā)展,幫助我們站在了一個全新的視角,眺望汽車行業(yè)即將踏入的遼闊天地。在智能化的浪潮下,我們預(yù)見一個更加智慧、高效能、用戶至上的汽車新時代正在加速到來。

未來大模型群體智能將幫助企業(yè)進(jìn)一步降本增效,并開啟用戶運(yùn)營新篇章,做到千人千面,進(jìn)一步提升客戶體驗(yàn)。在各大企業(yè)的創(chuàng)新與合作下,整個行業(yè)將共建智慧汽車新生態(tài)。

六、Q&A

Q1:技術(shù)框架關(guān)于任務(wù)的規(guī)劃,如何把一個大的任務(wù)拆解成一個個小的子任務(wù),如果拆分的力度過細(xì),調(diào)用鏈就可能會比較臃腫,如果拆的力度過粗,子任務(wù)完成的正確率就會降低。在這方面是否有一些方法論或?qū)嶋H經(jīng)驗(yàn)可以參考?

A1:這方面肯定是沒有標(biāo)準(zhǔn)答案的,對 Agent 的定義,包括我們現(xiàn)在拆解一些行業(yè)場景,一件事是由一個 Agent 做還是三個 Agent 做也是沒有標(biāo)準(zhǔn)答案的,需要通過實(shí)踐去檢驗(yàn)。從我的經(jīng)驗(yàn)來講:

  • 第一點(diǎn),planner 是非常重要的,對于某些任務(wù)來講,它要有一些行業(yè) know how 知識。比如一個行業(yè)報(bào)告,我們跟羅蘭貝格、IBM 合作,他們給我們寫出來一個命題到底該怎么拆、怎么做;
  • 第二點(diǎn),每個 Agent 的定義設(shè)計(jì),要描述得足夠清晰,每個 Agent 干什么,比如要用戶運(yùn)營,第一步,是一個評級專員,有了評級才有后面的針對不同的用戶,才有不同的策略,這些信息一定要放到 Agent description 里面,給到 planner。提示越多它執(zhí)行起來越簡單。
  • 第三點(diǎn),一次規(guī)劃可能達(dá)不到理想狀態(tài),要反復(fù)嘗試,經(jīng)過多輪調(diào)整,才能達(dá)到更好的效果。

以上是一些建議。

Q2:大模型 Agent 在輿情分析這塊具體參與了什么樣的工作,和傳統(tǒng)的NLP 技術(shù)相比,其優(yōu)勢在哪里?現(xiàn)在很多 NLP 分析工作都已經(jīng)被大語言模型替代掉。

A2:Agent 其實(shí)與大模型不在一個維度。原來 NLP 只是在解決某一個節(jié)點(diǎn),某一個工作發(fā)揮了作用,比如分析輿情,要有一個情緒識別模型判斷評論到底正向負(fù)向,是在研究其中一個事如何能做得更好?,F(xiàn)在,大模型的厲害之處在于原來干一件事要訓(xùn)練一個模型,現(xiàn)在一個大語言模型可以把所有事情都做了,大大提高了效率。而 Agent 的作用是什么呢?比如輿情這件事首先得去監(jiān)控全網(wǎng)的數(shù)據(jù),定期收集這些數(shù)據(jù),然后去分析,生成一些 action,比如簡單的回復(fù)等等,有一些 todo 拆解。Agent 就是對一件事進(jìn)行拆解,每一步完成不同的工作,從規(guī)劃到執(zhí)行自動化地完成整個任務(wù)。

Q3:多智能體架構(gòu)如何利用外界信息形成一套反饋和調(diào)節(jié)機(jī)制?因?yàn)榉此计鋵?shí)是內(nèi)部的

A3:反思還是需要借助消息總線,所有信息包括它自己生成的數(shù)據(jù)、外界給它的數(shù)據(jù)、人工的一些指令,都可以變成消息,然后放到消息池里,下一次 Agent 要具體的操作時,會有輸入 prompt,可以從 Prompt 定義很多 context,包括實(shí)時消息,上一次做完的結(jié)果等。比如質(zhì)檢,剛開始沒有任何知識,先質(zhì)檢了一輪后質(zhì)檢主管反饋有問題,就可以把這個信息反饋也加到 message history 里面,下一次質(zhì)檢就有上一次這個經(jīng)驗(yàn)。并沒有改變模型的參數(shù)而是把知識都沉淀到經(jīng)驗(yàn)庫里,這個經(jīng)驗(yàn)庫可以全部或者部分進(jìn)入到 Prompt 中,如果上下文空間足夠的話,全放進(jìn)去,如果不夠的話,可以通過抽取摘要進(jìn)行提煉再加入進(jìn)去。這就是反思的實(shí)現(xiàn)原理,沒有改變模型參數(shù),只是增加了上下文的經(jīng)驗(yàn)數(shù)據(jù)。

Q4:現(xiàn)在已經(jīng)把傳統(tǒng)的工作流 Agent,后續(xù)它肯定還存在一些問題,那多智能體的這樣一個系統(tǒng)迭代方向的衡量的標(biāo)準(zhǔn)怎么衡量的?

A4:多智能體處于一個比較前沿的階段,受限于知識,它目前還只能處理有限的一些任務(wù)。后面經(jīng)過自我學(xué)習(xí),不斷進(jìn)化沉淀經(jīng)驗(yàn),其對于任務(wù)的覆蓋能力會增強(qiáng)。所以整個數(shù)據(jù)飛輪反饋機(jī)制是至關(guān)重要的。另外,隨著一些周邊工具的積累,其能力邊界也將得到拓展。

Q5:關(guān)于反思,內(nèi)循環(huán)的那種反思可能更多的是將歷史的一些經(jīng)驗(yàn)數(shù)據(jù)帶到下一次的上下文里面,如果有過多的較為龐雜的歷史經(jīng)驗(yàn)的話,會不會影響到最終的產(chǎn)出結(jié)果?目前對于反思是如何去評判的?我們?nèi)祟惖囊恍┙?jīng)驗(yàn)可能并不可靠,那機(jī)器提示自己的一些經(jīng)驗(yàn),該如何保證其正確性呢?

A5:針對第一個問題,很多數(shù)據(jù)是質(zhì)量較差,而放到消息總線的經(jīng)驗(yàn)庫的應(yīng)該是比較高質(zhì)量的數(shù)據(jù),把經(jīng)驗(yàn)和知識提煉成一個高質(zhì)量的經(jīng)驗(yàn)庫。精煉一方面也得通過人工的標(biāo)注,比如離線的標(biāo)注,或者通過大模型的幫助進(jìn)行提煉,我們有一個數(shù)據(jù)標(biāo)注訓(xùn)練師的 Agent,就是在做這件事。它也需要人工進(jìn)行干預(yù)。

第二個問題,怎么評判反思的結(jié)果。設(shè)計(jì)這個產(chǎn)品的機(jī)制,在產(chǎn)品側(cè)可能要預(yù)埋一些東西,比如一個對話,判斷對話效果好不好,如果回答一個問題以后,后面客戶又追問了好幾次,那通常情況下首次回答的效果就是不夠好的。再比如質(zhì)檢,要評判質(zhì)檢效果的好壞,很重要的標(biāo)準(zhǔn)就是評判完了客服沒有異議。所以這其中涉及工程化的內(nèi)容,把人類反饋融合到整個系統(tǒng)里并標(biāo)記。除此之外,它不一定是自反思,也可以引入中介,比如再引入一個模型 GPT4,作為一個裁判,讓它來判斷。甚至可以引入多個裁判,最后投票選出來一個結(jié)果,我們一般做自反饋?zhàn)詈玫姆绞绞窃僖胨?partner,它干任何事有個 partner 去對應(yīng)找漏洞,然后觸發(fā)兩個人思辨,效果會比一個反思更好。

Q6:多個 Agent,每個Agent 里面有自己的 prompt,還有一些相關(guān)的設(shè)計(jì)。一是關(guān)于 prompt 內(nèi)容的結(jié)構(gòu),二是 prompt 的內(nèi)容,應(yīng)該是跟領(lǐng)域或者您現(xiàn)在嘗試的結(jié)構(gòu)或者體系是有關(guān)系的。這部分是不是做了很多的嘗試?

A6:Prompt 針對不同模型和不同的訓(xùn)練數(shù)據(jù)是不一樣的。但 prompt 也會有一定套路,比如首先給背景、目標(biāo)、聽眾,然后明確輸出結(jié)果等等。

Q7:在這種套路下,每次出來的結(jié)果差別大嗎?

A7:大模型運(yùn)行多次的結(jié)果肯定是不一樣的。當(dāng)然你可以調(diào)節(jié),讓它盡可能別發(fā)散,那就是一個發(fā)散創(chuàng)新和不發(fā)散之間度的平衡,但即使不一樣,也可以通過正則等抽出來一些核心關(guān)鍵點(diǎn)。

Q8:我們設(shè)計(jì)了多個 Agent 和不同的 prompt 結(jié)構(gòu),那是我們基于當(dāng)前的 LLM 的底座的能力去設(shè)計(jì)的,會不會隨著 LLM 技術(shù)的發(fā)展,我們在以前的 Agent 基礎(chǔ)上面做的內(nèi)容和生態(tài)就沒辦法繼續(xù)了?

A8:隨著各項(xiàng)技術(shù)的發(fā)展,原來代碼肯定是要調(diào)整的,這是必然的。

Q9:長期來說,我們當(dāng)前的工作是起個大早,是不是做了很多工作都是沒有意義的?

A9:行業(yè)最后會積累下來一些不變的東西,比如沉淀下來的數(shù)據(jù)、行業(yè)知識經(jīng)驗(yàn)庫,還有工具,當(dāng)你有了這些東西,有了知識和行業(yè) know how,有了數(shù)據(jù)和工具,那么未來模型改變,我們也能夠快速改造出一套新的系統(tǒng)。系統(tǒng)本身的價值遠(yuǎn)不如其背后的行業(yè)優(yōu)質(zhì)數(shù)據(jù)的價值更大。

責(zé)任編輯:姜華 來源: DataFunTalk
相關(guān)推薦

2010-02-04 11:57:32

ibmdw商務(wù)智能

2024-09-23 08:36:45

華為全聯(lián)接大會數(shù)據(jù)智能

2014-11-20 20:40:54

聯(lián)想公交能解決方案

2022-11-08 14:17:39

2023-07-21 09:57:06

2023-10-31 15:04:12

人工智能自然語言處理

2010-02-25 15:19:43

SAPSaaSBI

2023-10-31 16:20:12

2019-01-18 05:22:39

區(qū)塊鏈智能合約網(wǎng)絡(luò)安全

2024-01-02 10:46:13

2025-03-03 01:25:00

SpringAOP日志

2022-05-20 06:14:57

人工智能AI

2021-01-21 15:48:56

物聯(lián)網(wǎng)智慧城市5G

2023-08-02 11:30:13

自動化人工智能

2025-06-05 00:00:00

向量數(shù)據(jù)庫線程安全Redis

2023-08-02 15:12:20

人工智能交通運(yùn)輸

2025-04-24 11:09:13

2011-08-02 11:23:34

甲骨文稅收應(yīng)用商務(wù)智能
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 国产在线视频在线观看 | 精品久久香蕉国产线看观看亚洲 | 精品久久久久久国产 | 亚洲最大av网站 | 免费v片在线观看 | 精品在线免费观看视频 | 国产精品久久久久久久午夜片 | 国产一级一级国产 | а_天堂中文最新版地址 | 日韩精品在线观看一区二区 | 久久精品一二三影院 | 日韩视频在线免费观看 | av手机在线免费观看 | 久草新在线 | av网站在线看 | 超碰免费在 | 欧美亚洲一级 | wwwxx在线观看 | 国产精品免费一区二区三区 | 91精品国产91综合久久蜜臀 | 一本色道久久综合亚洲精品高清 | 成人免费在线观看视频 | 日韩欧美网 | heyzo在线| 2020亚洲天堂 | 国产二区在线播放 | 精品小视频 | 91久久久久 | 免费电影av | 久久99视频这里只有精品 | 国产精品99999 | 91婷婷韩国欧美一区二区 | www.国产精 | 欧美456| 日韩成人一区 | 国产精品一二区 | 亚洲欧美网 | 国产一区二区三区四区五区3d | 天天想天天干 | 色男人的天堂 | 999精品视频 |