成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

基于四大AI交互協(xié)議的AI測試平臺架構(gòu)

人工智能
AI領(lǐng)域目前也出現(xiàn)了類似的統(tǒng)一標準或者機制,來實現(xiàn)大模型、智能體等AI工具之間的協(xié)作通信。截至目前,AI交互協(xié)議共出現(xiàn)了三種代表性的范式,如下圖所示,分別是FC、MCP、A2A。

在IT互聯(lián)網(wǎng)技術(shù)領(lǐng)域,一個APP或系統(tǒng)背后的技術(shù)架構(gòu),有web層、server層、中間件、數(shù)據(jù)庫和底層的操作系統(tǒng),看起來很復(fù)雜。后來大家逐漸形成了較為統(tǒng)一的標準,即通過API接口將不同層級之間串聯(lián)起來,最終才能形成一個能提供完善服務(wù)的APP應(yīng)用。

AI領(lǐng)域目前也出現(xiàn)了類似的統(tǒng)一標準或者機制,來實現(xiàn)大模型、智能體等AI工具之間的協(xié)作通信。截至目前,AI交互協(xié)議共出現(xiàn)了三種代表性的范式,如下圖所示,分別是FC、MCP、A2A。這三大范式分別由不同公司或機構(gòu)在AI發(fā)展的不同階段推出,解決了不同的問題。

圖片圖片

上述三大AI交互協(xié)議中,F(xiàn)unction Calling負責實現(xiàn)技術(shù)細節(jié)的點,MCP負責模型之間通信,A2A負責多個Agent之間的協(xié)作,基于這三大交易協(xié)議,我們基本可以構(gòu)建一個完善的AI后端服務(wù)。

而AG-UI的出現(xiàn),在我看來正好彌補了AI交互的協(xié)議棧的最后一塊短板,可以讓我們更好地構(gòu)建AI應(yīng)用,推動AI在工作場景中落地。即AG-UI可以推動AI應(yīng)用“走向前臺”,讓AI從過去的后臺服務(wù)工具,升級為真正的生產(chǎn)力工具。

在半個月前聯(lián)合融管理社區(qū)的《踐行者》直播中,我曾分享過這樣一個觀點:基于Function Calling、MCP、A2A和AG-UI,我們可以推動服務(wù)于測試工作的全流程AI應(yīng)用。下面是我對這一觀點的闡述:

1、大模型的本質(zhì)是概率預(yù)測機器,本身不具備冪等性,在信息幻覺未被很好的解決之前,AI的落地應(yīng)用一定要極度收斂,找到具體的應(yīng)用場景。在場景選擇方面,盡可能貼近標準化場景,或者更易于標準化的場景。

我們?nèi)粘5臏y試工作基本都需要經(jīng)歷需求-編碼-測試-驗收-發(fā)布五大階段。其中:

  • 需求相對來說不可控,且很難標準化;
  • 編碼反而很容易標準化,且目前已經(jīng)有了很好的最佳實踐和編碼規(guī)范;
  • 測試和驗收階段對測試同學來說是最可控也最容易標準化的,無論是測試用例、測試數(shù)據(jù)還是自動化甚至性能測試腳本,都是確定性很強的場景。
  • 發(fā)布階段,包含發(fā)布后的線上驗收和日常巡檢,現(xiàn)在大多都是基于自動化執(zhí)行,這些都是較為容易可以規(guī)范和標準化的場景。

因此我們可以得到這樣一個明確的范圍,即:當前階段AI在研發(fā)測試領(lǐng)域落地,有如下幾個確定性較強的應(yīng)用場景:

  • 測試用例生成:特別是基于歷史迭代版本的主流程回歸測試用例diff;
  • 測試數(shù)據(jù)生成:因為業(yè)務(wù)最小粒度對應(yīng)的數(shù)據(jù),之間都有明確的映射關(guān)系(商品對應(yīng)的款色碼、sku、庫存);
  • 測試腳本生成:無論是自動化測試還是性能測試,都是基于具體的業(yè)務(wù)場景,有明確的預(yù)期目標和結(jié)果;
  • 線上巡檢監(jiān)控:線上主流程測試驗收、線上核心場景自動化巡檢、線上監(jiān)控、線上發(fā)布變更(表結(jié)構(gòu)變更-SQL),同樣具有明確的預(yù)期目標和結(jié)果;

2、基于上述確定性較強的幾個場景,我們可以借助四大AI交互協(xié)議來構(gòu)建全流程的測試平臺,思路如下:

  • Function Calling:實現(xiàn)具體功能,如根據(jù)業(yè)務(wù)和數(shù)據(jù)映射關(guān)系生成測試數(shù)據(jù);
  • MCP:負責模型和其他工具(Agent)之間的通信,比如底層模型采用Qwen3,測試數(shù)據(jù)生成模塊封裝成Agent;
  • A2A:負責實現(xiàn)多個Agent之間的通信,比如用例生成Agent、數(shù)據(jù)生成Agent、測試腳本生成Agent之間相互協(xié)作;
  • AG-UI:實現(xiàn)后臺服務(wù)(從大模型到Agent再到具體功能點)和前臺的交互,最終構(gòu)建為一個完善的AI全流程測試平臺;

3、基于上述第二部分的思路,我們可以實現(xiàn)這樣一個AI全流程測試平臺,具體的功能和工程結(jié)構(gòu)如下:

圖片 圖片

責任編輯:武曉燕 來源: 老張的求知思考世界
相關(guān)推薦

2022-08-19 14:14:13

人工智能人臉識別安全

2024-07-30 21:47:50

2022-09-19 23:14:10

人工智能機器學習數(shù)據(jù)分析

2018-01-14 23:22:36

戴爾

2019-02-15 10:04:49

2012-07-19 09:15:43

CloudStackEucalyptusvCloud Dire

2017-01-16 19:27:40

視覺人工智能AI

2024-07-08 09:31:02

2011-03-21 09:01:49

CSS框架

2015-07-17 09:50:16

Carthage優(yōu)劣比較

2017-03-08 10:00:03

人工智能醫(yī)療虛擬助理

2019-03-28 09:00:00

AI人工智能醫(yī)學影像

2010-01-29 09:17:05

瀏覽器性能測試

2015-06-02 09:54:12

云服務(wù)大數(shù)據(jù)平臺云平臺

2012-07-23 10:23:25

CloudStackOpenStack云平臺

2012-12-17 10:12:37

開源云平臺OpenStackCloudStack

2017-06-20 15:28:09

人工智能AI深度學習

2019-11-15 14:42:00

微服務(wù)架構(gòu)數(shù)據(jù)

2014-12-17 10:43:01

Hybrid App平臺開發(fā)
點贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 欧美一区二区另类 | 日本黄色免费大片 | 欧美亚洲视频在线观看 | 日本亚洲精品成人欧美一区 | 日本不卡在线视频 | 成人av片在线观看 | 免费观看av | 夜夜操天天干 | 性做久久久久久免费观看欧美 | 天天曰天天干 | 米奇成人网 | 久久精品99| 日韩在线一区二区 | 久久91视频| 亚洲最大的黄色网址 | 久久精品一区二区三区四区 | wwwsihu| 一区二区在线不卡 | 国产日韩欧美 | 日本精品在线观看 | 在线一级片| 一级h片 | 国产美女一区 | 日日爱视频 | 综合久久国产 | 日韩一区二区不卡 | 国产精品一区二区在线播放 | 国产精品久久久久久久久久久久 | 国产成人精品999在线观看 | 丝袜久久| 伦理二区 | 欧美黑人国产人伦爽爽爽 | 欧美国产日韩在线 | 亚洲91精品 | 国产区视频在线观看 | 一级毛片黄片 | 伊人狠狠 | 欧美男男videos| 日韩精品一区二 | 中文字幕在线看第二 | 午夜tv免费观看 |