成本兩元開發(fā)游戲,最快3分鐘完成!全程都是AI智能體“打工”,大模型加持的那種
家人們,OpenAI前腳剛發(fā)布自定義GPT,讓人人都能搞開發(fā);后腳國(guó)內(nèi)一家大模型初創(chuàng)公司也搞了個(gè)產(chǎn)品,堪稱重新定義開發(fā)——讓AI智能體們協(xié)作起來!
只需一句話,最快3分鐘不到,成本也只要2元多,“啪~”,一個(gè)軟件就開發(fā)完了。
例如開發(fā)一個(gè)紅包雨的小軟件,現(xiàn)在只需要說一句就好了:
“紅包雨”是一個(gè)點(diǎn)擊小游戲,紅包的外觀是紅色高瘦的圓角矩形,紅包緩慢地從上方掉落,每個(gè)紅包間距相等 ,沒有重疊,鼠標(biāo)點(diǎn)擊任意一個(gè)紅包,紅包便隨著互動(dòng)點(diǎn)擊而消失,同時(shí)顯示一個(gè)吉利的數(shù)字,表示搶到這個(gè)紅包得到了多少錢。
更重要的一點(diǎn)是,在開發(fā)的整個(gè)流程中,從產(chǎn)品經(jīng)理到程序員,再到設(shè)計(jì)和測(cè)試等等,統(tǒng)統(tǒng)都是AI智能體!
沒錯(cuò),全程你只需要提需求,剩下的智能體們會(huì)自己討論、交流,甚至還伴隨著battle,最終確定方案并執(zhí)行。
要知道,常規(guī)軟件的開發(fā)周期是在2-3周,且成本在10000-50000美元之間(包括人力);如此對(duì)比起來,可真的是大寫的“降本增效”!
這款神器便是ChatDev,是由面壁智能最新推出的SaaS級(jí)智能軟件開發(fā)平臺(tái)。
其實(shí)早在兩個(gè)月前,“ChatDev智能體協(xié)作開發(fā)框架”就已經(jīng)在GitHub上開源,并多次霸榜Trending排行,目前已經(jīng)攬獲近17000顆star。
而此次面壁智能之所以推出產(chǎn)品版,就是為了把這種“一句話搞開發(fā)”的門檻再次“打下去”。
現(xiàn)在有了它,搞開發(fā)可以說拼得不再是技術(shù)了,拼得更多的反倒成了創(chuàng)意。
宛如身邊有一只哆啦A夢(mèng),只要你敢想,它就敢給你“造”出來。
那么產(chǎn)品版ChatDev正在帶來什么樣的改變?又是如何做到的?
產(chǎn)品開發(fā)變了:可以把更多創(chuàng)意塞進(jìn)去
在產(chǎn)品版ChatDev加持之下,開發(fā)的迭代,也變成了有想法就行的事。
例如你想把“紅包”替換成你想要的元素,同樣也是只需要一句話的那種。
然后AI智能體們就又開始了新一輪工作流程,這次,我們來具體看看它們之間到底是怎么展開工作的。
我們還是先以剛才紅包雨的demo為例。
首先,就像剛才提到的,我們需要做的就只有填寫好“項(xiàng)目名稱”和“Prompt”。
而且即便Prompt寫得不好,在ChatDev旁邊也有一個(gè)“一鍵潤(rùn)色”的功能,自動(dòng)幫你把需求補(bǔ)充完整。
然后我們就能看到AI智能體們就開始“搓搓小手”準(zhǔn)備干活兒了。
CTO先發(fā)話,大概意思就是:
來活兒嘍!客戶要搞個(gè)“紅包雨”~
緊接著
CTO詳細(xì)地拆解了這個(gè)需求,把項(xiàng)目要做的每一步都羅列了出來:
任務(wù)下達(dá)之后,就輪到程序員發(fā)力了。
只見他不費(fèi)吹灰之力,立即給出了一段Python代碼:
代碼完成之后,還有會(huì)有一位AI Counselor,會(huì)對(duì)整個(gè)項(xiàng)目做個(gè)總結(jié),并將邏輯、結(jié)果等等一并奉上:
整個(gè)對(duì)話過程可謂是非常絲滑,我們就像一位尊貴的客戶,靜靜地看著這些“AI員工”有條不紊地推進(jìn)著項(xiàng)目。
不得不感慨,現(xiàn)在搞開發(fā),真的成了有想法就行的事兒了。
例如網(wǎng)絡(luò)爬蟲、數(shù)據(jù)庫讀寫、文件批處理、網(wǎng)頁設(shè)計(jì)這樣的編程助手;像五子棋、貪吃蛇這樣的休閑小游戲;再如數(shù)字時(shí)鐘、計(jì)算器、繪畫板、圖片編輯器這樣的效率管理和創(chuàng)作輔助工具。
統(tǒng)統(tǒng)都能hold得住~
怎么做到的?
從早期披露的消息和論文中可以看到,最初的ChatDev,是團(tuán)隊(duì)設(shè)計(jì)了一套由群體智能串聯(lián)起的ChatChain(交流鏈)。
可視為由原子任務(wù)組成的“軟件生產(chǎn)線”,通過專業(yè)角色的智能體進(jìn)行對(duì)話式信息交互和決策,驅(qū)動(dòng)其進(jìn)行自動(dòng)化全流程軟件工程。
然而,應(yīng)用的創(chuàng)新離不開基礎(chǔ)模型能力的提升,隨著面壁智能推出SaaS版ChatDev,我們發(fā)現(xiàn)其自研的基座模型也有了新的版本——
面壁智能自研的新一代千億參數(shù)大模型——CPM-Cricket(CPM全稱為Chinese Pretrained Model) 。
據(jù)了解,CPM-Cricket是面壁智能的第三代模型,前兩代分別為CPM-Ant、CPM-Bee。
(有意思的一點(diǎn)是,每一代模型的名字是按照英文字母的順序?yàn)槭鬃帜福⑷∫粋€(gè)昆蟲的英文單詞來命名。)
至于CPM-Cricket的能力幾何,一言蔽之,是在邏輯、代碼、知識(shí)、指令理解等方面有了大幅提升,且全面超越Llama 2的那種。
在經(jīng)典的LLM評(píng)測(cè)集(HumanEval、C-Eval、MMLU、MBPP、CMMLU、BBH等)中,CPM-Cricket表現(xiàn)如下:
或許這樣的一組數(shù)據(jù)并沒法帶來非常直觀的感受。
那么同樣是基于CPM-Cricket的類ChatGPT產(chǎn)品——Luca 3.0,把它“丟”進(jìn)公考場(chǎng)景之后的表現(xiàn),便可以讓CPM-Cricket的能力變得更一目了然了。
題目是這樣的:
選取2022-2023年的公考試題,包括常識(shí)判斷、數(shù)量關(guān)系、資料分析、判斷推理、語言理解與表達(dá)等多種題型的425道試題。
例如面對(duì)下面這道單選題,Luca 3.0不僅可以秒速作答,還能將每一步的解題步驟詳盡地列出來:
即使是面對(duì)話術(shù)彎彎繞繞、真人看了都需要反應(yīng)一會(huì)兒的邏輯題目,Luca 3.0的回答也是游刃有余:
可以說,Luca 3.0在這套題上的表現(xiàn)是做到了“快”和“準(zhǔn)”。
而與之同臺(tái)競(jìng)技的選手,面壁智能所選取的也是業(yè)界相對(duì)標(biāo)桿的大模型,GPT-4。
不難看出,在重要的常識(shí)判斷和判斷推理兩項(xiàng)能力中,Luca 3.0相比GPT-4已經(jīng)能夠保持相對(duì)的優(yōu)勢(shì)了。
不僅如此,在英文測(cè)試環(huán)境中,Luca 3.0在GMAT官方模擬考試題中的表現(xiàn),同樣也是GPT-4整體相當(dāng)(其中閱讀達(dá)到GPT-4的97%水位)。
而Luca 3.0之所以能夠取得這般成績(jī),除了背后CPM大模型升級(jí)這個(gè)因素之外,面壁智能在微調(diào)方面也做了相應(yīng)的策略:
一是課程學(xué)習(xí)(Curriculum learning,CL)的訓(xùn)練策略,模仿人類的由易到難的學(xué)習(xí)過程,先在預(yù)訓(xùn)練中讓模型學(xué)習(xí)底層推理規(guī)律,然后在對(duì)齊階段學(xué)習(xí)人類的逐步推理思維。
二是思維鏈(Chain-of-thought,CoT)策略,對(duì)推理過程分解,讓模型的推理更加具有可解釋性。
(PS:目前Luca已經(jīng)正式面向公眾開放服務(wù),是可以免費(fèi)體驗(yàn)的那種哦~)
在底層基礎(chǔ)設(shè)施的其他方面,例如訓(xùn)練、壓縮和推理,面壁智能也自研了自己的一套打法:
- BMTrain:大模型高效訓(xùn)練框架
- BMInf:大模型高效推理框架
- BMCook:大模型高效壓縮框架
據(jù)說其大模型已集成超過16000多個(gè)真實(shí)API,可實(shí)現(xiàn)一鍵接入,調(diào)用工具解決更多復(fù)雜任務(wù)。
此外,面壁智能還部署了Int8量化模型,讓模型推理成本降低50%。
總結(jié)來說,面壁智能探索了出更為低成本、高效率的模型訓(xùn)練方法,讓大模型不僅能“訓(xùn)出來”,還能“訓(xùn)得好”、“用得好”。
這可能就是這家創(chuàng)業(yè)公司推動(dòng)“大模型+Agent”應(yīng)用落地的實(shí)力和底氣。
還有更大的一盤棋
不過除此之外,基于大模型底座的基礎(chǔ)能力,面壁智能還曾開源了兩項(xiàng)重磅的工作——AgentVerse和XAgent。
加上之前我們提到的ChatDev,三者共同形成了面壁智能的“三駕馬車”,圍繞的核心便是AI智能體。
AgentVerse是一個(gè)大模型驅(qū)動(dòng)的智能體通用平臺(tái),它的作用就是打造各式各樣的AI智能體,讓它們具備感知、思考、推理、理解、協(xié)作和執(zhí)行的能力,以便“組團(tuán)打怪”。
XAgent是大模型驅(qū)動(dòng)的AI智能體應(yīng)用框架,它可以讓智能體們具備自主規(guī)劃和決策能力,能夠理解人類指令,制定復(fù)雜計(jì)劃并自主采取行動(dòng)完成任務(wù)。
而ChatDev則更為聚焦,是大模型驅(qū)動(dòng)的多智能體協(xié)作開發(fā)框架,采用軟件工程瀑布模型的思想,將軟件開發(fā)分為軟件設(shè)計(jì)、系統(tǒng)開發(fā)、集成測(cè)試、文檔編制四個(gè)主要環(huán)節(jié)。
但若是我們將此次發(fā)布的所有“單節(jié)點(diǎn)”聯(lián)系到一起,就能發(fā)現(xiàn),面壁智能實(shí)則是在下一盤更大的棋——
左手大模型,右手AI智能體,要打造的是一個(gè)智能體網(wǎng)絡(luò)(Internet of Agents,IoA)。
因?yàn)樵诿姹谥悄芸磥恚覀円呀?jīng)經(jīng)歷了從互聯(lián)網(wǎng)到物聯(lián)網(wǎng)的過渡,而接下來的駛向便是智聯(lián)網(wǎng)。
如果說互聯(lián)網(wǎng)是二維信息的聯(lián)通、物聯(lián)網(wǎng)是三維空間的聯(lián)結(jié),那么智聯(lián)網(wǎng)則是進(jìn)入更高維度的智能體互聯(lián)。
而在智聯(lián)網(wǎng)中,AI智能體應(yīng)當(dāng)是最為關(guān)鍵的存在,它可以是擬人的原生智能體,也可以是現(xiàn)實(shí)中的人和物體的數(shù)字孿生智能體。
通過智能體的連接,可以讓AI真正為人類服務(wù),提供價(jià)值(生產(chǎn)力的提升、交互方式的改變)。
以一個(gè)大膽的想象來比喻,可能在智聯(lián)網(wǎng)的將來,家中的哪怕是一張桌子、一臺(tái)冰箱,也會(huì)具備智能體的特性,可以與人和其它物體做智能交互。
而這,也正是面壁智能愿景的由來——智周萬物:
“智”即AI Agent智能體;“萬物”可以是人,可以是物。
AI Agent智能體網(wǎng)絡(luò)是連接現(xiàn)實(shí)世界與虛擬世界的橋梁,并使其真正交互和協(xié)作起來,創(chuàng)造價(jià)值。
不過有一說一,智聯(lián)網(wǎng)的理想雖好,但現(xiàn)實(shí)的情況是,即使是ChatDev和第三代大模型的發(fā)布,也只能視為邁向愿景的一步。
那么面壁智能是否有足夠的實(shí)力能夠在將來解鎖“智周萬物”呢?