【人人都會做智能體】Agent是什么,簡單中等復雜商用的智能體又是什么? 原創
今天我將開啟《人人都會做智能體》公開課的第1節課。
《人人都會做智能體》公開課以智能體的小白科普和初級制作為目標,將從智能體基礎認知(LLM+RAG+WorkFlow+Agent)、智能體拆解復原、開發環境部署、智能體項目實戰等幾個部分,按照學習習慣,迭代式遞進式的,采用圖文結合的方式,循序漸進帶領大家一步步掌握智能體制作的方法、技巧和經驗。
智能體項目實戰部分,現在初步定了兩個,我之前的文章已經開始寫了。一個是長篇圖文智能體生成助手,打算用5-10篇的文章,采用版本迭代的方式,讓大家從一個最簡單的幫你寫固定格式內容的文章寫作助手,變成一個有商用應用場景的寫作智能體。另一個是數據可視化智能體,算是一個剛需領域。其他項目還在構思中。
??Dify 搭建私有數據可視化智能體,效果直逼 ChatGPT??
回歸本文主題,智能體是什么,以及簡單中等復雜商用的智能體又是什么??
本節希望能夠用一種通俗易懂的方式,幫大家了解智能體(Agent )到底是什么,它的表現形式是什么,什么是簡單的智能體,什么是復雜的智能體?以及通過具體的示例告訴大家,智能體是怎么在工作或者生活中幫助我們的。
希望通過本節課能幫助大家建立一個正確的認知,完成對智能體(Agent)的祛魅。
什么是智能體
網上幾乎99%的文章或者百科,甚至是DeepSeek,會告訴你智能體(Agent)是一個能夠感知環境、自主決策并采取行動的計算系統。它像是一個數字助手,能夠接收信息,根據這些信息做出決策,然后執行相應的操作。
其實我不太喜歡感知環境這樣的描述,因為我覺得大部分人一聽到這個詞是蒙的。
如果把DeepSeek這樣的大模型比作人類「大腦」,那智能體(Agent )就是個不光長著大腦,而且是會使用各種工具的虛擬人,只是這個虛擬人的最終表現形態可能只是個聊天界面。
這個裝配了智能大腦(大模型)的虛擬人(智能體),可以幫著訂外賣、查天氣、寫周報、OA請假等等…每個功能其實都對應一個工具模塊(tools)。
比如接收到主人訂外賣命令(幫我訂個午飯)后,虛擬人開始自主決策,有了以下思考:
- 主人要訂外賣了,現在是10點30分鐘,主人是中午11點30下班,只有一個小時的配送時間。【感知環境】
- 所以訂外賣的范圍不能超出當前位置5公里范圍。【自主決策】
- 當前位置在哪呀,我查一下當前定位,地點是北京故宮御書房。【感知環境】
- 下一步我應該打開外賣app,查看系統推薦菜譜【執行工具】
- 對了,我已經連續兩天中午給主人點了他最愛吃的排骨米飯,今天應該換換口味了【短期記憶】
- 先看看附近哪些菜比較受歡迎,再看看有沒有差評【規劃能力】
- 這家水煮魚綜合比較后,不錯就下單這個吧。【執行工具】
- 對了,還要給主人發送郵件告訴他我已經訂好外賣了。【執行工具】
大家看完上面這個例子,也就明白智能體與普通程序的區別了。智能體其具有一定程度的自主性和適應性,而普通程序通常按照預設的指令執行任務;智能體能夠根據環境變化調整自己的行為,有時甚至可以學習和改進自己的表現。
智能體的商業應用場景
讓我們通過幾個具體的例子,來看看商用的智能體將如何在實際工作和生活中幫助我們。
(1)個人助理智能體
張先生是一名忙碌的企業高管,他使用一個個人助理智能體來管理日程和溝通。這個智能體可以:
這個智能體大大提高了張先生的工作效率,讓他能夠專注于重要決策和創造性工作。
(2)客服智能體
某電商平臺部署了客服智能體,它能夠:
這個智能體每天能夠處理數萬次客戶詢問,大大減輕了人工客服的負擔,同時提高了客戶滿意度。
(3)健康管理智能體
李女士使用一個健康管理智能體來監控和改善她的健康狀況:
這個智能體幫助李女士養成了更健康的生活習慣,有效預防了潛在健康問題。
(4)寫作助手智能體
王教授正在寫一本學術著作,他使用寫作助手智能體來提高效率:
這個智能體不僅節省了王教授大量時間,還提高了著作的質量和準確性。
簡單與復雜的智能體
想必大家看完上面的例子后,感覺這個東西好像很早就一直在吹了,而且離自己的生活的工作好像還很遙遠。而且《人人都能做智能體》不就是人人都能把這個智能體做出來的意思嗎,上面那些例子根本無從下手,而且也很難直觀的想象出來,這不是說大話嗎?
首先,我覺得智能體這個概念應該從廣義和狹義上的理解。廣義上的智能體,就是商業化的那種,是一種相對比較成熟的智能解決方案;而狹義的理解,就是你從現在各種AI軟件或者平臺看到的那種智能體。我們今后研究的就是這個。
而狹義的智能體(Agent),也有簡單和復雜的智能體之分,并沒有一個標準的形象定義。
(1)那什么是簡單難度的智能體?
一段結構化的提示詞指令(Prompt)+大語言模型(LLM) =一個簡單的智能體。下圖中的Markdown語法設定就是結構化的提示詞。
這樣的智能體我們在各個大模型網站隨處可見,但是當這種智能體依托于你的業務需求時,基于業務規則的提示詞則成了一件難事。也就是說,提示詞人人都可以寫,但是想寫出符合業務需求的結構化提示詞,確不是人人都會。
比如制作一個“換熱器”產品文案生成智能體,如果不具備工科以及能源的豐厚知識儲備,一般人是無法設計出這種智能體的,因為他連換熱器是什么都不知道。所以基于業務場景的提示詞工程才是有實用意義的工程。
(2)那什么是次中等難度的智能體?
結構化的提示詞指令(Prompt)+大語言模型(LLM)+知識庫(RAG)= 中等難度的智能體
比如上圖是一個“發動機售前技術專家”智能體,能夠根據給定的發動機型號和客戶需求,生成一定字數的售前支持方案。這個智能體就需要掛載發動機詳細的產品參數、技術文檔等資料,作為大模型在生成支持方案的參考依據。
(3)那什么是中等難度的智能體?
結構化的提示詞指令(Prompt)+大語言模型+知識庫(RAG)+工作流(WorkFlow) = 中等難度的智能體
下圖是一個“文章評分”智能體的設計界面,在中間區域,我們可以看到插件、工作流、觸發器、知識、記憶等字段。其中工作流區域關聯了一個叫Articlerating的工作流。
這個工作流,就是這個智能體實現“文章評分”的過程,是如何從多個維度進行評分。工作流的界面長下面這樣。
從途中我們可以看出,這個工作流是一個有開始和結束,有邏輯判斷、分支的決策樹。而想設計出這樣一個智能體,就要去分析業務需求,想清楚實現“文章評分”的過程,然后再將需求以及評分過程設計為工作流節點,通過提示詞模板去驅動大模型進行【自主決策】,最后能夠輸出需要的“文章評分”結果。
我們讓DeepSeek快速幫我們數量一下這個工作流的主要思路。
是不是還是不夠通俗易懂,我們讓DeepSeek用大白話再解釋一下,下面清晰了吧。
但是注意,到這一步還只是個中等難度的智能體。因為它只有一個線性的工作流!
工作流只有1個,還是相對線性,邏輯不是很復雜的這種工作流智能體,我們姑且稱之為中等難度的智能體。
(4)那什么是復雜難度的智能體?
根據業務實現邏輯,將簡單智能體+次中等難度智能體+中等難度智能體有機地組裝在一起,是他們能夠智能分工協作,就是復雜難度的智能體,也叫多智能體(Muti-Agent)!這種智能體已經到了商用級別!換句話說可以賣錢了!
比如前段時間爆火的Manus,是屬于多智能體中的更系統更復雜的工程項目化的智能體。可以我之前的這篇文章。
??內行看Manus!大模型通過Deep ReSearch駕馭Multi-Agent原理深度剖析??
也有復雜難度低點的智能體,比如下邊這種,用戶界面已經是Web頁面,而相關的工作流已經達到了5條,也使用到了數據庫!
好,今天的公開課就先講這!
本文轉載自公眾號九歌AI大模型 作者:九歌AI
原文鏈接:??https://mp.weixin.qq.com/s/JMRrJ0B0h8CpYwFlZMdhiA??
