AI大模型時代，Agent智能體開發的三重境界原創

發布于 2024-5-22 10:20

瀏覽

0收藏

一、第一重境界：當作能理解語義的API使用

Agent 智能體第一重境界，可以把大型語言模型看成一個特別的 API，它能讀懂人類語言。就像我們平時調用其他 API 那樣，我們向智能體提問，它就能給出經過自己思考的答案。

這個階段的智能體，通常是把這種讀心術般的語言理解力融入到標準的軟件流程中，給軟件添加智慧升級。它的作用主要圍繞著理解并處理文字，比如：生成文本、做內容概括等，這些都離不開它強大的語言理解能力。工作起來，就跟程序員在開發軟件時調用各種工具的 API 差不多。下面是個常見的應用實例：

1、每日新聞精粹

一個鮮明的應用案例體現在自動化新聞摘要上。Agent 能夠消化海量的新聞資訊，并借助其卓越的自然語言解析技術，提取核心要點，編制成一份緊湊的每日新聞概要。

此發展階段，Agent 開發的核心議題聚焦于提升自然語言的解析與處理能力。對于 AI 領域的開發者而言，掌握自然語言處理的基礎理論已頗為關鍵。而在實際的 AI 工程項目實施中，很大程度上側重于調整和優化指令提示，以充分利用現有的高級 AI 模型來達成這一需求。

二、第二重境界：當作自然語言編程工具使用

進入第二重境界后，Agent 實現了從單純的語言理解接口到自然語言編程利器的跨越。這標志著開發者能夠運用自然語言指令，引導 Agent 執行更為復雜多維的任務序列。

在此進化階段的智能體，其應用場景遠遠超越了文本解析的范疇。借助精心設計的提示策略、Function Calling 函數調用機制，大型語言模型得以遵照具體的指示，輸出結構化的信息，從而在很多層面上介入并優化了傳統的軟件作業流程，實現了通過LLM 技術進行自然語言編程的實踐。以下為該模式的幾個典例應用場景：

1、代碼解釋器

比如：用 Python 畫個愛心。

代碼解釋器 Agent 借助大語言模型進行 Planning 推理生成對應的 Python 代碼。

AI大模型時代，Agent智能體開發的三重境界 -AI.x社區

然后借助 iPython 解釋器工具和運行資源和運行環境等3個工具完成 Action 執行結果。

AI大模型時代，Agent智能體開發的三重境界 -AI.x社區

三、第三重境界：當作真正的智能使用

當 Agent 開發邁入第三重境界時，它搖身一變，成為了名副其實的智能伙伴，遠不止是簡單的 API 或工具那樣被動。這時的 Agent，具備了自我決策與解決問題的能力，成為了主動參與工作的智囊團成員。

在這個層次的智能體構建，近乎于大家構想中的 AI 原生應用程序開發，它徹底顛覆了傳統軟件開發的邏輯框架。大語言模型（LLM）在此真正作為智慧體被激活并融入應用。

開發這樣的應用，你得像設計一個人類團隊的任務分配那樣去構思：

角色定位（用提示詞Role來界定每個Agent的職責）
技能配置（為這些角色綁定必要的工具與技能集）
交互機制（設定狀態 state 來管理各 Agent 間的信息交流）
流程規劃（安排 workflow 確保各項任務在 Agent 間順暢傳遞）

此刻，LLM 不再是孤立的 API 調用，而是與具體角色、技能綁定，并且需要多個 Agent 協同作戰，模擬了人類團隊的運作模式。以下是一些體現這一理念的典型應用場景實例：

1、Planning-Action-Observation（Plan-and-Execute）

Planning-Action-Observation 是一種任務解決方法論，核心圍繞著規劃、執行、觀測三大關鍵環節展開，要求 Agent 基于既定目標，自主啟動策劃流程并后續執行這些策略。這意味著 Agent 必須掌握解析目標、策略構思及任務實施的綜合技能。

AI大模型時代，Agent智能體開發的三重境界 -AI.x社區

拿“規劃一次從北京至上海的旅程”為例，這一過程在大語言模型的引導下，會細分為幾個精心規劃的步驟：分析并決定出發日期，評估并挑選最合適的交通工具，預覽并預訂住宿及活動項目——此為“規劃”階段。隨后的“執行”階段，則是對上述計劃的實體化，具體到制定詳盡的日程安排，以及無縫完成所有必要的預約操作，確保旅程的每一環都妥善安排。

AI大模型時代，Agent智能體開發的三重境界 -AI.x社區