成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

<abbr id="ukk64"><menu id="ukk64"></menu></abbr>

<abbr id="ukk64"><menu id="ukk64"></menu></abbr>

<abbr id="ukk64"><menu id="ukk64"></menu></abbr>

鴻蒙開發者社區

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發者社區

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發者社區訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業版APP

鴻蒙開發者社區視頻號

51CTO軟考題庫

AI.x社區

登錄/注冊
51CTO

中國優質的IT技術網站

51CTO博客

專業IT技術創作平臺

51CTO學堂

IT職業在線教育平臺

o1快慢思考的風又吹到了Agent！

發布于 2024-10-18 15:28

瀏覽

0收藏

智能體（Agent）通過自然對話與用戶互動有兩個任務：交談和規劃/推理。對話回應必須基于所有可用信息，行動必須有助于實現目標。與用戶交談和進行多步推理和規劃之間的二分法，類似卡尼曼引入的人類快速思考和慢速思考系統。

為此，Google DeepMind提出了一個名為Talker-Reasoner的雙系統架構，以模擬人類的兩種思考系統。

o1快慢思考的風又吹到了Agent！-AI.x社區

Talker-Reasoner的雙系統架構，用于構建能夠通過自然對話與用戶互動的智能代理。這種架構受到人類“快速思考”和“慢速思考”系統的啟發，將Agent分為兩個部分：快速直觀的“Talker”（系統1）和慢速、深思熟慮的“Reasoner”（系統2）。

雙系統Talker-Reasoner方法的示意圖

o1快慢思考的風又吹到了Agent！-AI.x社區

Talker-Reasoner智能體模型

詳細介紹了提出的雙系統Talker-Reasoner智能體模型，該模型受到人類快速思考（System 1）和慢速思考（System 2）的啟發。這個模型將智能體分為兩個獨立的但相互協作的組件：

Talker-Reasoner架構的圖表

o1快慢思考的風又吹到了Agent！-AI.x社區

Talker智能體（System 1）：這個智能體是快速、直觀的，負責與用戶進行自然語言交流，生成對話回應。它類似于人類的直覺反應，能夠迅速地從記憶中獲取信息，以支持其回應。Talker智能體在每次與用戶互動時都會激活，并且可以訪問記憶來引導其回應，類似于System 1的持續激活。
Reasoner智能體（System 2）：這個智能體是慢速、深思熟慮且邏輯性強的，負責執行復雜的多步推理和規劃。它調用工具、執行動作，并更新智能體的狀態。Reasoner智能體還負責形成和更新關于用戶的信念狀態，這些信念狀態以結構化的語言對象形式存儲在記憶中。

這兩個智能體之間的主要交互方式是通過記憶。Reasoner智能體負責生成新的信念狀態和推導多步推理和規劃，并將它們存儲在記憶中。Talker智能體在需要信念時，會從記憶中檢索最新的狀態。因此，Talker智能體可能會使用延遲的世界視圖進行操作，因為Reasoner智能體可能還沒有時間生成新的信念并將其存儲在記憶中。

此外，Talker智能體還可以選擇等待Reasoner智能體完成其推理過程，然后再生成回應。這種設計允許快速印象和回應的Talker智能體成為Reasoner智能體明確信念和選擇（計劃）的來源。這種分工方式在大多數情況下都能很好地工作，因為Talker智能體通常非常擅長其任務：它可以自動從記憶中獲取信息，有效地引導其底層模型以很好地應對熟悉情況。

睡眠輔導智能體案例研究

通過一個睡眠輔導智能體的案例研究來評估和實例化Talker-Reasoner雙智能體架構。在一個現實世界的應用場景中展示該架構的有效性，特別是在處理需要用戶建模、使用專家知識提供科學支持的建議、提供多步驟輔導計劃以及進行對話和同理心交流的復雜任務時。

睡眠輔導智能體的實現：

Talker智能體：通過一組專家提供的指導原則來編碼睡眠領域的專業知識，這些原則描述了智能體的構成（例如，表現出同理心、進行對話交流、提供準確的建議）以及睡眠輔導的不同階段（理解、目標設定和輔導計劃）。Talker智能體通過一個強大的語言模型實現，能夠理解復雜的模式并提供深思熟慮的對話回應。
Reasoner智能體：明確地對用戶的信念進行建模。通過與臨床專家的合作，作者編碼了一個JSON/XML模式的信念，包括睡眠問題、目標、習慣、障礙和睡眠環境等字段。Reasoner智能體在執行多步推理/規劃時，推斷并更新這些模式字段，從而創建或更新其信念狀態。
Talker和Reasoner的協調：Talker智能體是否等待Reasoner智能體完成，取決于信念狀態。在規劃輔導階段，Talker智能體會等待Reasoner智能體完成；否則，它不會等待。

定性結果：

示例對話：展示了Talker和Reasoner智能體之間的互動，包括如何根據用戶的需求生成回應和計劃，以及如何根據用戶的反饋調整計劃。
根據反饋調整計劃：展示了Reasoner智能體如何根據Talker智能體從用戶那里收集的反饋來調整其計劃。

以下是一段示例對話，展示了Reasoner和Talker之間的互動：

用戶：嘿，我需要你的幫助來規劃如何營造一個放松的睡前環境。（記憶中的信念更新為：{updated-context: starting context, updated-title: Sleep Coaching, coachingphase: UNDERSTANDING}）


Talker：太好了，我們開始為你打造一個放松的睡前環境吧:-) 你的臥室里有沒有什么可能會干擾你睡眠的東西？


用戶：我覺得噪音和光線太分散注意力了。你能幫我制定一個消除這些干擾的計劃嗎？（記憶中的信念保持不變）


Talker：當然可以！這里有一個消除臥室干擾的計劃：噪音：


確定噪音源：列出臥室中所有的噪音源
隔絕外界噪音：使用遮光窗簾來阻擋光線和減少噪音；考慮使用降噪窗簾或隔音板；試試耳塞或白噪音機。光線：...記住，一致性是關鍵。每晚都堅持這個計劃，以營造一個平靜而黑暗的睡眠環境。還有什么我可以幫助你的嗎？


用戶：當然，這很有用。不過，我希望步驟能更詳細一些。還想看看如何在我的臥室里營造一個寧靜放松的氛圍的資源。
（記憶中的信念更新為：{user context: UserCollectedContextData(primary-sleep-concern: Noise and light distractions in the bedroom), coaching phase: CoachingPhase(value=PLANNING)}）


Reasoner的計劃：當然！讓我們更深入地看看你的計劃的第一步：


步驟：選擇一個平靜的色彩調色板。描述：在選擇臥室顏色時，選擇柔和的中性色調，如柔和的藍色、綠色或灰色。這些色調已被科學證明可以促進放松和寧靜。
1. YouTube視頻：（鏈接）標題：創造放松和無壓力臥室的墻面顏色創意。
頻道：roomdsignTV。
推理：這個來自roomdsignTV的視頻提供了平靜臥室色彩調色板的視覺示例。它展示了舒緩色彩對營造寧靜氛圍的影響。
2. YouTube播放列表：（鏈接）標題：Berger油漆色彩組合。
頻道：Hresun Interiors。
推理：這個來自Hresun Interiors的播放列表提供了一系列的臥室色彩組合創意。它涵蓋了從傳統到現代的多種風格，幫助你找到適合臥室的完美色彩方案。


Talker：復制Reasoner的回應


##### 根據反饋調整計劃


以下是Reasoner智能體如何根據Talker智能體從用戶那里收集的反饋來調整其計劃的示例：


用戶：謝謝你，這非常有用。你能在我的計劃中加入更多關于我應該在空間中添加哪些放松聲音的步驟嗎？（記憶中的信念保持不變）


Reasoner的計劃：當然可以！這是你的計劃中的“探索自然聲音”部分，以及一些相關的YouTube內容：


探索自然聲音：這個部分旨在幫助你使用自然聲音在空間中創造一個平靜和寧靜的氛圍。通過加入這些聲音，你可以促進放松和減輕壓力。推薦YouTube視頻：...


發現治療頻率：在這個計劃的部分，我們將探索治療頻率的世界，這些頻率被認為對放松和情緒健康有深遠的影響。...YouTube推薦：

https://arxiv.org/pdf/2410.08328
Agents Thinking Fast and Slow: A Talker-Reasoner Architecture
Google DeepMind

本文轉載自??PaperAgent??

標簽

贊

收藏

回復

舉報

回復

相關推薦

OpenAI o1很強，也能被玩壞！

PaperAgent ? 2591瀏覽 ? 0回復
OpenAI o1引發的思維鏈思考：思維鏈提示啟發大模型推理

angel ? 3937瀏覽 ? 0回復
使用 OpenAI o1 的五種方法「詳細指南」

51CTO技術棧 ? 5837瀏覽 ? 0回復
OpenAI o1推理模型基礎入門

51CTO內容精選 ? 2517瀏覽 ? 0回復
被神化的o1模型，規劃能力到底如何？

大語言模型論文跟蹤 ? 3046瀏覽 ? 0回復
o1推理擴展的風吹到了RAG，性能飆升58.9%！

PaperAgent ? 2757瀏覽 ? 0回復
o1蒙特卡洛樹的風又吹到了Agentic工作流！

PaperAgent ? 3229瀏覽 ? 0回復
o1的風又吹到多模態，直接吹翻了GPT-4o-mini

PaperAgent ? 2401瀏覽 ? 0回復
DeepSeek首發國產類o1模型！人人可以免費使用！

51CTO技術棧 ? 3994瀏覽 ? 0回復
解密o1推理過程！DeepSeek-R1-Lite預覽版上線

kede96 ? 3173瀏覽 ? 0回復
阿里重磅開源QwQ-32B：自我思考、糾正，數學能力擊敗o1模型

Aceryt ? 7931瀏覽 ? 0回復
o1的規劃能力如何？LRM是未來嗎？

探索AGI ? 2118瀏覽 ? 0回復
阿里發布類o1模型QWQ，可自我反思糾錯，實測數學推理遠超o1、DS-R1，人人免費

51CTO技術棧 ? 3053瀏覽 ? 0回復
OpenAI o1 模型到來后，談談提示詞工程的未來

Baihai_IDP ? 2380瀏覽 ? 0回復
大語言模型o1慢思考推理系統的破局之路：模仿、探索與自我提升的深度揭秘！

十一月雨_55 ? 4034瀏覽 ? 0回復
最簡單的推理擴展方案，效果媲美o1！

NLP前沿1 ? 1809瀏覽 ? 0回復
o1模型醫學推理驚人，超過人類醫生

Aceryt ? 2033瀏覽 ? 0回復
Vision-R1：多模態領域的DeepSeek R1-Zero，7B參數比肩OpenAI O1

Syrupup ? 2371瀏覽 ? 0回復
DeepSeek-R1的風吹到了多模態，Visual-RFT發布，視覺任務性能飆升20%

PaperAgent ? 2152瀏覽 ? 0回復

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

最近發布

Doc2X：為知識庫RAG接上高精度文檔解析的“智能引擎” 2天前發布
RAG-Anything：全面的一體化多模態文檔處理 RAG 系統 2天前發布

熱門推薦

AI Agents開源工具棧全解析~ 1回復

從原理到調參，小白也能讀懂的大模型微調LoRA，不懂線性代數也沒問題 0回復

Deepseek R1 0528實測：性能直逼頂尖，普通電腦本地運行全攻略 0回復

本命周！MiniMax M1有多猛？網友：僅用40k思考預算就干翻Gemini，實測：真·超DS！ 1回復

DeepSeek 新模型 R1-0528 悄悄開源，與o3 相當，實測來了 0回復

上一篇：忘記Tool檢索，擁抱全新Agent ToolGen！

下一篇：超級Agent：像人一樣操控電腦！

社區精華內容

目錄

主站蜘蛛池模板：成人一区二区三区在线观看 | 日本一区二区三区精品视频 | 日韩精品一区在线 | 一区二区三区四区av | 久久网站黄 | 一级片在线观看 | 精品成人佐山爱一区二区 | 2019天天操| 999精品在线观看 | 蜜桃视频在线观看免费视频网站www | 午夜视频在线 | 国产精品视频一区二区三区四蜜臂 | 亚洲高清电影 | 福利视频网址 | 欧美电影在线观看网站 | 久久国产日韩欧美 | 久久91av| 日韩成人在线视频 | 日本精品视频在线 | 欧美日韩一区二区电影 | 免费看黄色视屏 | 国产精品不卡一区二区三区 | 亚洲一区二区三区 | 亚洲精品视频在线看 | 国内精品一区二区三区 | 三级黄色片在线观看 | 国产午夜精品久久久 | 成人在线一区二区三区 | 中文字幕一区二区视频 | 日韩欧美国产电影 | www.黄网 | www.99re | 久久久国产精品 | 免费观看一区二区三区毛片 | 免费在线看黄视频 | 亚洲视频免费观看 | 日本精品一区二区在线观看 | 欧美在线| 97久久精品 | 2023亚洲天堂 | 老司机狠狠爱 |

<kbd id="oyse6"><code id="oyse6"></code></kbd>

<kbd id="oyse6"></kbd>