成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

JHU提出最強(qiáng)ToM方法,AutoToM橫掃五大基準(zhǔn)

人工智能 新聞
近日,來(lái)自JHU 的研究團(tuán)隊(duì)提出了 AutoToM,一種全自動(dòng)、開(kāi)放式的心智推理方法。

本文有三位共同第一作者,分別為 Zhining Zhang(張芷寧)、Chuanyang Jin(金川楊)、Mung Yao Jia。他們?cè)诩s翰霍普金斯大學(xué) Social Cognitive AI Lab 共同完成這篇論文。本文的指導(dǎo)老師為 Tianmin Shu(舒天民),是 JHU Social Cognitive AI Lab 的主任。該實(shí)驗(yàn)室致力于構(gòu)建能夠在現(xiàn)實(shí)世界中理解、推理和與人類互動(dòng)的社會(huì)智能系統(tǒng),從而推進(jìn)以人為中心的 AI。

如何讓 AI 像人一樣思考?如何擁有像人一樣的認(rèn)知能力和社會(huì)能力?

心智能力(Theory of Mind, ToM)是指通過(guò)觀察他人的行為來(lái)理解他們內(nèi)心想法的能力,這一能力對(duì)開(kāi)發(fā)具備社會(huì)智能的智能體至關(guān)重要。

近日,來(lái)自JHU 的研究團(tuán)隊(duì)提出了 AutoToM,一種全自動(dòng)、開(kāi)放式的心智推理方法。作為首個(gè)面向開(kāi)放場(chǎng)景的 model-based ToM 方法,以類似人類的思維模式,AutoToM 在 5 個(gè)基準(zhǔn)測(cè)試中都取得了最好成績(jī),并展現(xiàn)出良好的可擴(kuò)展性、魯棒性以及可解釋性。

圖片

基于模型的心智推理

當(dāng)前在實(shí)現(xiàn)心智能力的推理方面主要有兩種方法:

  • 使用大型語(yǔ)言模型(LLM)來(lái)推理他人的心理狀態(tài)。然而,即使使用了換位思考、變化追蹤和時(shí)空推理等提示策略,LLM 在復(fù)雜情境中仍然會(huì)出現(xiàn)系統(tǒng)性的錯(cuò)誤。
  • 采用基于模型的推理方法。特別是貝葉斯逆向規(guī)劃(Bayesian Inverse Planning, BIP)。BIP 假設(shè) agent 會(huì)根據(jù)一個(gè)貝葉斯心智模型(Bayesian Theory of Mind, BToM)做出理性行為。這個(gè)模型使用 MDP、POMDP、I-POMDP 等給定框架描述 observation、belief、action、goal 等心理變量之間的依賴關(guān)系,來(lái)模擬 agent 做出行為的過(guò)程。BIP 通過(guò)逆推這個(gè)生成過(guò)程,來(lái)判斷哪些潛在心理狀態(tài)可能導(dǎo)致我們觀察到的行為。

JHU 該團(tuán)隊(duì)之前的論文(ACL 2024 杰出論文獎(jiǎng))將 BIP 和 LLM 結(jié)合,以實(shí)現(xiàn)既具可擴(kuò)展性又穩(wěn)健的模型化心智推理。這類方法更加穩(wěn)健,在特定領(lǐng)域中相較于直接使用 LLM 有明顯優(yōu)勢(shì),但它們依賴的是固定、人工設(shè)計(jì)的模型,沒(méi)有辦法泛化到不同的領(lǐng)域。

圖片

不同基準(zhǔn)測(cè)試中的示例問(wèn)題及其所需的 BToM 模型。

AutoToM

第一個(gè)適應(yīng)開(kāi)放場(chǎng)景的 model-based ToM 方法

AutoToM 引入了一種全新范式。它是一種完全自動(dòng)化、開(kāi)放式的基于模型的 ToM 推理方法。AutoToM 實(shí)現(xiàn)了對(duì)貝葉斯逆向規(guī)劃的全流程自動(dòng)化,包括模型結(jié)構(gòu)的提出與調(diào)整、關(guān)鍵時(shí)間點(diǎn)的識(shí)別、假設(shè)的生成以及貝葉斯推理的執(zhí)行。

它無(wú)需任何領(lǐng)域知識(shí),可在任意情境中運(yùn)行,能夠推斷任何心理狀態(tài),推理涉及任意數(shù)量的智能體,并支持任意層級(jí)的遞歸推理。這體現(xiàn)了團(tuán)隊(duì)對(duì)一種開(kāi)放、通用且穩(wěn)健的機(jī)器心理理論的愿景。

圖片

AutoToM 的流程圖。X 是已知的可觀測(cè)變量,V 是潛在的心理變量,q 表示問(wèn)題中查詢的變量。ts:t 表示用于推理的信息來(lái)自 ts 到 t 的時(shí)間段。變量 s、o、b、a、g 分別表示 state、observation、belief、action、goal,圖中的實(shí)線箭頭表示模型中它們的依賴關(guān)系。

全自動(dòng)的貝葉斯逆向規(guī)劃

給定一個(gè)貝葉斯心智理論模型(BToM)中,我們引入大語(yǔ)言模型(LLM)作為計(jì)算后端,用于實(shí)現(xiàn)貝葉斯逆向規(guī)劃(BIP)的各個(gè)關(guān)鍵環(huán)節(jié)。

假設(shè)采樣(Hypothesis Sampling)

傳統(tǒng)的 BIP 方法通常依賴人為設(shè)定的假設(shè)空間,以及為每個(gè)潛在心理變量指定具體的假設(shè)表示方式。而我們的假設(shè)采樣模塊則利用 LLM,根據(jù)上下文中可觀測(cè)變量及其取值,生成一小集合的高質(zhì)量假設(shè)。隨后,我們還會(huì)通過(guò)假設(shè)篩選機(jī)制,去除不太可能的假設(shè),從而壓縮假設(shè)空間。

貝葉斯推理(Bayesian Inference)

我們使用 LLM 來(lái)估計(jì) BToM 模型中每個(gè)局部條件概率。接著,通過(guò)對(duì)非目標(biāo)潛在變量進(jìn)行邊緣化,我們得到目標(biāo)變量的后驗(yàn)概率。與以往方法相比,我們的方法具有更強(qiáng)的通用性:支持任意結(jié)構(gòu)的 BToM 模型,能夠同時(shí)考慮多個(gè)潛在變量,并支持任意層級(jí)的高階的心智推理。

圖片

在給定的 BToM 模型下,AutoToM 進(jìn)行全自動(dòng)的貝葉斯逆向規(guī)劃。

全自動(dòng)的模型發(fā)現(xiàn)與改進(jìn)

之前的方法依賴于人工設(shè)計(jì)的 BToM 模型,這限制了它們?cè)谔囟I(lǐng)域外的適用性。相比之下,AutoToM 能夠自動(dòng)提出模型,并動(dòng)態(tài)調(diào)整模型結(jié)構(gòu),從而在推理過(guò)程中兼顧有效性(即準(zhǔn)確地推斷出智能體的心理狀態(tài))和高效性(即盡可能簡(jiǎn)化模型和計(jì)算復(fù)雜度)。

信息提取

信息提取模塊會(huì)處理給定的信息,識(shí)別可觀測(cè)變量的取值,包括狀態(tài)、動(dòng)作和言語(yǔ)等信息,并按時(shí)間順序組織。

提出初始模型

我們使用 LLM 根據(jù)已有的信息和任務(wù)提出一個(gè)初始的 BToM 模型。基于該模型,我們執(zhí)行自動(dòng)化的 BIP。如果該模型的效用超過(guò)某個(gè)閾值,我們便接受該模型的推理結(jié)果,否則將進(jìn)行后續(xù)的模型調(diào)整。

模型調(diào)整

我們通過(guò)兩種方式迭代式地優(yōu)化初始模型:變量調(diào)整和時(shí)間節(jié)點(diǎn)調(diào)整。

  • 變量調(diào)整:在某個(gè)具體時(shí)間點(diǎn)上,我們會(huì)引入新的、相關(guān)的潛變量來(lái)擴(kuò)展模型結(jié)構(gòu),從而緩解推理過(guò)程中的不確定性。每引入一個(gè)變量,我們都會(huì)重新計(jì)算模型效用,并選擇提升效用最大的修改方案進(jìn)行保留。
  • 時(shí)間節(jié)點(diǎn)調(diào)整:以往的研究通常假設(shè)所有歷史都是相關(guān)的,而 AutoToM 能夠在上下文中發(fā)現(xiàn)相關(guān)的歷史信息,這種能力對(duì)于 AutoToM 在長(zhǎng)上下文環(huán)境中成功進(jìn)行心理理論推理并降低計(jì)算成本至關(guān)重要。從最小的時(shí)間范圍開(kāi)始,如果在當(dāng)前的時(shí)間范圍內(nèi),變量調(diào)整仍無(wú)法顯著提升模型效用,我們會(huì)考慮加入新的時(shí)間節(jié)點(diǎn)以引入更多上下文信息。在考慮新的時(shí)間節(jié)點(diǎn)后,會(huì)在此基礎(chǔ)上繼續(xù)執(zhí)行變量調(diào)整。

圖片

AutoToM 通過(guò)在變量調(diào)整和時(shí)間節(jié)點(diǎn)調(diào)整之間交替進(jìn)行,自動(dòng)優(yōu)化 BToM 模型。

自動(dòng)適應(yīng)情境,橫掃五大基準(zhǔn)測(cè)試

該團(tuán)隊(duì)在 ToMi、BigToM、MMToM-QA、MuMA-ToM 和 Hi-ToM 五個(gè)測(cè)試基準(zhǔn)上進(jìn)行了測(cè)試。這些基準(zhǔn)覆蓋了不同的心理變量、環(huán)境、agent 數(shù)量、有無(wú)語(yǔ)言表達(dá)、措辭風(fēng)格以及模態(tài)類型。

與 AutoToM 不同,許多近年來(lái)的 ToM 方法只能應(yīng)用于特定的基準(zhǔn)測(cè)試。而在通用的方法中,AutoToM 在所有基準(zhǔn)測(cè)試中都取得了最優(yōu)的表現(xiàn)。

圖片

AutoToM 和 baselines 在所有基準(zhǔn)測(cè)試上的表現(xiàn)。

本文的消融研究突出了 AutoToM 在變量調(diào)整、時(shí)間步調(diào)整和假設(shè)減少方面的優(yōu)勢(shì)。AutoToM 能夠構(gòu)建一個(gè)合適的模型,該模型不僅支持豐富的 ToM 推理,還能減少計(jì)算量,在準(zhǔn)確性和成本之間取得平衡。

圖片

AutoToM 及其消融方法在所有基準(zhǔn)測(cè)試中的平均正確率與計(jì)算量。

總結(jié)和展望

總的來(lái)說(shuō),AutoToM 是一個(gè) ToM 推理任務(wù)的新穎框架。面對(duì)任何 ToM 推理問(wèn)題,AutoToM 都可以自動(dòng)構(gòu)建一個(gè)合適的 BToM 模型,并借助 LLM 執(zhí)行自動(dòng)的貝葉斯逆向規(guī)劃。 

AutoToM 在所有測(cè)試上取得了最好的結(jié)果,這是因?yàn)?BIP 在面對(duì)復(fù)雜環(huán)境和較長(zhǎng)上下文時(shí)可以穩(wěn)健地推理。此外,AutoToM 具有可解釋性,能夠通過(guò)其發(fā)現(xiàn)的概率模型來(lái)解釋模型的判斷過(guò)程。

該論文為實(shí)現(xiàn)更具人類思維特征的推理方式,以及構(gòu)建具有人類認(rèn)知基礎(chǔ)、具備可擴(kuò)展性、穩(wěn)健性和開(kāi)放性的心理能力模型,指明了一個(gè)有前景的方向。該論文也引發(fā)了關(guān)于 inference-time compute,以及可擴(kuò)展的 model-based inference 的廣泛討論。

責(zé)任編輯:張燕妮 來(lái)源: 機(jī)器之心
相關(guān)推薦

2019-06-04 10:40:07

2023-05-26 11:14:04

人工智能安全性

2013-05-13 10:27:47

InteropSDNOpenDayligh

2017-12-25 10:34:18

技術(shù)預(yù)測(cè)機(jī)遇

2015-06-10 14:28:34

數(shù)據(jù)中心數(shù)據(jù)中心優(yōu)化

2009-07-06 13:18:35

Servlet方法

2010-07-29 13:41:57

Flex性能優(yōu)化

2011-03-23 14:08:47

IE9Chrome 10Firefox 4

2010-07-16 14:00:07

喬布斯

2011-05-16 10:30:02

2010-08-24 16:03:22

Div高度

2024-12-31 08:03:12

2010-08-30 16:01:37

2015-04-27 13:23:42

無(wú)線技術(shù)ZigBeeUWB

2012-07-13 15:07:03

iPad商用

2009-03-19 09:55:00

OFDM無(wú)線通信技術(shù)

2015-10-13 17:11:46

藍(lán)牙物聯(lián)網(wǎng)

2013-05-07 09:24:53

BYOD

2010-07-29 15:44:54

Flex安全沙箱

2015-01-21 14:04:31

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

主站蜘蛛池模板: 成人免费视频观看视频 | 成人午夜精品 | 欧美一区二区在线免费观看 | 国产成人综合在线 | 久久精品综合 | 亚洲欧美日韩中文在线 | 久热久| 国产精品日韩欧美一区二区 | 色视频欧美 | 欧美精品a∨在线观看不卡 国产精品久久国产精品 | 国产无人区一区二区三区 | 在线观看欧美日韩视频 | 一区二区av| 在线精品亚洲欧美日韩国产 | 日本三级网址 | 国产欧美一区二区三区日本久久久 | 欧美一区二区黄 | 欧美日韩综合一区 | 久久久久无码国产精品一区 | 91在线精品一区二区 | 国产日产精品一区二区三区四区 | 精品视频一区二区三区 | 美女人人操 | 欧美性久久 | 国产欧美日韩视频 | 欧美精品91| 色频| 国产精品亚洲欧美日韩一区在线 | 国产精品久久久久久久久免费相片 | 国产丝袜人妖cd露出 | 欧美xxxx日本 | 国产 91 视频 | 欧美在线视频网 | 视频一区二区在线观看 | 91色在线| 国产精品一区二区三区久久 | 精品久久99 | 一区二区三区在线看 | 爱综合| 亚洲精品一区国语对白 | 免费一级片 |