人類如何通過機器智能增強認知過程和行為 原創
計算邏輯以各種形式出現,就像其他類型的邏輯一樣。本文將重點介紹計算邏輯中的溯因邏輯編程(ALP)方法,并將論證ALP代理框架,它將 ALP 集成到代理的操作周期中,為解釋性推理和規范性推理提供了一個具有說服力的模型。
ALP代理框架作為一個解釋性模型,它以生產系統為例;而作為一種規范性模型,它不僅包括經典邏輯,而且與傳統的決策理論相一致。ALP代理框架的雙重性性質包括直覺推理和審慎推理,將其歸類為雙過程理論。與其他理論結構類似,雙過程理論有多種版本。正如[Kahneman 和 Frederick ,2002] 在參考文獻中所描述的那樣,直覺思維“迅速產生判斷問題的本能解決方案”,而審慎思維“評估這些解決方案,決定是否認可、調整或拒絕它們”。
本文將主要關注ALP代理框架的規范性元素,探索如何利用它來增強人們的認知過程和行為。具體來說,將研究它在日常生活中提高人們的溝通技巧和決策能力的潛力。因此可以斷言,ALP代理框架為[Williams, 1990,1995]中概述的有效寫作指南提供了堅實的理論基礎,并為[Hammond等人,1999]中討論的更好的決策提供了見解。本文的基礎在于[Amin, 2018],它提供了對ALP代理框架的技術方面的詳細探索,并引用了相關的學術著作。
圖1簡化的溯因推理和代理循環
ALP代理的基本概述
ALP代理框架可以被認為是BDI(信念-愿望-意圖)模型的一種變體,其中代理通過形成意圖(本質上是行動計劃)來利用知識實現其目標,意圖本質上是行動計劃。在ALP代理中,知識(信念)和目標(意圖)都以邏輯形式表示為條件語句。信念被表示為邏輯編程規則,而目標則使用更靈活的子句來描述,能夠捕捉一階邏輯(FOL)的全部范圍。
例如,以下的語句說明了這一點:第一個語句表達了一個目標,隨后的四個語句代表了信念:
- 如果發生危機,或者我自己處理,或者尋求幫助,或者逃避。
- 如果船有破損,就會出現危機。
- 如果我在船上,我會尋求幫助并通知船長。
- 如果我在船上,我會通知船長并按下報警按鈕。
- 我在船上。
在本次討論中,目標通常在開始時就構建了條件,因為它們主要用于正向推理,類似于生產規則。另一方面,信念通常首先得出結論,因為它們通常用于反向推理,類似于邏輯編程。然而,在ALP中,信念也可以先用條件來寫,因為它們可以應用于正向推理和反向推理。具體的順序(無論是正向還是反向)都不會影響底層邏輯。
1.模型假設和實用語言
更簡單地說,在ALP代理框架內,信念代表了代理對世界的看法,而目標則根據代理描述了世界的期望狀態。在演繹數據庫語境中,信念對應于存儲的數據,目標與查詢或完整性規則相關。
在形式上,在ALP代理框架的模型理論解釋中,具有信念BBB、目標GGG和觀察OOO的代理必須確定行動和假設,使G∪OG\cup OG \8746 O在BBB定義的最小模型內成立。在BBB由霍恩(Horn)條款組成的基本場景中,BBB具有獨特的最小模型。其他更復雜的場景可以簡化為霍恩條款的情況,盡管這些技術方面超出了這里的主要關注點。
在實際的解釋中,ALP代理主要基于其觀察結果進行正向推理,而代理則從其信念中既進行正向推理和反向推理,以評估目標條件是否滿足,并確定相應的結果作為要實現的目標。正向推理類似于基于規則系統中的正向鏈接,它通過確保滿足條件來使目標的結論成立。以這種方式解釋的目標通常被稱為維護目標。另一方面,通過反向推理來處理實現目標,這涉及找到一系列行動,當執行這些行動時,將實現目標。反向推理作為目標分解的過程,其中可操作的步驟被視為原子子目標的特定情況。
例如,如果你觀察到一場火災,可以使用前面提到的目標和信念,通過正向推理得出緊急情況存在的結論,從而實現自己處理情況、尋求幫助或逃離的目標。這些選項構成了一組初步的可能性集。為了實現目標,可以進行反向推理,將尋求幫助的目標分解為子目標,例如前方道路有障礙時,通知火車司機和按下報警按鈕。如果按下報警按鈕是原子操作(是指不會被線程調度機制打斷的操作),那么可以直接執行。如果此操作成功,則完成了實現目標,同時也滿足了相應的維護目標。
從模型論的角度來看,代理不僅要生成動作,還要對世界做出假設。這正是ALP中溯因推理概念發揮作用的地方。溯因推理涉及形成假設以解釋觀察結果。例如,如果觀察到的是煙而不是火,并且相信出現煙霧意味著有火災,那么從觀察到的現象出發進行反向推理,將會導致假設有火災存在。然后,正向推理和反向推理將照常進行。
在模型理論和操作語義學中,觀察結果和目標都以類似的方式處理。通過正向推理和反向推理,代理生成動作和額外的假設,以在其信念所定義的世界的最小模型中使目標和觀察結果成立。在前面的例子中,如果觀察結果是存在煙霧,那么存在火災的信念和按下警報按鈕的動作,結合代理的信念,都會使目標和觀察結果成立。只要滿足某些假設,操作語義就與模型論語義保持一致。
2.選擇最優解
可能存在多種解決方案,這些解決方案與信念集BBB相結合,使得目標GGG和觀察結果OOO都有效。這些解決方案可能有不同的結果,而代理面臨的挑戰是在可用資源的限制下識別出最有效的解決方案。在經典決策理論中,一個動作的價值由其結果的預期效益決定。同樣地,在科學哲學中,一個解釋的價值是根據其可能性和解釋觀察結果的能力來評估的(能夠解釋的觀察結果越多,就越好)。
在ALP代理中,這些相同的標準可以應用于評估潛在的行為和解釋。這兩種假設都是通過預測結果來評估的。在ALP代理中,尋找最優解的過程被整合到反向推理策略中,利用最佳優先搜索算法(例如,a *或分支定界)等方法。這種方法類似于基于規則的系統中解決沖突的簡單任務。傳統的基于規則的系統通過將高級目標、信念和決策轉換為低級啟發式和刺激-反應模式來簡化決策和溯因推理。例如:
- 如果我乘坐的船上有漏洞,我就按下警報按鈕。
在ALP代理中,低級規則可以與高級認知過程相結合,類似于雙過程理論,以利用這兩種方法的優勢。與大多數一次只關注一個計劃的BDI代理不同,ALP代理可以處理單個動作,并可以同時執行多個計劃,以提高成功的可能性。例如,在緊急情況下,代理可能會同時啟動警報并嘗試逃生。是專注于一個計劃還是同時關注多個計劃,取決于所選的搜索策略。雖然深度優先搜索一次只關注一個計劃,但其他策略可能會帶來更大的好處。
ALP代理模型可用于創建人工代理,但它也是理解人類決策的有用框架。在接下來的章節中,將論證這個模型不僅改進了傳統的邏輯和決策理論,而且還提供了一種規范(或規定性)的方法。采用ALP代理模型作為高級決策理論基礎的理由是,子句邏輯提供了一種思維語言(LOT)的可行表示。將通過比較子句邏輯和自然語言來進一步探討這一論點,并展示這個模型如何幫助個人進行更清晰、更有效的溝通。在最后一章節中,將重新討論ALP代理模型在增強決策中的應用。
作為主體認知框架的子句邏輯
在語言和思維的研究中,關于語言與認知的關系有三種主要理論:
- 認知框架理論:思維是由一種類似于語言的私有系統來表示的,這種系統獨立于外部口頭語言。
- 語言影響理論:思想是由公共語言塑造的,使用的語言影響人們的認知過程。
- 非語言思維理論:人類思維不遵循類似語言的結構。
ALP代理模型與第一種理論一致,與第二種理論相悖,與第三種理論兼容。它與第二種理論相悖,因為人工智能的邏輯框架并不依賴于口語的存在,而且根據人工智能的標準,自然語言往往過于模糊,無法有效地模擬人類的思維。然而,它支持第三種理論,因為它的連接主義實施掩蓋了其語言特性。
在人工智能領域,某種形式的邏輯代表代理的認知框架的觀點與傳統的人工智能方法(通常稱為GOFAI或“傳統的人工智能”)緊密相連,但新方法(例如連接主義方法和貝葉斯方法)在一定程度上掩蓋了傳統方法的光芒。ALP模型為這些不同的方法提供了一種潛在的調和方式。ALP的子句邏輯比標準的一階邏輯(FOL)更簡單,融入了連接主義原理,并包含了貝葉斯概率。它與標準的一階邏輯的關系類似于認知框架與自然語言的關系。
這一論點始于關聯理論[Sperber和Wilson, 1986],該理論認為人們理解語言是通過用最少的認知努力提取最多的信息。根據這一理論,溝通越符合其意圖,受眾就越容易理解。研究認知框架本質的一種方法是檢查準確和有效理解至關重要的場景。例如,倫敦地鐵上的緊急通知設計得很容易理解,因為它們被明確或隱含地構造為邏輯條件句。
1.緊急情況下應采取的行動
要解決危機,激活報警信號按鈕通知火車司機。如果火車停在車站,司機就會立即停車。如果沒有報警,火車將駛往下一站,在那里可以更容易地提供援助。需要注意的是,不當使用報警器將被罰款50英鎊。
第一個指令代表了一個程序性目標,其邏輯被編碼為一個編程子句:激活警報將通知火車司機。第二個指令雖然以邏輯編程的形式表達,但有些模糊且缺乏完整的條件。它可能意味著如果火車司機收到警報,并且火車停在車站,那么就會停車。
第三個指令涉及兩個條件:如果收到警報,火車不在站內,司機將在下一個站點停車。如果火車離站點越近,就越容易提供援助,這句話是一個附加結論,而不是一個條件。如果這是一種條件,那就意味著火車只停在容易獲得援助的車站。
第四個指令是有條件的:不當使用報警信號按鈕可能會被罰款50英鎊。
緊急通知的清晰性是因為它與認知框架中的預期意義相一致。該通知是連貫的,因為每句話都與前一句有邏輯聯系,并與讀者對應急程序的可能理解保持一致。
省略條件和細節有時會增強連貫性。根據Williams[1990,1995]的觀點,連貫性也可以通過構建句子來實現,讓熟悉的想法出現在開頭,新的想法出現在結尾。這種方法允許新信息無縫地過渡到后續句子中。緊急通知的前三句話就是這種方法的例證。
省略條件和細節有時會增強連貫性。根據Williams[1990,1995]的觀點,連貫也可以通過組織句子來實現,讓熟悉的想法出現在開頭,新的想法出現在結尾。這種方法允許新信息無縫地過渡到后續句子中。緊急通知的前三句話就是這種方法的例證。
以下是另一個例子,反映了ALP代理模型所解決的推理類型:
- 下雨了。
- 如果下雨,而你不帶傘出去,會被淋濕的。
- 如果你淋濕了,可能會感冒。
- 如果你感冒了,會后悔的。
- 你不想后悔。
因此,你不應該不帶傘出去。
在下一節中,將論證這些例子中所展示的連貫性可以通過句子中條件和結論之間的邏輯關系來理解。
2.自然語言與認知表征
與解釋為清晰和連貫而精心設計的信息相比,理解日常的自然語言交流是更復雜的挑戰。這種復雜性包括兩個主要方面。首先,它需要破譯通信的預期含義。例如,要理解模棱兩可的句子“他給了她這本書”,一個人必須確定“他”和“她”的身份。
第二個挑戰是以標準化格式對預期的含義進行編碼,以確保相同的消息得到一致的表示。例如,下面的句子表達了相同的意思:
- Alia給了Arjun一本書。
- Alia把書給了Arjun。
- Arjun從Alia那里收到了這本書。
- 這本書是Alia送給Arjun的。
用規范的形式表示這個共同的含義,簡化了后續的推理。共享的意思可以用一個邏輯表達式來表達,例如給(give)(Alia, Arjun, book),或者更準確地說:
event(e1000).
act(e1000, giving).
agent(e1000, Alia).
recipient(e1000, Arjun).
object(e1000, book21).
Isa(book21, book).
精確的格式有助于更有效地區分類似的事件和對象。
根據關聯理論,為了提高理解能力,交流應該與他們的心理表征緊密結合。它們應該清晰簡潔地表達出來,反映代表的規范形式。
例如,與其說“屬于水生脊椎類的魚都有鰓”,不如說:
- “魚都有鰓。”
- “所有的魚都屬于水生脊椎類動物。”
- “水生脊椎類的魚都是有鰓的。”
在書面表達中,清晰度通常是通過標點符號來實現的,例如在關系子句周圍加逗號。在子句邏輯中,這種區別反映在結論和條件之間的差異上。
這些例子表明,條件和結論之間的區別和關系是認知框架的基本方面,支持了這樣一個概念,即具有條件形式的子句邏輯是理解心理表征的可靠模型。
3.標準FOL與子句邏輯的比較
在人工智能的知識表示領域,已經探索了各種邏輯系統,其中子句邏輯通常被定位為傳統一階邏輯(FOL)的替代方案。盡管它很簡單,但子句邏輯被證明是建模認知過程的有力候選者。
子句邏輯通過其簡單的條件格式將其與標準FOL區分開來,同時保持了相當的表達力。與依賴顯式存在量詞的FOL不同,子句邏輯使用Skolemization將標識符分配給假設的實體,(例如e1000和book21),從而保留其表達能力。此外,子句邏輯在某些方面優于FOL,特別是在與最小模型語義結合時。
子句邏輯中的推理明顯比標準FOL更簡單,主要涉及正向推理和反向推理過程。這種簡單性擴展到默認推理,包括在最小模型語義框架內處理失敗否定。
標準FOL和子句邏輯之間的關系反映了自然語言和假設思維語言(LOT)之間的關系。這兩個系統都涉及兩個推理階段:第一階段將語句轉換為標準格式,而第二階段則利用這種格式進行推理。
在FOL中,初始推理規則用于將句子轉換為子句形式,例如Skolemization和邏輯轉換(例如,將?(A∨B)轉換為?A∧?B)。隨后的推理就涉及到用這種子句形式進行推理,例如從?X(XP(X))推導出P(t),這是正向推理和反向推理不可或缺的過程。
就像自然語言提供多種方式來傳達相同的信息一樣,FOL提供了等效語句的許多復雜表示。例如,“所有的魚都有鰓”的斷言可以在自由語言中以各種方式表示,但子句邏輯將其簡化為規范形式,以子句為例:鰓(X)←魚(X)和魚(Alia)。
因此,子句邏輯與FOL的關系類似于LOT與自然語言的關系。正如LOT作為自然語言表達式的精簡和明確版本一樣,子句邏輯提供了FOL的簡化版本和規范版本。這種比較強調了子句邏輯作為認知表征基礎模型的可行性。
在人工智能中,子句邏輯已被證明是一種有效的知識表示框架,獨立于代理使用的通信語言。對于人類的交流,通過與LOT保持一致,子句邏輯提供了一種更清晰、更連貫地表達想法的方法。通過將新信息與現有知識整合,子句邏輯促進了更好的連貫性和理解,利用其與連接主義表示的兼容性,在連接主義表示中,信息被組織在目標和信念的網絡中[Aditya Amin, 2018]。
子句邏輯的連接主義解釋
正如子句邏輯將一階邏輯(FOL)重新表述為規范形式一樣,連接圖證明過程通過連接主義框架來適應子句邏輯。這種方法包括預先計算和建立條件和結論之間的連接,同時用它們各自的統一替換標記這些連接。然后可以根據需要激活這些預先計算的連接,無論是向前還是向后。頻繁激活的連接可以簡化為快捷方式,類似于啟發式規則和刺激-反應模式。
雖然子句邏輯基本上是一種符號表示,但一旦建立了聯系及其統一的替代,謂詞符號的具體名稱就變得無關緊要了。隨后的推理主要涉及這些連接的激活和新分句的生成。新新子句繼承了其前身的連接,在許多情況下,一旦連接被充分利用,過時或冗余的父子句就可以被丟棄或覆蓋。
連接可以在任何一點被激活,但當由于新的觀察或通信而將新的子句引入圖中時,激活它們會更有效。激活可以根據觀察和目標的相對重要性(或效用)來確定優先級。此外,可以根據統計數據對不同的連接進行加權,這些數據反映了這些連接在過去產生有益結果的頻率。
圖2目標和信念之間關系的簡化連接圖
需要注的是,只有D、F和H與現實世界的元素直接相關。B、C和A是代理用來組織其思想和管理其行為的認知結構。E和G的狀態仍未確定。此外,如果D然后((E和F)或(G和H)),則可以通過較低級別目標實現更直接的方法。
根據鏈接權重,觀察和目標強度在整個圖中進行分配。激活過程類似于Maes的激活網絡,并結合了ALP風格的正向推理和反向推理與最佳優先搜索方法。
盡管連接圖模型可能表明思維缺乏語言或邏輯屬性,但連接圖和子句邏輯之間的區別類似于優化的低級實現和高級問題表示之間的區別。
這個模型支持這樣一種觀點,即思維在很大程度上是獨立于自然語言的。雖然LOT可能有助于開發自然語言,但并不取決于它。
此外,連接圖模型表明,代用自然語言表達思想類似于將低級程序翻譯成高級規范。正如反編譯程序很復雜一樣,這也可以解釋表達思想可能具有挑戰性的原因。
1.量化不確定性
在匯編圖中,存在內部鏈接來組織代理的認知過程,以及外部鏈接將這些過程與現實世界連接起來。外部鏈接通過觀察和代理的行為被激活,也可能涉及未觀察到的世界屬性。代理可以針對這些屬性制定假設,并評估其可能性。
這些假設的概率會影響代理行為的預期結果。例如:
- 如果你購買了一張彩票并且中獎,你會變得富有。
- 如果你表演一場虔誠的祈雨舞,并得到神靈的保祐,有可能會下雨。
雖然你可以控制某些行為,例如買彩票或表演祈雨舞,但你不能總是影響他人的行為或全球狀況,如果彩票號碼是否中獎或神靈是否保祐。充其量可以估計滿足這些條件的概率(例如百萬分之一)。David Poole[1997]證明,將概率與這些假設相結合,使ALP具有與貝葉斯網絡相似的能力。
增強決策能力
應對世界的不確定性對決策提出了重大挑戰。傳統的決策理論通常通過做出某些假設來簡化這種復雜性。最具局限性的假設之一是,所有可能的選擇都是預先確定的。例如,在尋找一份新工作時,經典決策理論假設所有潛在的工作機會都是事先知道的,并且只關注于選擇可能產生最佳結果的選項。
決策分析通過強調各種選項背后的目標,提供非正式的策略來改進決策。ALP代理模型提供了一種結構化的方法來形式化這些策略,將它們與人類認知的魯棒模型集成在一起。具體來說,它展示了預期效用(經典決策理論的基石)如何通過最佳優先搜索技術指導對備選方案的探索。此外,它說明了啟發式甚至刺激-反應模式如何補充邏輯推理和決策理論,反映了雙過程模型的原理。
結論
此次探討強調了ALP代理模型(借鑒人工智能的進步)提升人類智力的兩種關鍵方式。它幫助人們更清晰、更連貫地表達自己的想法,同時也提高了決策能力。相信應用這些方法代表了一個有前途的研究方向,促進了人工智能專家和人文領域學者之間的合作。
參考文獻
[1] [Carlson et al., 2008] Kurt A. Carlson, Chris Janiszewski, Ralph L. Keeney, David H. Krantz, Howard C. Kunreuther, Mary Frances Luce, J. Edward Russo, Stijn M. J. van Osselaer and Detlof von Winterfeldt. A theoretical framework for goal-based choice and for prescriptive analysis. Marketing Letters, 19(3-4):241- 254.
[2] [Hammond et al., 1999] John Hammond, Ralph Keeney, and Howard Raiffa. Smart Choices - A practical guide to making better decisions. Harvard Business School Press.
[3] [Kahneman, and Frederick, 2002] Daniel Kahneman and Shane Frederick. Representativeness revisited: attribute substitution in intuitive judgment. In Heuristics and Biases – The Psychology of Intuitive Judgement. Cambridge University Press.
[4] [Keeney, 1992] Ralph Keeney. Value-focused thinking: a path to creative decision-making. Harvard University Press.
[5] [Maes, 1990] Pattie Maes. Situated agents can have goals. Robot. Autonomous Syst. 6(1-2):49-70.
[6] [Poole, 1997] David Poole. The independent choice logic for modeling multiple agents under uncertainty. Artificial Intelligence, 94:7-56.
原文標題:??Human Introspection With Machine Intelligence??,作者:vuppulapati Chandra Sekhar Naidu
