向“我懂你”邁進(jìn):機(jī)器人實現(xiàn)“換位思考”
“你是機(jī)器人嗎?為什么不能站在我的位置上想想?”
每當(dāng)人們發(fā)生爭執(zhí)時,這種“靈魂拷問”總讓人啞口無言。
然而,現(xiàn)實是,也許現(xiàn)在的機(jī)器人比你更懂得“換位思考”。
近日,中國科學(xué)院自動化研究所研究員、類腦智能研究中心副主任曾毅團(tuán)隊提出機(jī)器人類腦思維揣測模型,實現(xiàn)了機(jī)器人的自我經(jīng)驗學(xué)習(xí),使其可以對他人信念進(jìn)行揣測和預(yù)測,這種“換位思考”距離“我懂你”更進(jìn)一步,相關(guān)研究成果發(fā)表于Frontiers in Neurorobotics。
曾毅在接受《中國科學(xué)報》采訪時表示:“類腦思維揣測模型為將來智能體獲得更深刻的情感共情奠定了基礎(chǔ),只有具備認(rèn)知共情與情感共情等能力,才能使未來人工智能與人類和諧共生。”
機(jī)器人正在進(jìn)行“不透明—透明眼罩測試”。 曾毅供圖
從“冷冰冰”走向“我懂你”
智能體的思維揣測模型旨在使人工智能獲得思維揣測的能力,簡單而言,就是幫機(jī)器人實現(xiàn)“換位思考”。
然而,思維揣測作為一種高級認(rèn)知功能,其神經(jīng)基礎(chǔ)和神經(jīng)機(jī)制尚未明確。
“如何結(jié)合現(xiàn)有研究基礎(chǔ),探索思維揣測機(jī)制,構(gòu)建可行的類腦思維揣測理論模型是需要解決的關(guān)鍵問題。”曾毅表示。
為此,曾毅團(tuán)隊結(jié)合認(rèn)知心理學(xué)、神經(jīng)影像學(xué)、腦科學(xué)等學(xué)科在思維揣測領(lǐng)域的成果,確定了思維揣測的神經(jīng)基礎(chǔ),并采用脈沖神經(jīng)網(wǎng)絡(luò)對所涉腦區(qū)進(jìn)行認(rèn)知功能建模,詳細(xì)構(gòu)建了腦區(qū)間信息環(huán)路的連接結(jié)構(gòu)。
此外,曾毅團(tuán)隊還融合抑制控制機(jī)制,構(gòu)建了類腦思維揣測模型,使智能體可以利用自身經(jīng)驗完成對其他個體信念的推理。
“這是繼機(jī)器人通過鏡像測試,獲得初步自我感知能力后開展的又一次大膽嘗試。”曾毅說。
從“類腦”走向“類人”
與其他模型不同,曾毅團(tuán)隊提出的思維揣測模型強(qiáng)調(diào)自身經(jīng)驗和腦區(qū)發(fā)育對思維揣測能力的影響。
研究人員模擬了包括顳頂聯(lián)合區(qū)、內(nèi)側(cè)前額葉在內(nèi)的多個腦區(qū)及腦區(qū)間信息傳遞的通路,特別是額下回和顳頂聯(lián)合區(qū)的自我視角抑制、額下回和腹內(nèi)側(cè)前額葉的自我信念抑制,然后將模型部署到機(jī)器人上,通過“不透明—透明眼罩測試”驗證了模型的效果。
該眼罩測試包括訓(xùn)練和測試部分。首先將機(jī)器人分為兩組,一組為“不透明眼罩組”,一組為“透明眼罩組”,兩組外觀一致。
在訓(xùn)練中,首先將瓢蟲放在兩個黑色矩形框中的一個上,然后分別將不透明眼罩和透明眼罩插入到機(jī)器人和物體之間,問機(jī)器人“瓢蟲在哪”,使機(jī)器人學(xué)習(xí)眼罩的特性。
隨后,研究團(tuán)隊開展了讓被試機(jī)器人(紅色機(jī)器人)推理表演機(jī)器人(藍(lán)色機(jī)器人)信念的測試。
首先,研究人員將瓢蟲放在其中一個黑色矩形框上,再將瓢蟲藏在黃色盒子中,隨后將眼罩插入到藍(lán)色機(jī)器人和瓢蟲之間,然后又將瓢蟲藏在綠色盒子中,最后將眼罩移開。
“對藍(lán)色機(jī)器人來說,瓢蟲在哪里?” 當(dāng)研究人員向紅色機(jī)器人提問時,根據(jù)自身經(jīng)驗的不同,“透明眼罩組”的紅色機(jī)器人和藍(lán)色機(jī)器人對物體位置的信念一致,都會指向綠色盒子;而“不透明眼罩組”紅色機(jī)器人會指向黃色盒子。
隨后,研究人員又向紅色機(jī)器人提問:“對你自己來說,瓢蟲在哪里?”結(jié)果顯示,“不透明眼罩組”和“透明眼罩組”的紅色機(jī)器人都會指向綠色盒子。
曾毅解釋道:“抑制控制是思維揣測過程中的重要機(jī)制,我們認(rèn)為額下回和顳頂聯(lián)合區(qū)之間、額下回和腹內(nèi)側(cè)前額葉之間的成熟連接是自我視角抑制和自我信念抑制的神經(jīng)基礎(chǔ)。”
為驗證抑制控制對實驗的影響,曾毅團(tuán)隊設(shè)定了不同的連接強(qiáng)度。
研究發(fā)現(xiàn),當(dāng)額下回和顳頂聯(lián)合區(qū)的連接未成熟時,被試機(jī)器人無法抑制自我感知的信息,因此無法正確推理表演機(jī)器人對物體位置的信念;當(dāng)額下回和顳頂聯(lián)合區(qū)的連接成熟,但額下回和腹內(nèi)側(cè)前額葉的連接未成熟時,雖然被試機(jī)器人可以正確推理表演機(jī)器人對物體位置的信念,但無法抑制自身的信念。
當(dāng)這些連接都成熟時,被試機(jī)器人不僅可以抑制自我感知的信息,還能抑制自我信念。
從“學(xué)習(xí)”走向“遵守”
論文主要作者之一趙宇軒說:“我們通過降低額下回和顳頂聯(lián)合區(qū)之間、額下回和腹內(nèi)側(cè)前額葉的連接強(qiáng)度使抑制控制機(jī)制失效,計算模型顯示無法正確輸出從他人視角感知的信息和推理他人的信念,同時機(jī)器人在行為上也無法通過測試。因此,從計算建模的角度可以證明抑制控制是思維揣測的核心機(jī)制之一。”
對于未來的計劃,曾毅坦言:“對思維揣測的計算建模,構(gòu)建具有思維揣測能力的智能體只是第一步。接下來,要將類腦思維揣測模型應(yīng)用于使智能體自主習(xí)得與環(huán)境、其他智能體以及人類交互過程中應(yīng)當(dāng)遵守的‘道德’規(guī)范。”
美國卡內(nèi)基·梅隆大學(xué)心理學(xué)博士、上海交通大學(xué)凱原法學(xué)院訪問特聘教授秦裕林認(rèn)為,為了使人工智能技術(shù)健康發(fā)展并造福人類,既要從法律法規(guī)層面預(yù)防、制止可能有損人類根本利益的人工智能技術(shù),也要倡導(dǎo)符合人類根本利益、負(fù)責(zé)任的人工智能技術(shù)。“在這一方面,曾毅團(tuán)隊邁出了可喜的一步。”