智能對(duì)話(huà)新紀(jì)元:跨文化視角下的人工智能會(huì)話(huà)代理(Agents)解析
人工智能(AI)已成為我們?nèi)粘I钪胁豢苫蛉钡囊徊糠帧L貏e是AI會(huì)話(huà)代理(Conversational Agents),如Siri、Alexa和其他聊天機(jī)器人,它們通過(guò)提供信息、娛樂(lè)和陪伴,極大地豐富了我們的數(shù)字體驗(yàn)。但是公眾對(duì)這些AI代理的看法卻因文化背景而異,這種差異對(duì)于AI技術(shù)的設(shè)計(jì)、開(kāi)發(fā)和全球推廣具有重要意義。
最近的一項(xiàng)研究《Understanding Public Perceptions of AI Conversational Agents: A Cross-Cultural Analysis》深入探討了美國(guó)和中國(guó)兩個(gè)文化背景下公眾對(duì)AI會(huì)話(huà)代理的看法。研究團(tuán)隊(duì)通過(guò)分析近一百萬(wàn)條社交媒體帖子,揭示了兩國(guó)公眾在討論話(huà)題和對(duì)AI代理感知上的顯著差異。這項(xiàng)研究不僅提供了對(duì)AI會(huì)話(huà)代理公眾感知的新見(jiàn)解,而且對(duì)于AI技術(shù)的跨文化適應(yīng)性提出了重要建議。
研究發(fā)現(xiàn),中國(guó)用戶(hù)傾向于將AI代理人格化,將其視為具有情感的伙伴,而美國(guó)用戶(hù)則更多地將AI代理視為完成任務(wù)的工具。這種差異反映了文化價(jià)值觀和社會(huì)結(jié)構(gòu)對(duì)AI技術(shù)感知的深遠(yuǎn)影響。例如,中國(guó)的技術(shù)擬人主義文化傾向可能鼓勵(lì)用戶(hù)與AI代理建立情感聯(lián)系,而西方文化中人與非人實(shí)體的明顯區(qū)別則可能導(dǎo)致美國(guó)用戶(hù)對(duì)AI代理持更實(shí)用主義的態(tài)度。
研究還指出,除了文化差異外,政治經(jīng)濟(jì)環(huán)境和技術(shù)系統(tǒng)也在塑造公眾對(duì)AI會(huì)話(huà)代理感知中發(fā)揮作用。在中國(guó),政府政策和戰(zhàn)略以及主流媒體對(duì)AI的描述可能導(dǎo)致公眾討論更加抽象和戰(zhàn)略性。相比之下,美國(guó)的討論更多關(guān)注實(shí)際市場(chǎng)應(yīng)用和商業(yè)發(fā)展,反映了市場(chǎng)力量和企業(yè)家精神在塑造新興技術(shù)公共話(huà)語(yǔ)中的作用。
此外,研究強(qiáng)調(diào)了在AI會(huì)話(huà)代理設(shè)計(jì)中考慮文化和結(jié)構(gòu)性因素的重要性。例如,中國(guó)用戶(hù)對(duì)具有物理實(shí)體和語(yǔ)音特性的AI代理的溫暖和能力感知更高,這表明在為中國(guó)市場(chǎng)設(shè)計(jì)AI代理時(shí),開(kāi)發(fā)者應(yīng)考慮加入這些特性。然而,這些設(shè)計(jì)選擇可能不適合西方消費(fèi)者,因此需要采取具有情境意識(shí)的設(shè)計(jì)方法。
人工智能會(huì)話(huà)代理(AI Conversational Agents)是一種先進(jìn)的技術(shù),它能夠通過(guò)自然語(yǔ)言處理(NLP)與人類(lèi)進(jìn)行交流和互動(dòng)。這些代理的設(shè)計(jì)旨在模仿人類(lèi)的交流方式,提供信息、解答問(wèn)題、執(zhí)行任務(wù),甚至在某些情況下提供陪伴。隨著技術(shù)的進(jìn)步,CAs的應(yīng)用范圍不斷擴(kuò)大,它們的智能程度和互動(dòng)質(zhì)量也在不斷提高。
本篇論文的作者來(lái)自于新加坡國(guó)立大學(xué)的Zihan Liu、Han Li、Renwen Zhang、Yi-Chieh Lee和香港大學(xué)的Anfan Chen,他們是跨文化通信和人工智能領(lǐng)域的專(zhuān)家,他們通過(guò)深入的社交媒體分析,探索了美國(guó)和中國(guó)公眾對(duì)CAs的不同看法。作者的研究背景為本文提供了堅(jiān)實(shí)的理論基礎(chǔ)和豐富的實(shí)踐經(jīng)驗(yàn),使得研究結(jié)果具有高度的可靠性和深遠(yuǎn)的影響力。
論文的創(chuàng)新點(diǎn)在于其跨文化的研究視角和綜合的分析方法。作者不僅考慮了文化價(jià)值、政治經(jīng)濟(jì)和技術(shù)系統(tǒng)等多種因素如何共同影響公眾對(duì)CAs的感知,而且還提出了“溫暖優(yōu)先”的設(shè)計(jì)方法,為未來(lái)CAs的開(kāi)發(fā)提供了新的指導(dǎo)原則。
背景介紹
當(dāng)前AI會(huì)話(huà)代理在不同文化中的應(yīng)用現(xiàn)狀呈現(xiàn)出多樣化的趨勢(shì),在一些文化中,CAs被廣泛用于提供客戶(hù)支持和個(gè)人助理服務(wù),而在其他文化中,CAs則更多地用于教育和娛樂(lè)。這種差異不僅反映了不同文化對(duì)技術(shù)的接受度和應(yīng)用方式的差異,也揭示了CAs設(shè)計(jì)和功能的多樣性。
跨文化分析在AI研究中具有重要意義,它有助于揭示不同文化背景下用戶(hù)對(duì)CAs的期望和需求。然而這也帶來(lái)了挑戰(zhàn),因?yàn)槲幕町惪赡軐?dǎo)致用戶(hù)對(duì)CAs的感知和使用方式產(chǎn)生根本性的不同。
這項(xiàng)研究著重于文化背景和會(huì)話(huà)代理(CAs)不同類(lèi)型的技術(shù)特性,以深入了解人們?cè)诳缥幕涂缣匦詫用嫔蠈?duì)CAs的討論和看法。研究表明,人類(lèi)對(duì)實(shí)體的感知通常涉及復(fù)雜的認(rèn)知和情感過(guò)程,尤其是在遇到像聊天機(jī)器人這樣的新穎和復(fù)雜技術(shù)時(shí)。因此,使用多維框架來(lái)避免在捕捉人們對(duì)CAs的看法時(shí)過(guò)度簡(jiǎn)化或誤解是必要的。在評(píng)估人類(lèi)的感知和認(rèn)知時(shí),溫暖度、能力和情感價(jià)值通常被認(rèn)為是表征社會(huì)認(rèn)知不同方面的關(guān)鍵維度。溫暖度是評(píng)估非人類(lèi)實(shí)體人性化程度的重要方面,與CA對(duì)用戶(hù)的情感價(jià)值相關(guān),并可以預(yù)測(cè)信任、可信度和與CAs互動(dòng)的意愿。另一方面,能力與實(shí)用和功能性方面密切相關(guān),表示CA根據(jù)其知識(shí)、技能和溝通能力有效響應(yīng)請(qǐng)求的程度。能力經(jīng)常被納入功能性和可用性評(píng)估,并與客戶(hù)滿(mǎn)意度和促銷(xiāo)信息的說(shuō)服力相關(guān)。相比之下,情感價(jià)值代表了人們對(duì)CAs的感知和經(jīng)驗(yàn)背后的更廣泛情感基調(diào),有助于形成對(duì)CAs感知的總體印象。
研究方法和數(shù)據(jù)來(lái)源
論文中使用了社交媒體分析作為主要的研究方法。通過(guò)分析Twitter和微博上與CAs相關(guān)的數(shù)百萬(wàn)條帖子,作者能夠捕捉到公眾對(duì)CAs的真實(shí)看法和情感態(tài)度。數(shù)據(jù)收集過(guò)程涉及復(fù)雜的數(shù)據(jù)清洗和篩選工作,確保分析的準(zhǔn)確性和相關(guān)性。分析工具包括自然語(yǔ)言處理軟件和情感分析算法,這些工具幫助研究者從大量的文本數(shù)據(jù)中提取有價(jià)值的信息。
CAs作為AI應(yīng)用的一個(gè)獨(dú)特部分,也引起了復(fù)雜和矛盾的態(tài)度和情緒。這些軟件程序能夠通過(guò)基于文本和/或基于語(yǔ)音的界面與用戶(hù)進(jìn)行自然語(yǔ)言交流。它們?cè)诳蛻?hù)支持、醫(yī)療保健、金融、智能家居和其他各個(gè)領(lǐng)域的廣泛整合,使它們不僅成為便利工具,也成為審查的對(duì)象。盡管對(duì)一般AI和機(jī)器人學(xué)的討論很廣泛,但對(duì)公眾對(duì)CAs的看法的研究卻明顯不足。這表明了一個(gè)重要的研究空白,特別是考慮到CAs在數(shù)百萬(wàn)人的日常生活中的廣泛應(yīng)用。現(xiàn)有研究雖然有價(jià)值,但通常范圍較窄,針對(duì)的是特定領(lǐng)域中CAs的看法,如客戶(hù)服務(wù)、新聞業(yè)和醫(yī)療保健。此外,研究通常側(cè)重于特定的CA產(chǎn)品,如Alexa、Replika和小冰。因此,公眾對(duì)CAs的全面理解仍然未被充分探索。
要深入了解人們對(duì)CAs的看法,需要有效理解這些代理如何被感知和解釋。從歷史上看,溫暖(友好與不友好)、能力(聰明與愚蠢)和價(jià)值(好與壞)一直是概念化社會(huì)感知的關(guān)鍵維度。其中,溫暖和能力是評(píng)估對(duì)個(gè)人和群體的社會(huì)認(rèn)知的普遍標(biāo)志。簡(jiǎn)而言之,溫暖衡量與感知意圖相關(guān)的特征,如真誠(chéng)和可信度,而能力評(píng)估與感知能力相關(guān)的屬性,如智力和效能。許多研究強(qiáng)調(diào)了它們?cè)诮忉屔鐣?huì)感知的大部分變異中的主導(dǎo)作用,從接近-回避傾向到理解動(dòng)機(jī)。雖然最初是為了人類(lèi)認(rèn)知而設(shè)定的,但溫暖和能力也被用來(lái)理解人們對(duì)非人類(lèi)實(shí)體的看法,如機(jī)器人。
研究表明,文化、規(guī)范、經(jīng)驗(yàn)、教育、認(rèn)知推理風(fēng)格和依戀等因素會(huì)影響用戶(hù)對(duì)AI代理的反應(yīng)。跨文化價(jià)值結(jié)構(gòu)的研究揭示了美國(guó)和阿拉伯聯(lián)合酋長(zhǎng)國(guó)(UAE)用戶(hù)在與算法驅(qū)動(dòng)的聊天機(jī)器人新聞互動(dòng)時(shí)的明顯差異,美國(guó)用戶(hù)主要關(guān)注與公平、問(wèn)責(zé)和透明度(FAT)相關(guān)的程序性維度,而UAE用戶(hù)則更被算法的功能性能所吸引。此外,日本用戶(hù)優(yōu)先考慮聊天機(jī)器人的功能性質(zhì),與重視非功能性算法方面的美國(guó)用戶(hù)形成對(duì)比。這些文化差異不僅僅體現(xiàn)在感知上,還包括對(duì)AI聊天機(jī)器人的不同擔(dān)憂(yōu)和優(yōu)先事項(xiàng)。這種差異強(qiáng)調(diào)了在探討公眾對(duì)CAs的感知和討論時(shí)需要跨文化視角的必要性。
研究提出的第一個(gè)研究問(wèn)題是:RQ1: 美國(guó)和中國(guó)之間在CAs的(a)討論主題和(b)公眾感知(即溫暖度、能力和情感價(jià)值)方面有何差異?
除了文化,CAs的分類(lèi)也在塑造公眾感知方面發(fā)揮著重要作用。CAs根據(jù)其設(shè)計(jì)、互動(dòng)風(fēng)格和功能的不同,呈現(xiàn)出多種形式。以往的人機(jī)交互(HCI)工作提出了多種框架來(lái)對(duì)CAs進(jìn)行分類(lèi)。例如,Grudin和Jacques將聊天機(jī)器人根據(jù)其互動(dòng)的深度和廣度分類(lèi)為三種類(lèi)型:虛擬伴侶、智能助手和任務(wù)導(dǎo)向型聊天機(jī)器人。F?lstad等人建議根據(jù)互動(dòng)持續(xù)時(shí)間(短期和長(zhǎng)期)和控制點(diǎn)(用戶(hù)驅(qū)動(dòng)和聊天機(jī)器人驅(qū)動(dòng))進(jìn)行分類(lèi)。Hussain等人深入到設(shè)計(jì)技術(shù)和方法,引入了四個(gè)設(shè)計(jì)維度來(lái)區(qū)分CAs:互動(dòng)模式、知識(shí)領(lǐng)域、目標(biāo)和設(shè)計(jì)方法。隨著非具象會(huì)話(huà)代理和對(duì)話(huà)系統(tǒng)越來(lái)越多地整合到如機(jī)器人和具象會(huì)話(huà)代理(ECAs)等多功能互動(dòng)平臺(tái)中,這些CAs的物理和視覺(jué)表現(xiàn)為CA的特征增加了另一個(gè)關(guān)鍵層面。Rzepka和Berger指出了人類(lèi)外觀和物理體現(xiàn)在表征AI系統(tǒng)時(shí)的重要性。這些非言語(yǔ)屬性提供了重要的社會(huì)存在線索,可能會(huì)影響用戶(hù)如何感知和與CAs互動(dòng)。正如Modality-Agency-Interactivity-Navigability(MAIN)模型所建議的,界面線索通過(guò)觸發(fā)關(guān)于互動(dòng)性質(zhì)和實(shí)質(zhì)的認(rèn)知啟發(fā)式,塑造用戶(hù)感知。
跨文化公眾感知分析
美國(guó)和中國(guó)公眾對(duì)AI會(huì)話(huà)代理的看法存在顯著差異。美國(guó)用戶(hù)傾向于強(qiáng)調(diào)CAs的實(shí)用性和效率,而中國(guó)用戶(hù)則更加重視CAs的社交和情感功能。這些差異不僅反映了文化價(jià)值觀的不同,也與兩國(guó)在政治經(jīng)濟(jì)和技術(shù)系統(tǒng)方面的差異有關(guān)。
圖片
圖1:美國(guó)和中國(guó)公眾對(duì)CA的看法注:中的顏色 圖表示聯(lián)想的方向,綠色表示傾向于積極(溫暖、能干、積極),紅色表示傾向于消極(寒冷、無(wú)能、消極)。顏色的深度影響關(guān)聯(lián)的強(qiáng)度,淺色表示更大的中性,深色表示更極端的關(guān)聯(lián)。
文化價(jià)值、政治經(jīng)濟(jì)和技術(shù)系統(tǒng)共同塑造了公眾對(duì)CAs的感知。例如,中國(guó)用戶(hù)對(duì)CAs的積極態(tài)度可能受到政府對(duì)AI技術(shù)支持的環(huán)境和主流媒體的積極報(bào)道的影響。相比之下,美國(guó)用戶(hù)的態(tài)度則更受市場(chǎng)力量和商業(yè)發(fā)展的影響。
在個(gè)人互動(dòng)與體驗(yàn)方面,這一元主題涵蓋了從個(gè)人角度出發(fā)的與CA相關(guān)的討論,包括用戶(hù)與CA的實(shí)際互動(dòng)及其相關(guān)的體驗(yàn)和情感。在這一元主題中,存在三個(gè)不同的子主題:“任務(wù)導(dǎo)向互動(dòng)”、“社交導(dǎo)向互動(dòng)”和“體驗(yàn)與觀點(diǎn)”。在美國(guó),任務(wù)導(dǎo)向互動(dòng)更為突出,占推文的44.2%,而在中國(guó),這一數(shù)字要低得多,僅占微博帖子的10.9%。這種差異表明,美國(guó)用戶(hù)主要將CAs用于功能性和實(shí)用性目的,依賴(lài)它們簡(jiǎn)化日常任務(wù)。相比之下,中國(guó)用戶(hù)更傾向于社交導(dǎo)向互動(dòng),他們以更多對(duì)話(huà)和情感表達(dá)的方式與CAs互動(dòng),代表性術(shù)語(yǔ)包括“調(diào)情”、“笑話(huà)”和“戲弄”。這些社交導(dǎo)向互動(dòng)在中國(guó)的討論中占16.8%,而在美國(guó)的推文中僅占3.7%。此外,還發(fā)現(xiàn)了大量與用戶(hù)表達(dá)他們對(duì)CA的情感、態(tài)度和想法(無(wú)論是積極還是消極)相關(guān)的帖子。這被歸類(lèi)為“體驗(yàn)與觀點(diǎn)”,頂級(jí)術(shù)語(yǔ)包括“有用”、“可愛(ài)”和“愛(ài)”。中國(guó)用戶(hù)更傾向于分享此類(lèi)體驗(yàn)和觀點(diǎn),34.3%的帖子屬于此類(lèi)別,而美國(guó)用戶(hù)的推文中這一比例為17.3%。
在文化和技術(shù)在塑造公眾對(duì)CAs感知方面的作用和相互作用上,一個(gè)重要發(fā)現(xiàn)是美國(guó)和中國(guó)人民與CAs互動(dòng)的顯著差異。中國(guó)用戶(hù)傾向于以更社交和情感表達(dá)的方式接近CAs,而美國(guó)用戶(hù)則采取更注重任務(wù)的互動(dòng)方式。有趣的是,在中國(guó)用戶(hù)中,大量討論集中在智能助手(如Siri)的享樂(lè)性和社會(huì)情感使用上,盡管這些CAs最初是為實(shí)用目的而設(shè)計(jì)的。這一趨勢(shì)的一個(gè)可能解釋是植根于中國(guó)文化的精神基礎(chǔ),特別是技術(shù)擬人主義的概念。這種信念與許多其他東亞文化共享,并圍繞著非人類(lèi)實(shí)體(包括機(jī)器或人工智能)可以擁有靈魂或精神的想法。因此,技術(shù)擬人主義的文化價(jià)值可能鼓勵(lì)中國(guó)用戶(hù)將CAs,特別是那些具有更多擬人特征的CAs,視為具有情感的實(shí)體,使它們能夠形成情感聯(lián)系并成為能夠建立融洽關(guān)系的好伙伴。這與西方個(gè)體的觀點(diǎn)形成鮮明對(duì)比,后者通常將CAs等非人類(lèi)代理視為旨在服務(wù)人類(lèi)目的的工具。在西方文化中,人類(lèi)被視為與非人類(lèi)實(shí)體有明顯區(qū)別的獨(dú)特存在。早期的Clark等人的研究也證實(shí)了這一觀點(diǎn),表明西方參與者討論與代理進(jìn)行對(duì)話(huà)的方式與與其他人進(jìn)行對(duì)話(huà)的方式有顯著不同。特別是,與代理的對(duì)話(huà)始終以功能性術(shù)語(yǔ)描述,強(qiáng)調(diào)了這些互動(dòng)的實(shí)用性質(zhì)。
圖2:公眾對(duì)CA技術(shù)特征的看法:美國(guó)與中國(guó)。
通過(guò)這樣的分析,作者不僅揭示了文化和結(jié)構(gòu)性因素如何影響公眾對(duì)CAs的感知,還為未來(lái)CAs的設(shè)計(jì)和開(kāi)發(fā)提供了寶貴的見(jiàn)解。這些見(jiàn)解有助于開(kāi)發(fā)者在不同文化背景下設(shè)計(jì)出更符合用戶(hù)需求和期望的CAs。
論文創(chuàng)新點(diǎn)解讀
在《Understanding Public Perceptions of AI Conversational Agents: A Cross-Cultural Analysis》一文中,作者提出了一個(gè)獨(dú)特的設(shè)計(jì)理念——“溫暖優(yōu)先”方法。這種方法強(qiáng)調(diào)在設(shè)計(jì)會(huì)話(huà)代理時(shí),應(yīng)優(yōu)先考慮其能夠激發(fā)用戶(hù)情感價(jià)值和積極情感的能力。研究表明,用戶(hù)對(duì)CAs的溫暖感知與他們的積極情感之間存在穩(wěn)定的正相關(guān)關(guān)系,這種關(guān)系超過(guò)了能力感知與情感價(jià)值之間的關(guān)聯(lián)。因此,設(shè)計(jì)師應(yīng)當(dāng)集中于增強(qiáng)CAs的親和力和情感交互能力,以提升用戶(hù)體驗(yàn)。
結(jié)構(gòu)性因素,如文化背景、政治經(jīng)濟(jì)環(huán)境和技術(shù)發(fā)展水平,對(duì)AI會(huì)話(huà)代理的接受度和用戶(hù)感知有著深遠(yuǎn)的影響。例如,中國(guó)用戶(hù)對(duì)CAs的積極態(tài)度可能受到政府對(duì)AI技術(shù)支持的環(huán)境和主流媒體的積極報(bào)道的影響,而美國(guó)用戶(hù)的態(tài)度則更受市場(chǎng)力量和商業(yè)發(fā)展的影響。
在人機(jī)交互領(lǐng)域,物理體現(xiàn)涉及技術(shù)實(shí)體或代理在物理世界中擁有的物理存在或表征程度。這包括為數(shù)字或虛擬實(shí)體提供一個(gè)有形的、互動(dòng)的形式,以促進(jìn)與環(huán)境和用戶(hù)的互動(dòng)。Von der Putten等人認(rèn)為,一個(gè)自主代理的社會(huì)影響與它展示的行為現(xiàn)實(shí)水平密切相關(guān)。會(huì)話(huà)代理可能是有體現(xiàn)的或無(wú)體現(xiàn)的。Kontogiorgos等人的工作將體現(xiàn)概念應(yīng)用于社交機(jī)器人和智能揚(yáng)聲器,并探討了不同CA體現(xiàn)對(duì)用戶(hù)對(duì)失敗的感知及其對(duì)CAs的后續(xù)行為的影響。值得注意的是,他們發(fā)現(xiàn)用戶(hù)在感知智能和社會(huì)存在方面將社交機(jī)器人體現(xiàn)評(píng)價(jià)得比智能揚(yáng)聲器更高。當(dāng)體現(xiàn)的形式是物理的而不是虛擬的時(shí),體現(xiàn)的效果更加明顯。Li的33項(xiàng)實(shí)驗(yàn)研究綜述發(fā)現(xiàn),物理呈現(xiàn)的機(jī)器人代理比虛擬角色中的遠(yuǎn)程呈現(xiàn)被更積極地感知。
因此,對(duì)話(huà)焦點(diǎn)、對(duì)話(huà)模式、類(lèi)人外觀和物理體現(xiàn)代表了定義CA在其對(duì)話(huà)和表征中的重要維度。探索公眾對(duì)CAs的感知如何在這些定義特征中變化,可以幫助研究人員理解技術(shù)特性如何在塑造社會(huì)認(rèn)知中發(fā)揮作用。據(jù)此,我們提出以下研究問(wèn)題:RQ2: 人們對(duì)CAs的感知如何因1) 對(duì)話(huà)焦點(diǎn);2) 對(duì)話(huà)模式;3) 類(lèi)人外觀;和4) 物理體現(xiàn)而異?基于這三個(gè)研究問(wèn)題,我們提出了分析框架(見(jiàn)圖3)
設(shè)計(jì)建議和實(shí)際應(yīng)用
為了探討公眾對(duì)會(huì)話(huà)代理(CAs)的溫暖度、能力和情感價(jià)值的感知(RQ1(b)、RQ2、RQ3),研究者使用了詞嵌入技術(shù)來(lái)檢查個(gè)體將CAs與溫暖、能力和情感價(jià)值相關(guān)的詞匯和概念聯(lián)系在一起的程度。這種方法已經(jīng)在先前的研究中被廣泛應(yīng)用于檢查人們的社會(huì)認(rèn)知和態(tài)度,顯示出高性能和準(zhǔn)確性。
為了回答關(guān)注CAs技術(shù)特征差異的RQ2和RQ3,研究者對(duì)數(shù)據(jù)語(yǔ)料庫(kù)中提及的所有CA產(chǎn)品進(jìn)行了分類(lèi),并根據(jù)它們的對(duì)話(huà)焦點(diǎn)、對(duì)話(huà)模式、類(lèi)人外觀和物理體現(xiàn)將它們分為不同類(lèi)型。表1總結(jié)了美國(guó)和中國(guó)的CA產(chǎn)品及其分類(lèi)。
在詞嵌入中使用的關(guān)鍵算法是S-WEAT,這是Word Embedding Association Test(WEAT)的改編版本,旨在測(cè)量單一類(lèi)別與一對(duì)相對(duì)屬性之間的相對(duì)關(guān)聯(lián)度。
每個(gè)S-WEAT分析都將兩個(gè)雙極屬性(例如,“溫暖”對(duì)“冷漠”)與與CAs相關(guān)的單一類(lèi)別(例如“具有類(lèi)人外觀的CAs”)進(jìn)行比較。具體來(lái)說(shuō),研究者首先計(jì)算了CA類(lèi)別與每個(gè)屬性之間的平均余弦相似度。接下來(lái),計(jì)算了兩個(gè)平均余弦相似度得分之間的差值。正的結(jié)果值表明組類(lèi)別與正屬性(例如積極、溫暖和能力)之間的相似度更強(qiáng),而負(fù)值表明組類(lèi)別與負(fù)屬性(例如消極、冷漠和無(wú)能)之間的相似度更高。為了確保可比性,將這些差值標(biāo)準(zhǔn)化到-2到+2的范圍內(nèi)。這種標(biāo)準(zhǔn)化是通過(guò)將差值除以匯總的標(biāo)準(zhǔn)差來(lái)實(shí)現(xiàn)的。標(biāo)準(zhǔn)差是根據(jù)每個(gè)屬性詞向量在兩個(gè)屬性類(lèi)別中的平均余弦相似度得分計(jì)算的。下面的公式展示了S-WEAT統(tǒng)計(jì)量的計(jì)算方法:
圖片
設(shè)A和B為兩組大小相等的相對(duì)屬性類(lèi)別詞向量,X為社會(huì)群體類(lèi)別詞向量集。令cos(θ, γ)表示兩個(gè)向量θ和γ之間角度的余弦。然后S-WEAT統(tǒng)計(jì)量定義為:
圖片
在計(jì)算過(guò)程方面,技術(shù)上,研究者在以CA為中心的語(yǔ)料庫(kù)中使用Python的Gensim庫(kù)通過(guò)Word2Vec訓(xùn)練了自定義詞嵌入模型。這些模型將復(fù)雜的詞匯語(yǔ)義壓縮到有限的維度空間中。然后應(yīng)用S-WEAT。代表六個(gè)屬性類(lèi)別的字典(參見(jiàn)附錄以獲取完整字典和樣本帖子)來(lái)源于先前的研究。在我們訓(xùn)練的詞嵌入模型中映射屬性詞和CA產(chǎn)品并獲得代表它們的向量后,我們對(duì)這些向量執(zhí)行了S-WEAT。數(shù)值結(jié)果代表了某一類(lèi)別的CA產(chǎn)品與某一屬性之間的關(guān)聯(lián)。如果值大于零,則隨著絕對(duì)值的增加,與積極屬性(即溫暖、能力或積極)的相關(guān)性更強(qiáng)。相反,如果值小于零,則隨著絕對(duì)值的增加,與消極屬性(即冷漠、無(wú)能或消極)的相關(guān)性更強(qiáng)。
根據(jù)論文的研究結(jié)果,設(shè)計(jì)師在為不同文化背景的市場(chǎng)開(kāi)發(fā)CAs時(shí),應(yīng)考慮以下建議:
- 對(duì)于中國(guó)市場(chǎng),設(shè)計(jì)師應(yīng)考慮加入更多的語(yǔ)音特性和物理體現(xiàn),以增強(qiáng)CAs的溫暖和能力感知。
- 對(duì)于美國(guó)市場(chǎng),設(shè)計(jì)師應(yīng)關(guān)注CAs的實(shí)用性和任務(wù)執(zhí)行能力,同時(shí)確保界面簡(jiǎn)潔且易于使用。
將研究成果應(yīng)用于實(shí)際的AI會(huì)話(huà)代理開(kāi)發(fā)時(shí),開(kāi)發(fā)者應(yīng)采用用戶(hù)為中心的設(shè)計(jì)方法,密切關(guān)注用戶(hù)的挪用和重新利用技術(shù)的方式,以便不斷迭代和優(yōu)化產(chǎn)品。
論文局限性和未來(lái)研究方向
論文的局限性主要體現(xiàn)在數(shù)據(jù)來(lái)源和用戶(hù)類(lèi)型的考慮上。研究依賴(lài)于中國(guó)的微博和美國(guó)的Twitter數(shù)據(jù),可能未能全面反映所有用戶(hù)群體的看法。未來(lái)的研究可以采用跨平臺(tái)的方法,并結(jié)合社交媒體數(shù)據(jù)分析和通過(guò)調(diào)查或訪談收集的數(shù)據(jù),以獲得更全面的視角。
結(jié)論
在研究美國(guó)和中國(guó)公眾對(duì)CAs話(huà)語(yǔ)和感知的差異時(shí),作者發(fā)現(xiàn)了證據(jù),突出了文化和其他結(jié)構(gòu)性因素在塑造人們?nèi)绾螀⑴c、感知和評(píng)估CAs方面的影響力。這些廣泛的外部背景也與CAs的特定技術(shù)特性相互作用,影響與溫暖、能力和整體情感基調(diào)相關(guān)的感知。我們發(fā)現(xiàn),美國(guó)人更多關(guān)注實(shí)用和情境化的使用,而中國(guó)用戶(hù)更傾向于將CAs用于享樂(lè)性互動(dòng)。總的來(lái)說(shuō),中國(guó)人對(duì)CAs持有更積極的態(tài)度,而美國(guó)用戶(hù)展現(xiàn)了溫暖和威脅感知的矛盾混合。研究強(qiáng)調(diào)了在不同文化和國(guó)家背景下優(yōu)先考慮不同CA特性的重要性,以適應(yīng)用戶(hù)的不同偏好和行為。我們指出了優(yōu)先考慮溫暖感知、采用情境意識(shí)設(shè)計(jì)和從挪用中學(xué)習(xí)對(duì)CA設(shè)計(jì)成功的價(jià)值。
論文的主要發(fā)現(xiàn)強(qiáng)調(diào)了文化和結(jié)構(gòu)性因素在塑造人們?nèi)绾螀⑴c、感知和評(píng)估CAs方面的重要性。這些發(fā)現(xiàn)對(duì)AI領(lǐng)域的貢獻(xiàn)在于,它們提供了一個(gè)全新的視角來(lái)理解和設(shè)計(jì)未來(lái)的AI會(huì)話(huà)代理。跨文化理解在全球化AI應(yīng)用中的重要性不容忽視,它要求設(shè)計(jì)師和開(kāi)發(fā)者在開(kāi)發(fā)CAs時(shí),不僅要考慮技術(shù)的進(jìn)步,還要考慮文化的多樣性和復(fù)雜性。這篇論文為全球化AI應(yīng)用的設(shè)計(jì)和開(kāi)發(fā)提供了寶貴的指導(dǎo)和啟示。(END)
參考資料:https://arxiv.org/abs/2402.16039