大腦里裝了4億篇新聞,能與人類(lèi)自主辯論的最強(qiáng)AI辯手來(lái)了
IBM最強(qiáng)AI辯手Project Debater代表了當(dāng)前「計(jì)算辯論」研究的頂點(diǎn)。在充斥著海量信息和誤導(dǎo)文化的當(dāng)下,我們期待實(shí)現(xiàn)完全自主辯論的AI系統(tǒng)能夠促進(jìn)智能辯論的發(fā)展,幫助建立更合理的論點(diǎn),做出更明智的決策。
對(duì)于辯論的研究可以追溯到古希臘,當(dāng)時(shí)古希臘哲學(xué)家如蘇格拉底等人在市集上與人們討論政治,辯論真理,辯論內(nèi)容包羅萬(wàn)象。
蘇格拉底之死
當(dāng)下的人工智能研究一大挑戰(zhàn)就是「如何讓機(jī)器理解自然語(yǔ)言辯論中的論點(diǎn)」。
人工智能專(zhuān)家Noam Slonim
近日,IBM研究院研究員、希伯來(lái)大學(xué)人工智能專(zhuān)家Noam Slonim和團(tuán)隊(duì)公布了相關(guān)研究Project Debater的進(jìn)展,該系統(tǒng)通過(guò)掃描儲(chǔ)存了4億篇新聞報(bào)道和維基百科頁(yè)面的檔案庫(kù),自行組織開(kāi)場(chǎng)白和反駁論點(diǎn)。
雖然最終仍然輸給了人類(lèi)辯手,但此次AI辯手的表現(xiàn)提供了一種可能:未來(lái)人工智能可以幫助人類(lèi)制定并理解復(fù)雜的論點(diǎn)。

自然語(yǔ)言處理 (NLP)算法 NLP是指計(jì)算機(jī)自動(dòng)理解、解讀和處理人類(lèi)語(yǔ)言(比如,話語(yǔ)和文本)。
NLP 是人機(jī)互動(dòng)的關(guān)鍵要素, IBM Project Debater 團(tuán)隊(duì)積極開(kāi)展 NLP研究也在情理之中。
2018年,IBM研究院則在美國(guó)舊金山的Watson West,首次展示了人類(lèi)與智能機(jī)器之間的公開(kāi)現(xiàn)場(chǎng)辯論賽。雙方辯手分別是IBM耗時(shí)逾六年研發(fā)的,首個(gè)能與人類(lèi)進(jìn)行復(fù)雜辯論的AI系統(tǒng)Project Debater(以下簡(jiǎn)稱(chēng)Debater),以及以色列國(guó)際辯論協(xié)會(huì)主席 Dan Zafrir.
該研究強(qiáng)調(diào)了在技術(shù)發(fā)展過(guò)程中,在辯論中識(shí)別、產(chǎn)生和反駁論點(diǎn)的過(guò)程中,將不同組成部分結(jié)合起來(lái)的強(qiáng)大工程的重要性,每個(gè)組成部分處理一個(gè)特定的任務(wù)。
大概10年前,對(duì)人類(lèi)話語(yǔ)進(jìn)行分析,以確定引用證據(jù)來(lái)支持結(jié)論的方式——這個(gè)過(guò)程現(xiàn)在被稱(chēng)為「論點(diǎn)分析」,這明顯超出了最先進(jìn)的人工智能的能力范圍。
從那時(shí)起,人工智能技術(shù)的進(jìn)步和論證技術(shù)工程的日益成熟,再加上激烈的商業(yè)需求,該領(lǐng)域迅速擴(kuò)張。全世界有超過(guò)50個(gè)實(shí)驗(yàn)室在研究這個(gè)問(wèn)題,包括所有大型軟件公司的團(tuán)隊(duì)。
這一領(lǐng)域研究激增的原因是人工智能系統(tǒng)的直接應(yīng)用能夠識(shí)別大量文本中語(yǔ)言使用的統(tǒng)計(jì)規(guī)律,這種應(yīng)用在人工智能的許多應(yīng)用中起到了變革性的作用,但在論點(diǎn)挖掘方面還沒(méi)有達(dá)到這樣的進(jìn)展。
因?yàn)檎擖c(diǎn)結(jié)構(gòu)太多樣化、太復(fù)雜、太微妙、太隱晦,不像句子結(jié)構(gòu)那樣容易被識(shí)別。
因此,Slonim等人決定發(fā)起一項(xiàng)重大挑戰(zhàn): 開(kāi)發(fā)一個(gè)「完全」可以與人類(lèi)進(jìn)行現(xiàn)場(chǎng)辯論的自主系統(tǒng)。Project Debater代表了這項(xiàng)工作的頂峰。
Project Debater關(guān)鍵技術(shù)點(diǎn)
立場(chǎng)分類(lèi)和情緒分析自動(dòng)辯論系統(tǒng)必須能夠確定論點(diǎn)能否支持或反駁給定的主題。
這對(duì)人類(lèi)來(lái)說(shuō)十分簡(jiǎn)單,但對(duì)機(jī)器而言則相當(dāng)困難,因?yàn)樗枰軌蛎翡J地辨別自然語(yǔ)言豐富的微妙之處和細(xì)微差異。
深度神經(jīng)網(wǎng)絡(luò) (DNN)和弱監(jiān)督DNN具備提高自動(dòng)語(yǔ)言理解能力的巨大潛力,但是眾所周知,訓(xùn)練DNN需要大量人工標(biāo)記的高質(zhì)量數(shù)據(jù)。
該團(tuán)隊(duì)開(kāi)發(fā)了多種工具和方法,以弱監(jiān)督式訓(xùn)練DNN,來(lái)緩解這個(gè)瓶頸問(wèn)題。
他們還利用DNN開(kāi)發(fā)Project Debater的聽(tīng)說(shuō)技能 。
文本轉(zhuǎn)語(yǔ)音(TTS)系統(tǒng)與個(gè)人助手或?qū)Ш狡鞑煌q論系統(tǒng)需要能夠持續(xù)數(shù)分鐘對(duì)事先未知的主題作出雄辯,同時(shí)與受眾保持互動(dòng)。
科研團(tuán)隊(duì)開(kāi)發(fā)了新的TTS算法和方法,用于為Project Debater提供清晰流利、有說(shuō)服力的語(yǔ)言表達(dá)能力。
Project Debater難以達(dá)到人類(lèi)辯手的連貫性和流暢性
在論證技術(shù)的發(fā)展以及將論證作為局部現(xiàn)象來(lái)處理的過(guò)程中,Project Debater是一個(gè)關(guān)鍵的步驟。
它的成功提供了一個(gè)新視角,我們可以了解人工智能系統(tǒng)是如何利用人類(lèi)能夠輕易提出來(lái)的論點(diǎn)組成的網(wǎng)絡(luò)來(lái)進(jìn)行工作的。
幾乎所有的人工智能研究都把目標(biāo)定得很高,但瓶頸在于是否能夠獲取足夠的數(shù)據(jù),計(jì)算出有效的解決方案來(lái)應(yīng)對(duì)既定挑戰(zhàn)。
Project Debater采用雙管齊下的辦法克服這一障礙: 它將重點(diǎn)縮小到100多個(gè)辯論專(zhuān)題; 從巨量的數(shù)據(jù)集中收集原始材料,。
在2018年和2019年的一系列比賽中,Project Debater挑戰(zhàn)了多個(gè)才華橫溢、備受矚目的人類(lèi)辯手,比如曾在2016年獲得以色列國(guó)家辯論冠軍以色列大四女生Noa Ovadia ,觀眾對(duì)其表現(xiàn)進(jìn)行了非正式的評(píng)估。
該系統(tǒng)以其辯論技術(shù)為后盾,并以經(jīng)過(guò)處理的數(shù)據(jù)集為支撐,創(chuàng)建了一個(gè)4分鐘的演講,開(kāi)啟了一場(chǎng)關(guān)于其全部技能中某個(gè)主題的辯論,一個(gè)人類(lèi)對(duì)手會(huì)對(duì)此作出回應(yīng)。
然后,它對(duì)對(duì)手的觀點(diǎn)做出反駁,發(fā)表第二次4分鐘的演講。對(duì)方用4分鐘反駁回答,辯論結(jié)束時(shí),雙方參與者都做了2分鐘的閉幕陳述。
Project Debater最薄弱的一點(diǎn)是,它難以模仿人類(lèi)辯手的連貫性和流暢性ーー這個(gè)問(wèn)題與其處理能力的最高水平有關(guān),在這個(gè)水平上,它可以選擇、抽象和編排論點(diǎn)。
然而,這種限制并不是Project Debater所獨(dú)有的。盡管進(jìn)行了兩千年的研究,人們對(duì)「論證結(jié)構(gòu)」仍然知之甚少。
根據(jù)論證研究的重點(diǎn)是否集中在語(yǔ)言使用、認(rèn)識(shí)論、認(rèn)知過(guò)程還是邏輯有效性,人們對(duì)于連貫論證和推理模型所提出的關(guān)鍵特征各不相同。
所有論證技術(shù)系統(tǒng)面臨的最后一個(gè)挑戰(zhàn)是,將論證視為受一系列孤立因素影響的本地論述碎片,還是將它們編入更大規(guī)模的社會(huì)范圍的辯論。在很大程度上,這是設(shè)計(jì)要解決的問(wèn)題,而不是設(shè)計(jì)解決方案。
通過(guò)給論證設(shè)定先驗(yàn)界限,理論上的簡(jiǎn)化變得可行,從而提供了主要的計(jì)算優(yōu)勢(shì)。例如,識(shí)別「主要要求」就成為一個(gè)明確的任務(wù),機(jī)器幾乎可以像人類(lèi)一樣可靠地完成這項(xiàng)任務(wù)。問(wèn)題在于人類(lèi)根本不擅長(zhǎng)這項(xiàng)任務(wù),恰恰因?yàn)樗侨斯ぴO(shè)計(jì)的。
在公開(kāi)討論中,一段給定的論述可能是一個(gè)上下文中的主張,另一個(gè)上下文中的前提。
此外,在現(xiàn)實(shí)世界中,沒(méi)有明確的界限來(lái)劃定一個(gè)論點(diǎn):發(fā)生在辯論室之外的話語(yǔ)并不是離散的,而是與交叉引用、類(lèi)比、例證和概括的網(wǎng)絡(luò)相連接。
關(guān)于人工智能如何處理這種論證網(wǎng)的想法已經(jīng)有相關(guān)理論在討論,并利用軟件來(lái)實(shí)現(xiàn),例如,一個(gè)名為DebateGraph的系統(tǒng)是一個(gè)互聯(lián)網(wǎng)平臺(tái),它提供了計(jì)算工具,用于可視化和分享復(fù)雜的、相互關(guān)聯(lián)的思想網(wǎng)絡(luò)。
然而,與這些實(shí)施相關(guān)的理論挑戰(zhàn)和社會(huì)技術(shù)問(wèn)題是艱巨的:設(shè)計(jì)令人信服的方法來(lái)吸引大量受眾進(jìn)入這種系統(tǒng),與設(shè)計(jì)簡(jiǎn)單明了的機(jī)制使他們能夠與這些復(fù)雜的辯論網(wǎng)絡(luò)互動(dòng)一樣困難。
在論證技術(shù)的發(fā)展以及將論證作為局部現(xiàn)象來(lái)處理的過(guò)程中,Project Debater是一個(gè)關(guān)鍵的步驟。
它的成功提供了一個(gè)誘人的機(jī)會(huì),讓我們了解人工智能系統(tǒng)是如何與人類(lèi)能夠輕松自如解釋的論點(diǎn)網(wǎng)絡(luò)一起工作的。
現(xiàn)在假新聞充斥,公眾輿論兩極分化,松散的推理無(wú)處不在,這些都掩蓋了人類(lèi)在創(chuàng)造、處理、導(dǎo)航和分享復(fù)雜論點(diǎn)方面的迫切需求,而在這方面,人工智能或許能夠提供支持。
因此,盡管Project Debater解決了一個(gè)重大的挑戰(zhàn),代表了人工智能進(jìn)步,可以促進(jìn)人類(lèi)的推理,而且,正如Slonim等人所說(shuō),Project Debater拓寬了當(dāng)前人工智能技術(shù)的舒適區(qū),未來(lái)將能夠參與更加復(fù)雜的人類(lèi)活動(dòng)。