谷歌發(fā)布大規(guī)模對(duì)話語(yǔ)料庫(kù),涉及17個(gè)領(lǐng)域含1.8萬(wàn)個(gè)注釋
在不需要額外數(shù)據(jù)和再訓(xùn)練的情況下,谷歌Assistant等人工智能助手如何更好地支持新服務(wù)?
這是谷歌的研究人員在最近的一項(xiàng)研究中試圖回答的問(wèn)題,該研究引入了一種方法,在沒(méi)有領(lǐng)域特定參數(shù)的情況下跨服務(wù)使用模型。
作為它的一部分,該團(tuán)隊(duì)發(fā)布了一個(gè)語(yǔ)料庫(kù)——模式指導(dǎo)的對(duì)話(SGD)語(yǔ)料庫(kù)——他們聲稱(chēng)這是最大的面向任務(wù)的對(duì)話語(yǔ)料的公開(kāi)匯編。
軟件工程師Abhinav Rastogi 和谷歌研究工程負(fù)責(zé)人Pranav Khaitan在博客中寫(xiě)道:“如今的虛擬助手幫助用戶完成各種各樣的任務(wù),包括查找航班、搜索附近的活動(dòng)和電影、預(yù)訂、從網(wǎng)上獲取信息等等。”
“盡管取得了巨大的進(jìn)步……適應(yīng)性挑戰(zhàn)在最先進(jìn)的模型中常常被忽視。這部分是由于缺乏合適的數(shù)據(jù)集來(lái)匹配虛擬助理所面臨的規(guī)模和復(fù)雜性。”
為此,SGD包含18000多個(gè)人與虛擬助理之間的帶注釋的對(duì)話,涉及與17個(gè)領(lǐng)域服務(wù)的交互:從銀行、大事件到媒體、日歷、旅行和天氣等。
對(duì)于大多數(shù)領(lǐng)域,數(shù)據(jù)集包含幾個(gè)不同的api,其中許多api具有重疊的功能,但是不同的接口反映了典型的真實(shí)場(chǎng)景。評(píng)估集包含了訓(xùn)練集中沒(méi)有的服務(wù),主要用于量化模型對(duì)api變化或新api添加的魯棒性。
至于前面提到的模式指導(dǎo)方法,它利用每個(gè)服務(wù)或API及其相關(guān)屬性的自然語(yǔ)言描述來(lái)學(xué)習(xí)分布式語(yǔ)義表示,該語(yǔ)義表示作為對(duì)話系統(tǒng)的額外輸入,隨后作為單個(gè)模型實(shí)現(xiàn)。
該團(tuán)隊(duì)表示,統(tǒng)一模型是谷歌開(kāi)源對(duì)話狀態(tài)跟蹤模型的核心,它促進(jìn)了不同服務(wù)中相似概念之間的公共知識(shí)表示,使得對(duì)訓(xùn)練數(shù)據(jù)中沒(méi)有的新服務(wù)進(jìn)行操作成為可能。
“我們相信,這個(gè)數(shù)據(jù)集將成為建立大規(guī)模對(duì)話模型的良好基準(zhǔn),”Rastogi和Khaitan寫(xiě)道。“我們很興奮,并期待著研究界將以各種創(chuàng)新的方式利用它來(lái)推進(jìn)對(duì)話技術(shù)。”
新數(shù)據(jù)集和模型的發(fā)布是在谷歌Coached Conversational Preference Elicitation (CCPE)和Taskmaster-1(兩個(gè)人之間的一對(duì)對(duì)話數(shù)據(jù)集)的開(kāi)源之后進(jìn)行的。(前者包括與人們就他們的電影喜好進(jìn)行的500次對(duì)話,總計(jì)1萬(wàn)次,總計(jì)1.2萬(wàn)次對(duì)話。)
谷歌將其描述為:向能夠?qū)崿F(xiàn)人類(lèi)級(jí)別的性能的自然語(yǔ)言系統(tǒng)建模邁出了一步。