可以學(xué)習(xí)人類語言模式的人工智能
?眾所周知,人類語言非常復(fù)雜,語言學(xué)家長期以來一直認(rèn)為,教機(jī)器如何像人類那樣分析語音和單詞結(jié)構(gòu)是不可能的。
但麥吉爾大學(xué)、麻省理工學(xué)院和康奈爾大學(xué)的研究人員已經(jīng)朝著這個方向邁出了一步。他們開發(fā)了一種人工智能 (AI) 系統(tǒng),可以自行學(xué)習(xí)人類語言的規(guī)則和模式。
該模型自動學(xué)習(xí)可以應(yīng)用于不同語言的高級語言模式,使其能夠獲得更好的結(jié)果。
當(dāng)給定單詞和這些單詞如何變化以用一種語言表達(dá)不同語法功能的例子時——比如時態(tài)、大小寫或性別——這個機(jī)器學(xué)習(xí)模型會提出規(guī)則來解釋這些單詞的形式為什么會發(fā)生變化。
研究人員開發(fā)了一種人工智能系統(tǒng),可以自行學(xué)習(xí)人類語言的規(guī)則和模式。學(xué)分:麻省理工學(xué)院 Jose-Luis Olivares
例如,它可能知道必須將字母“a”添加到單詞的末尾,以使塞爾維亞-克羅地亞語中的陽性形式變?yōu)殛幮浴?/p>
研究人員說,該系統(tǒng)可用于檢驗語言理論,并研究不同語言轉(zhuǎn)換單詞方式的細(xì)微相似之處?!拔覀兿肟纯次覀兪欠窨梢阅7氯祟悶檫@項任務(wù)帶來的知識和推理,”麻省理工學(xué)院語言學(xué)教授、合著者亞當(dāng)奧爾布賴特說。
“這項工作令人興奮的是,它展示了我們?nèi)绾螛?gòu)建能夠從非常小的語言數(shù)據(jù)樣本中進(jìn)行泛化的算法,更像是人類科學(xué)家和兒童,”該系助理教授、資深作者 Timothy O'Donnell 說麥吉爾大學(xué)語言學(xué)博士,Mila – 魁北克人工智能研究所加拿大 CIFAR AI 主席。
用貝葉斯程序歸納綜合人類語言理論
自動化的、數(shù)據(jù)驅(qū)動的科學(xué)模型和理論的構(gòu)建和評估是人工智能中長期存在的挑戰(zhàn)。
我們提出了一個算法合成人類語言基本部分模型的框架:形態(tài)音韻學(xué),從聲音構(gòu)建單詞形式的系統(tǒng)。我們將貝葉斯推理與受語言理論和學(xué)習(xí)和發(fā)現(xiàn)的認(rèn)知模型啟發(fā)的程序合成和表示相結(jié)合。
在來自 58 種不同語言的 70 個數(shù)據(jù)集中,我們的系統(tǒng)綜合了每種語言形態(tài)音系核心方面的人類可解釋模型,有時接近人類語言學(xué)家提出的模型。所有 70 個數(shù)據(jù)集的聯(lián)合推理自動合成一個元模型編碼可解釋的跨語言類型趨勢。
最后,相同的算法捕獲了少量學(xué)習(xí)動態(tài),僅從一個或幾個示例中獲取新的形態(tài)語音規(guī)則。
這些結(jié)果表明了在語言學(xué)和其他科學(xué)領(lǐng)域中更強(qiáng)大的機(jī)器支持發(fā)現(xiàn)可解釋模型的途徑。