13000余項(xiàng)技能、十億量級(jí)對(duì)話(huà)量,百度AI在對(duì)話(huà)系統(tǒng)漸入佳境
“從去年百度AI開(kāi)發(fā)者大會(huì)至今,UNIT已吸引超過(guò)一萬(wàn)名開(kāi)發(fā)者,開(kāi)發(fā)了13000余項(xiàng)技能,進(jìn)行了33萬(wàn)次啟發(fā)式訓(xùn)練,人機(jī)對(duì)話(huà)量高達(dá)32億次,并且已經(jīng)賦能旅游、汽車(chē)、酒店、企業(yè)辦公、家庭教育、超市購(gòu)物、電子政務(wù)等各行業(yè)。”
7月5日,百度自然語(yǔ)言處理部主任研發(fā)架構(gòu)師、UNIT技術(shù)負(fù)責(zé)人孫珂在2018百度AI開(kāi)發(fā)者大會(huì)(Baidu Create 2018)的百度大腦論壇,為與會(huì)者分享了面向第三方開(kāi)發(fā)者的、對(duì)話(huà)系統(tǒng)定制平臺(tái)UNIT在過(guò)去一年的成就,推出UNIT2.0版本,并宣布UNIT對(duì)開(kāi)發(fā)者永遠(yuǎn)免費(fèi)。
孫珂
機(jī)器與人類(lèi)的交互向來(lái)被認(rèn)為是人工智能領(lǐng)域的重點(diǎn)方向,而對(duì)話(huà)式人機(jī)交互方式既要求AI能聽(tīng)會(huì)說(shuō),也需要AI理解語(yǔ)言意義。但研發(fā)對(duì)話(huà)產(chǎn)品向來(lái)是開(kāi)發(fā)者遇到的難點(diǎn)之一,為了能夠準(zhǔn)確理解用戶(hù)多樣的需求表述,開(kāi)發(fā)者通常需要為對(duì)話(huà)系統(tǒng)提供充足的訓(xùn)練數(shù)據(jù),使理解模型能夠充分學(xué)習(xí)用戶(hù)的語(yǔ)言表達(dá)習(xí)慣。然而,訓(xùn)練數(shù)據(jù)的采集成本很高,對(duì)開(kāi)發(fā)者來(lái)說(shuō)是不小的門(mén)檻。UNIT則搭載了業(yè)界領(lǐng)先的需求理解與對(duì)話(huà)管理技術(shù),以及百度多年積累的自然語(yǔ)言處理、機(jī)器學(xué)習(xí)、大數(shù)據(jù)等核心能力,為開(kāi)發(fā)者提供對(duì)話(huà)理解技術(shù)解決方案。
就在前一天2018百度AI開(kāi)發(fā)者大會(huì)的主論壇上, 2018百度AI開(kāi)發(fā)者大會(huì)(Baidu Create 2018),百度高級(jí)副總裁、AI技術(shù)平臺(tái)體系(AIG)總負(fù)責(zé)人王海峰在現(xiàn)場(chǎng)與百度地圖之間進(jìn)行了如下對(duì)話(huà):
王海峰:“小度小度”
百度地圖:“我在”
王海峰:“我要從三里屯的團(tuán)結(jié)湖地鐵站出發(fā)路過(guò)望京的家樂(lè)福然后再去南鑼鼓巷***到我家,我要紅綠燈少的不堵車(chē)的最快的路線(xiàn),你幫我路線(xiàn)規(guī)劃一下吧。”
百度地圖:“提供一種導(dǎo)航方式,需要導(dǎo)航嗎?” (屏幕顯示目的地導(dǎo)航路線(xiàn))
王海峰演示百度地圖語(yǔ)音助手
從現(xiàn)場(chǎng)演示可以看到,百度地圖語(yǔ)音助手精準(zhǔn)識(shí)別、理解了長(zhǎng)達(dá)60多字的服務(wù)請(qǐng)求,并自然流暢地提供了導(dǎo)航服務(wù),引起了現(xiàn)場(chǎng)觀眾的歡呼與好奇,許多人都想“調(diào)戲”這種能夠用Rap的口氣來(lái)交流的人工智能,而不僅僅是一字一頓字正腔圓的對(duì)話(huà)。展現(xiàn)出了自然流暢的人機(jī)交互,以及機(jī)器人對(duì)復(fù)雜語(yǔ)句的理解能力,震撼了全場(chǎng),這正是基于百度理解與交互技術(shù)UNIT才得以成功實(shí)現(xiàn)。依賴(lài)UNIT提供的持續(xù)學(xué)習(xí)的高精度對(duì)話(huà)理解技術(shù)、***的像人類(lèi)一樣理解與學(xué)習(xí)的Interactive Learning機(jī)制,以及開(kāi)源的對(duì)話(huà)管理與任務(wù)滿(mǎn)足框架,開(kāi)發(fā)者也可以快速擁有一個(gè)像這樣聰明的機(jī)器人,并通過(guò)人機(jī)交流讓機(jī)器人實(shí)現(xiàn)終身學(xué)習(xí),越來(lái)越智能化。

王海峰演示百度地圖語(yǔ)音助手
而UNIT在大會(huì)上推出的2.0版本的標(biāo)志著百度全方位地升級(jí)了UNIT的技術(shù)、功能與架構(gòu),為開(kāi)發(fā)者提供更加便利、更加專(zhuān)業(yè)的對(duì)話(huà)系統(tǒng)定制能力。據(jù)現(xiàn)場(chǎng)介紹,為降低開(kāi)發(fā)者的研發(fā)門(mén)檻,UNIT對(duì)用戶(hù)的表達(dá)進(jìn)一步分析與抽象,提供了融合深度學(xué)習(xí)與啟發(fā)式規(guī)則的意圖理解模型,將系統(tǒng)詞槽的深度與廣度進(jìn)一步擴(kuò)展,還拿出了百度NLP壓箱底的黑科技“口語(yǔ)化分析”與“query糾錯(cuò)”。結(jié)合這些技術(shù),開(kāi)發(fā)者在UNIT平臺(tái)只需提供極少量數(shù)據(jù)就可讓理解模型具備識(shí)別上圖所有例子的泛化識(shí)別能力,接入成本幾近于0。

孫珂解讀UNIT2.0重磅升級(jí)
而UNIT2.0最重磅的新功能在于正式開(kāi)源了DM Kit——百度內(nèi)部使用的工業(yè)級(jí)對(duì)話(huà)管理與任務(wù)執(zhí)行框架。孫珂介紹,UNIT1.0雖然能夠提供理解能力和部分對(duì)話(huà)管理能力,但開(kāi)發(fā)者依然開(kāi)發(fā)者還需要自行搭建控制業(yè)務(wù)流程的對(duì)話(huà)邏輯,以及滿(mǎn)足用戶(hù)需求的資源檢索與任務(wù)執(zhí)行等操作,對(duì)于沒(méi)有對(duì)話(huà)系統(tǒng)研發(fā)經(jīng)驗(yàn)的開(kāi)發(fā)者來(lái)說(shuō)依然不夠友好。而DM Kit可無(wú)縫對(duì)接UNIT云端對(duì)話(huà)理解能力,并輕松對(duì)接外部知識(shí)庫(kù),豐富人工智能的回復(fù)信息量,實(shí)現(xiàn)多狀態(tài)的復(fù)雜對(duì)話(huà)流程控制,讓開(kāi)發(fā)者快速靈活的搭建對(duì)話(huà)產(chǎn)品。
除了DM Kit,UNIT2.0還公布了一項(xiàng)黑科技——Interactive Learning,讓對(duì)話(huà)系統(tǒng)可以像人一樣在對(duì)話(huà)中理解與學(xué)習(xí)。用戶(hù)總是希望對(duì)話(huà)系統(tǒng)能夠更加“善解人意”,但系統(tǒng)對(duì)理解模糊的問(wèn)題往往難以正確回答。而現(xiàn)在開(kāi)發(fā)者只需正常定義對(duì)話(huà)任務(wù),就可以得到系統(tǒng)內(nèi)置的交互式理解能力,它可以主動(dòng)發(fā)現(xiàn)系統(tǒng)理解模糊的問(wèn)題并向用戶(hù)進(jìn)行澄清詢(xún)問(wèn),也可以被動(dòng)等待用戶(hù)發(fā)起糾正。實(shí)驗(yàn)表明,該機(jī)制能夠讓98.1%的用戶(hù)對(duì)話(huà)被系統(tǒng)正確的理解,并具備持續(xù)學(xué)習(xí)的能力。

通過(guò)交流在實(shí)踐中持續(xù)學(xué)習(xí)
大會(huì)期間,UNIT還正式公布了將對(duì)開(kāi)發(fā)者永遠(yuǎn)免費(fèi)的消息,并推出UNIT公開(kāi)課,將從對(duì)話(huà)系統(tǒng)開(kāi)發(fā)入門(mén)、典型行業(yè)案例拆解、壓箱底“黑科技”的教學(xué)這三方面入手,通過(guò)分享經(jīng)驗(yàn)助力開(kāi)發(fā)者的全面成長(zhǎng),讓對(duì)話(huà)理解技術(shù)得到更廣泛的普及。
孫珂表示,未來(lái)UNIT將針對(duì)行業(yè)需求“量身定制”提供更多的垂直解決方案,開(kāi)放技能與資源商店,為開(kāi)發(fā)者呈現(xiàn)更加開(kāi)源的生態(tài),以及面向更復(fù)雜場(chǎng)景的深度“黑科技”,為開(kāi)發(fā)者提供更加易用、更加專(zhuān)業(yè)的對(duì)話(huà)系統(tǒng)定制工具,加速人工智能對(duì)話(huà)能力的全面落地。