阿里AI實(shí)現(xiàn)全球首個(gè)實(shí)時(shí)翻譯直播,214種語(yǔ)言翻譯支持今年雙11
10月21日,阿里完成全球首個(gè)多語(yǔ)言實(shí)時(shí)翻譯的電商直播,該直播展示了AI無(wú)懼嘈雜環(huán)境、口音不標(biāo)準(zhǔn)及口語(yǔ)化語(yǔ)言風(fēng)格等問(wèn)題,實(shí)時(shí)將中文直播內(nèi)容精準(zhǔn)翻譯成英語(yǔ)、俄語(yǔ)、西班牙語(yǔ)等語(yǔ)言。阿里方面透露,該技術(shù)將大規(guī)模應(yīng)用于2020雙11。
達(dá)摩院AI可實(shí)時(shí)翻譯直播內(nèi)容及評(píng)論區(qū)的小語(yǔ)種語(yǔ)言
“語(yǔ)言”問(wèn)題是不同地域商家和買(mǎi)家之間難以跨越的大山。數(shù)據(jù)顯示,速賣(mài)通上約96%的中小企業(yè)無(wú)小語(yǔ)種翻譯能力,而通常一個(gè)直播間就覆蓋了十多個(gè)語(yǔ)種,82%的中國(guó)商家因此而放棄跨境直播。
盡管AI能輔助文本翻譯,但直播場(chǎng)景的翻譯任務(wù)更加復(fù)雜,它需要先后進(jìn)行語(yǔ)音識(shí)別和翻譯兩個(gè)過(guò)程,并要克服口音不標(biāo)準(zhǔn)、口語(yǔ)化表達(dá)、直播環(huán)境嘈雜、商品專(zhuān)業(yè)名詞多、新品新詞更迭快等問(wèn)題。例如,“然后我們的話(huà)新品大家的評(píng)價(jià)也看了”是一句口語(yǔ)化的句子,正確的翻譯應(yīng)為“Then we have read everyone's comments on new products”,但傳統(tǒng)的翻譯引擎很容易錯(cuò)誤地翻譯成“Then we also looked at our comments on new products”(然后我們也看了我們對(duì)新品的評(píng)價(jià))。
為解決機(jī)器聽(tīng)不清、聽(tīng)不懂的問(wèn)題,阿里在業(yè)界通用方案的基礎(chǔ)上自研了更智能的語(yǔ)音模型,可在嘈雜的環(huán)境中“聽(tīng)清”直播內(nèi)容;同時(shí),在A(yíng)I翻譯任務(wù)過(guò)程中創(chuàng)新性集成了視覺(jué)信息的識(shí)別結(jié)果,可將口語(yǔ)化句子改寫(xiě)成正式表達(dá)句子;此外,達(dá)摩院將多領(lǐng)域的知識(shí)融入翻譯模型,能舉一反三,無(wú)需重新訓(xùn)練便能快速學(xué)習(xí)不同場(chǎng)景里不斷更迭的專(zhuān)業(yè)名詞。
過(guò)去幾年,阿里AI翻譯技術(shù)歷經(jīng)多次迭代升級(jí),目前可提供214種語(yǔ)言的高質(zhì)量翻譯,一天可翻譯3000億個(gè)詞語(yǔ)。并創(chuàng)造多項(xiàng)世界紀(jì)錄,曾獲2018國(guó)際機(jī)器翻譯大賽(WMT)翻譯任務(wù)5項(xiàng)語(yǔ)向冠軍,質(zhì)量評(píng)估任務(wù)6項(xiàng)冠軍,30多項(xiàng)相關(guān)研究成果被國(guó)際AI頂會(huì)收錄。同時(shí),該技術(shù)也逐步應(yīng)用于阿里巴巴內(nèi)部及外部企業(yè)客戶(hù),日均調(diào)用量超過(guò)13億次。
達(dá)摩院機(jī)器翻譯團(tuán)隊(duì)負(fù)責(zé)人駱衛(wèi)華表示,“讓機(jī)器聽(tīng)清、聽(tīng)懂是實(shí)現(xiàn)精準(zhǔn)翻譯的基礎(chǔ),達(dá)摩院希望通過(guò)創(chuàng)新的AI算法繼續(xù)攻克電商、教育、醫(yī)療等專(zhuān)業(yè)領(lǐng)域的翻譯難題,幫助人類(lèi)跨越語(yǔ)言障礙。”