全球首個(gè)翻譯引擎進(jìn)化歸來 “細(xì)節(jié)狂魔”搞定方言
最近,一款在線機(jī)器翻譯軟件在日本大火。
這款翻譯軟件名叫DeepL,大火的原因正是因?yàn)樗ぷ魈?fù)責(zé)了,翻譯得太過準(zhǔn)確,在日本引起了熱議。
從日本網(wǎng)友的民間測(cè)評(píng)來看,不僅日語方言翻譯效果杠杠的,連文言文也被拿下,要知道,這可是連谷歌翻譯都無法做到的事。
但是有多精確呢?作為一個(gè)嚴(yán)謹(jǐn)?shù)目萍架浖?dāng)然還是要用數(shù)據(jù)來說話,DeepL 官方也公開了日英互譯和中英互譯的盲測(cè)結(jié)果,如下圖所示,可以看出,DeepL 簡(jiǎn)直就是碾壓級(jí)的存在嘛:
盲測(cè)就是在專業(yè)譯員評(píng)審們不知道哪個(gè)翻譯版本是由哪個(gè)網(wǎng)站翻譯的情況下,對(duì)翻譯文本進(jìn)行評(píng)估,這也一直是 DeepL 的測(cè)試方式之一。
DeepL 由于極好的準(zhǔn)確性,也同樣引爆了 Reddit,有網(wǎng)友指出,DeepL 不是像谷歌翻譯那樣從字詞上進(jìn)行翻譯,從 Textractor 的設(shè)置上可以看到,DeepL 還支持用以前的翻譯作為上下文對(duì)翻譯結(jié)果進(jìn)行改善。
也有不少網(wǎng)友直呼“DeepL 牛逼”!
3 年前,DeepL 剛出現(xiàn)在大眾視野的時(shí)候就已經(jīng)吸引到了不少目光,DeepL 首席執(zhí)行官 Gereon Frahling 曾表示,DeepL 的目標(biāo)不止于翻譯任務(wù),神經(jīng)網(wǎng)絡(luò)將從理解文本開始,開啟更多可能。
至于更多可能是如何被開發(fā)出來的,文摘菌做了一次小小的測(cè)評(píng),然后再一起來圍觀 DeepL 的發(fā)家史,小板凳已經(jīng)放好,歡迎就坐~
方言、文言文、學(xué)術(shù)論文,機(jī)器翻譯神仙打架!
不管是民間測(cè)評(píng)還是 DeepL 官方的盲測(cè)結(jié)果,都暗示著 DeepL 可能是目前準(zhǔn)確率最高的機(jī)器翻譯,到底成色怎樣,還是要親自動(dòng)手試試才知道。
既然本次更新也包含了簡(jiǎn)體中文,抱著一點(diǎn)點(diǎn)的懷疑和一點(diǎn)點(diǎn)的好奇,文摘菌也對(duì) DeepL進(jìn)行了一次簡(jiǎn)單的測(cè)評(píng),和目前主流的谷歌翻譯、微軟翻譯、百度翻譯、有道翻譯進(jìn)行了比較。
本次測(cè)評(píng)分為三輪,第一輪方言,第二輪文言文,第三輪學(xué)術(shù)論文。好,現(xiàn)在我們有請(qǐng)五位選手入場(chǎng)。
第一輪,我們來看看方言。
大家都知道,中國方言文化博大精深,要是不能正確譯出方言,那這個(gè)準(zhǔn)確率還是要打上問號(hào)的。
我們選擇了東北話十級(jí)題目:“我嘞個(gè)去,你長得也太磕磣了”。本題有兩個(gè)得分點(diǎn),一個(gè)是“我嘞個(gè)去”,一個(gè)是“磕磣”。讓我們來看看五位選手的表現(xiàn)。
在第一個(gè)得分點(diǎn)上,谷歌翻譯成了“I'll go there”,微軟和百度認(rèn)為這是“I'll go”的意思,有道則給出“I don't know”的答案,DeepL 表現(xiàn)很好,正確翻譯成了帶有驚訝語氣的“oh my god”。
在第二個(gè)得分點(diǎn)上,五位選手都給出了不同的答案,谷歌“shy”、微軟“snobful”、百度“shabby”、有道“bad”,DeepL“ugly”。
從得分點(diǎn)上看,百度在第二題表現(xiàn)尚可,有道…勉強(qiáng)過關(guān)吧,谷歌和微軟則全軍覆沒。我們來欣賞一下DeepL 的滿分試卷:
這才第一題,不要擔(dān)心,還有翻身的機(jī)會(huì)。接下來我們來看看文言文,既然 DeepL 都能翻譯古日文,要是不能翻譯古漢語可就不對(duì)了。
第二輪,文言文。
文言文部分我們以著名唐代詩人張九齡《望月遠(yuǎn)懷》中的名句“海上生明月,天涯共此時(shí)”為考題,這句詩的意思是,在遼闊無邊的大海上升起一輪明月,使人想起了遠(yuǎn)在天涯海角的親友,他此時(shí)此刻也該是望著同一輪明月吧。
本題的得分點(diǎn)是看看各位選手能否用英文把整句詩的意境表達(dá)出來。好了,中文版的標(biāo)準(zhǔn)答案已經(jīng)公布,那么五位選手的表現(xiàn)如何呢?
首先從句意上看,谷歌、微軟和百度都直接放棄了后半句的翻譯,有道把后半句譯成“Tianya at this time”;在前半句的翻譯上,微軟和百度都用到了 born 這個(gè)詞,但是微軟的譯文是“The sea is born”????
我們來看看 DeepL,前半句和谷歌的答案一模一樣,但是后半句的翻譯是不是達(dá)到了信達(dá)雅的水平文摘菌不知道,但是讀上去感覺非常舒服,大家也來品品:
第三題,也是最后一道壓軸題,我們要考察的是各位選手對(duì)學(xué)術(shù)論文的中英互譯。
學(xué)術(shù)論文的關(guān)鍵除了語句通順外,還需要在專業(yè)詞匯上做到準(zhǔn)確,這也是本次考察的重點(diǎn)。
中譯英部分,我們選擇的是去年刊登在《國際新聞界》上的一篇文章,研究者調(diào)查的是社交媒體信任對(duì)隱私風(fēng)險(xiǎn)感知和自我表露的影響。
原文:實(shí)證結(jié)果顯示:1.隱私風(fēng)險(xiǎn)感知與自我表露并無顯著相關(guān)性;2.社交媒體信任負(fù)向影響用戶的隱私風(fēng)險(xiǎn)感知,網(wǎng)絡(luò)人際信任在其中發(fā)揮中介作用;3.社交媒體信任正向影響用戶的自我表露,網(wǎng)絡(luò)人際信任在其中發(fā)揮中介作用。
從翻譯結(jié)果上看,五位選手給出的答案都比較讓人滿意,句型和語法也都沒有問題,只是在一些具體的用詞上各有千秋。比如,“自我表露”,DeepL 和微軟用的是“self-expression”,其余三位選手用的是“self-disclosure”;而“網(wǎng)絡(luò)人際信任”,有道、百度和微軟譯成“network interpersonal trust”,谷歌給出“online interpersonal trust”的答案,DeepL 則譯為“cyber-interpersonal trust”。
照例,我們還是來看看 DeepL 的答案。
在英譯中部分,我們選擇了上周文摘菌報(bào)道的帝國理工大學(xué)論文的導(dǎo)論部分。在用戶體驗(yàn)上文摘菌要插播一下,從中譯英切換到英譯中的時(shí)候,只有百度、有道和 DeepL 做到了自動(dòng)識(shí)別,谷歌和微軟仍需要手動(dòng)選擇語言。
原文:The global impact of COVID-19 has been profound, and the public health threat it represents is the most serious seen in a respiratory virus since the 1918 H1N1 influenza pandemic. Here we present the results of epidemiological modelling which has informed policymaking in the UK and other countries in recent weeks. In the absence of a COVID-19 vaccine, we assess the potential role of a number of public health measures – so-called non-pharmaceutical interventions (NPIs) – aimed at reducing contact rates in the population and thereby reducing transmission of the virus. In the results presented here, we apply a previously published microsimulation model to two countries: the UK (Great Britain specifically) and the US. We conclude that the effectiveness of any one intervention in isolation is likely to be limited, requiring multiple interventions to be combined to have a substantial impact on transmission.
從結(jié)果上看,五位選手的學(xué)術(shù)造詣都比較高,學(xué)術(shù)語言使用的規(guī)范性也都相差不大。但是,細(xì)節(jié)見真知,只有有道保留了雙破折號(hào)的使用,但這在中文中其實(shí)并不常見;除有道外,其他三位選手在“非藥物干預(yù)措施(NPI)”的表達(dá)上都沒有做到盡善盡美。
仍然,笑到最后的還是 DeepL,雖然還存在各種小問題,無法得到滿分,但也是一張妥妥的高分試卷了:
以上就是本次測(cè)評(píng)全部的考題了,可以看出DeepL 不愧是頭號(hào)種子選手,不管是方言、文言文還是學(xué)術(shù)話語,都有不錯(cuò)的表現(xiàn),看來 DeepL 官方還是很誠實(shí)的嘛。
從 Linguee 蛻變,機(jī)器學(xué)習(xí)賦能 DeepL
見識(shí)到了 DeepL 的“獨(dú)秀”表現(xiàn),接下來,我們就重點(diǎn)介紹一下本次測(cè)評(píng)表現(xiàn)最佳的頭號(hào)種子 DeepL。
不知道 DeepL?那Linguee應(yīng)該聽說過吧,就是那個(gè)運(yùn)營十多年的在線外語詞典,DeepL 的前身正是 Linguee。Linguee 是一款出現(xiàn)多年的翻譯工具,盡管使用廣泛,也有一批忠實(shí)用戶,但其翻譯質(zhì)量尚無法與谷歌翻譯相提并論,尤其是考慮到后者品牌和地位的巨大優(yōu)勢(shì)。
但真正重要的是 Linguee 的技術(shù)積累,Linguee 的聯(lián)合創(chuàng)始人 Gereon Frahling 之前就在谷歌研究院工作,2007 年,他選擇開啟新的征程,團(tuán)隊(duì)數(shù)年來一直致力于機(jī)器翻譯,直到 2016 年,他們才開始全力開發(fā)全新的系統(tǒng),建設(shè)新公司,也就是 DeepL。
Linguee 的核心競(jìng)爭(zhēng)優(yōu)勢(shì)就是爬蟲和機(jī)器學(xué)習(xí)系統(tǒng),前者能夠抓取互聯(lián)網(wǎng)上超過 10 億句翻譯結(jié)果和查詢的大型數(shù)據(jù)庫,后者在網(wǎng)頁上搜索相似片段的真實(shí)翻譯方法并對(duì)其評(píng)估,兩者結(jié)合使 Linguee 成為了當(dāng)時(shí)“世界上首個(gè)翻譯搜索引擎”。
十年積累下來,Linguee無論在數(shù)據(jù)和對(duì)算法的研究上都不可小覷,而這也直接成為 DeepL 的絕對(duì)優(yōu)勢(shì),為團(tuán)隊(duì)訓(xùn)練新模型打好了堅(jiān)實(shí)的基礎(chǔ)。
DeepL 變革性的神經(jīng)架構(gòu)在冰島的一臺(tái)超級(jí)計(jì)算機(jī)上運(yùn)行,該計(jì)算機(jī)能力為5. 1 petaFLOPS(每秒 5100 萬億次操作),不到一秒內(nèi)能翻譯 100 萬單詞。“冰島可再生能源豐富,因此我們可以在這里用非常低廉的成本訓(xùn)練我們的神經(jīng)網(wǎng)絡(luò)。我們將繼續(xù)專注于高性能硬件”,DeepL 的 CTO Jaroslaw Kutylowski 說。
“我們的神經(jīng)網(wǎng)絡(luò)架構(gòu)已經(jīng)實(shí)現(xiàn)了多個(gè)顯著改善”,Gereon Frahling 表示,“通過用不同的方式安排神經(jīng)元及其連接,我們的網(wǎng)絡(luò)比目前其他神經(jīng)網(wǎng)絡(luò)更全面地映射自然語言。”
大學(xué)、研究機(jī)構(gòu)和 Linguee 的競(jìng)爭(zhēng)對(duì)手發(fā)布的研究進(jìn)展表明,卷積神經(jīng)網(wǎng)絡(luò)才是機(jī)器翻譯的正確道路,而非 DeepL 之前使用的循環(huán)神經(jīng)網(wǎng)絡(luò),但現(xiàn)在不是探討二者區(qū)別的時(shí)候,對(duì)于相關(guān)詞語的長、復(fù)雜字符串,只要你能夠控制其弱點(diǎn),卷積神經(jīng)網(wǎng)絡(luò)效果會(huì)更好。
例如,CNN 一次處理一個(gè)單詞,當(dāng)句末單詞決定句首單詞的形成時(shí),這就成了問題。查找整個(gè)句子尋找句首單詞,如果網(wǎng)絡(luò)獲取到的第一個(gè)單詞是錯(cuò)誤的,就太浪費(fèi)了,還得使用該知識(shí)重新開始,因此 DeepL 和機(jī)器學(xué)習(xí)領(lǐng)域的其他機(jī)構(gòu)在 CNN 轉(zhuǎn)向下一個(gè)單詞或詞組時(shí),使用能夠監(jiān)控此類潛在問題的“注意力機(jī)制”來解決。
DeepL 在最新版本增加了對(duì)日語和中文(簡(jiǎn)體)的支持,包括日語漢字,平假名和片假名以及數(shù)千個(gè)漢字。目前,DeepL 支持的語言數(shù)量增加到11 種,雖然語言支持不如其他翻譯服務(wù)廣泛,如 Google Translate 和 Bing Microsoft Translator 均支持一百多種不同的語言,但翻譯精度也是不可忽視的關(guān)鍵點(diǎn)。
掌握多國語言的 Techcrunch 編輯 Frederic 曾這么評(píng)價(jià) DeepL:“谷歌翻譯的風(fēng)格非常直接,但卻錯(cuò)過了一些細(xì)節(jié)和習(xí)語(或者把這些習(xí)語翻譯錯(cuò)了),而 DeepL 經(jīng)常可以提供更加自然的翻譯效果,就像訓(xùn)練有素的人類翻譯一樣。”
說了這么多,還是那句話,真真假假還是自己試了才知道,有興趣的同學(xué)可以親自動(dòng)手試試,要是遇到什么好玩的翻譯結(jié)果還記得告訴文摘菌噢~
最后,官網(wǎng)鏈接雙手奉上:
https://www.deepl.com/translator