機器翻譯的最新進展與瓶頸所在
你想過和異國人說話不需要再有翻譯,只需隨身攜帶一個輕巧的數碼機器嗎?目前來看這仍是奢望。不過,或許某一天,我們終于可以不再學習頭疼的外語就能實現和外國人的無縫交流。
機器翻譯是一個充滿挑戰的研究領域,正因為難度很大,它被列為21世紀世界十大科技難題之首。一路走來,機譯經歷了艱難而曲折的發展歷程,既有成功和興奮,也有挫折和困惑。
然而,需求永遠走在應用的前方。由于近年來全球化進程的加速以及國際交流的日趨頻繁,人們對于翻譯的需求***增長。而互聯網的普遍應用則使在線翻譯成了當今機譯的重頭戲。
在這一領域,競爭正變得***激烈。如今功能較強、方便易用的在線翻譯工具有谷歌翻譯、必應翻譯、臉譜翻譯、寶貝魚翻譯、巴比倫翻譯等,其中后起之秀的谷歌翻譯***特色,同時***代表性。
谷歌翻譯目前可提供63種主要語言之間的實時翻譯;它可以提供所支持的任意兩種語言之間的互譯,包括字詞、句子、文本和網頁翻譯。另外它還可以幫助用戶閱讀搜索結果、網頁、電子郵件、YouTube視頻字幕以及其它信息,用戶甚至還能在Gmail內進行實時的多語言對話。
谷歌翻譯主要是采用統計翻譯模型,往計算器內輸入大量的文字文本,包括源語言的文本,以及對應目標語言人工翻譯的文本,通過海量統計數據來提高翻譯精確度。
之所以采用統計翻譯模型,一個重要原因是,谷歌翻譯采用了云計算架構。該架構擁有谷歌研發的分布式計算系統(MapReduce)和分布式存儲系統(BigTable);而這兩個系統很有創造性,而且有極大的擴展性,使得谷歌在系統吞吐量上有很大的競爭力。
機譯更激動人心的應用,在于日常對話中的實時翻譯。這一領域同樣是谷歌領先;它擁有較強的語音識別技術,可以通過聲音實現自動檢索,再將語音識別和機譯結合在一起。
2011年11月,谷歌***推出了一款手機翻譯軟件;該軟件支持包括漢語普通話在內的14個語種。對著谷歌Android智能手機講話的用戶,幾乎能實時聽到他們的源語言被翻譯成目標語言;而通話對方的語言也會被翻譯成該用戶的母語。
谷歌董事長埃里克施密特稱,這種手機翻譯服務將會得到極大改善,甚至可能進行“同聲傳譯”;其前景是令人樂觀的。
谷歌的***科學家阿施斯維努戈帕爾稱,谷歌的最終目的是研發出能夠翻譯全球至少10億人所說的300種語言的手機軟件。
除了傳統的翻譯思路,一種被稱為解碼外語的新方法也小荷露出尖尖角。
這項由南加州大學的科學家們提出的全新機譯方法把英語視為一種初始語言,而需要翻譯的外語類似一種加密后的高級文字,通過譯碼破譯,把外語「破解」,變成英語。
不過,現實是骨感的。目前,這種翻譯方法只能翻譯一些短句或電影字幕,尚未運用到長句或片段翻譯中,但它卻給機譯研究打開了一條新的思路,且可以運用到任何一種語言中。科學家們稱,因為不需要任何既有的文本為基礎,這種翻譯方法今后甚至可以對“海豚音”或“外星人語言”進行破譯。
事實上,不論哪種方法,影響機譯發展的***因素在于譯文的質量。就已有的成就來看,機譯的質量離***目標仍相差甚遠。
中國數學家、語言學家周海中曾在論文《機器翻譯五十年》中指出:要提高機譯的質量,首先要解決的是語言本身問題而不是程序設計問題;單靠若干程序來做機譯系統,肯定是無法提高機譯質量的。
同時,他還指出:在人類尚未明了“人腦是如何進行語言的模糊識別和邏輯判斷”的情況下,機譯要想達到“信、達、雅”的程度是不可能的。這也是制約機譯質量提高的一大瓶頸。
值得一提的是,美國發明家、未來學家雷科茲威爾最近在接受《赫芬頓郵報》采訪時預言,到2029年機譯的質量將達到人工翻譯的水平。對于這一論斷,學術界還存在很多爭議。
不論怎樣,目前是人們對機譯最為看好的時期,這種關注是建立在一個客觀認識和理性思考的基礎上的。我們也有理由相信:在計算器專家、語言學家、心理學家、邏輯學家和數學家的共同努力下,機譯的瓶頸問題將會得以解決。