分音塔CTO張明:深耕旅游行業,運用AI技術解決跨語言溝通問題
原創【51CTO.com原創稿件】二十世紀三十年代初,法國科學家G.B.阿爾楚尼提出用機器來進行翻譯想法。時至今日,諸多里程碑事件印證了機器翻譯的可行性和實用性,前景的廣闊毋庸置疑。為了更好地利用機器翻譯解決跨語言溝通的問題,谷歌、百度等國內外巨頭相繼成立相關團隊,當然也小而美的初創公司深耕細分行業,集中精力主攻某一場景,如分音塔。
近日,分音塔CTO張明接受了51CTO的專訪,他1999年于新加坡創新科技就職時期,便開始接觸機器翻譯,所以在這方面有著很多深入獨到的見解。
張明·分音塔CTO
機器翻譯三大階段:規則、統計算法(SMT)、深度學習(NMT)
張明表示,機器翻譯也和眾多技術發展的路線雷同,從技術角度來看,主要可以分為三大階段:規則、統計算法、深度學習:
規則
第一階段,是基于規則的方式。規則是由語言學家利用他們對知識、語言的理解進行定制,再由計算機領域專家來實現規則。
這樣的方式弊端很明顯,主要是因為規則不可窮舉,那么就沒辦法保證覆蓋到用戶輸入的所有內容。當用戶輸入的內容,與規則相匹配,翻譯效果會非常好,反之亦然。
SMT
第二階段,是基于統計算法的方式。隨翻譯領域數據的增長,開始對大量的語料資料用統計方法進行建模,逐漸擺脫對語言規則的依賴。
基于統計算法的方式實際上還是有語言學的原理在其中,整個翻譯過程是如何實現的,人的認知可以進行理解和詮釋。
NMT
第三階段,是基于深度學習的方式。目前,深度學習是一個黑盒應用,雖然按照不同模型進行翻譯,最終的翻譯效果會提升很多,對于實現過程如何,以目前人的認知,還不能夠進行詮釋。
運用AI細分技術 站在用戶的角度迭代產品
當問及為會選擇在2016年成立分音塔,張明表示,隨數據、NMT模型的發展,2015年前后,NMT超越SMT,整個翻譯效果提升非常大。2016年基本上編程NMT統一天下,SMT被淘汰,谷歌神經機器翻譯(GNMT)也在這期間問世。機器翻譯的整體效果能夠在某個場景領域下達到一個用戶的基本期望值,相關產品有了落地的可能。
利用AI技術解決跨語言溝通問題
上文所說的機器翻譯是純翻譯的設定,是文本到文本,中文到日文、中文到英文。但分音塔要做的事情是利用AI技術解決跨語言溝通問題,翻譯只是溝通過程中的一環節。
張明介紹,第一代準兒翻譯機的落地場景就是把某個人的語音翻譯成對話者能聽懂的語音。這看似簡單的邏輯背后,涉及到語音識別、機器翻譯、語音合成等AI細分技術,每個技術都需要具體不同系的技術點進行處理。
當問及這些AI細分技術目前哪個處于短板,張明說,無論是技術角度、還是用戶的市場需求來說,永遠沒有夠用的情況。就目前來看,還沒有出現能夠全部覆蓋所有的領域的通用平臺,這也是分音塔為什么只選擇深耕旅游行業的原因。只有把這些AI細分技術運用到旅游行業具體場景進行優化,盡量解決語音識別口語化順滑、吞音等問題,避免由于識別錯誤導致翻譯錯誤逐級被放大、或信息丟失等問題,提高翻譯機的整體理解率。
站在用戶的角度迭代產品
采訪過程中,張明重點強到分音塔不是一個純技術的公司,而是做產品、服務的公司,如何能夠給用戶提供更好的服務、更好體驗,才是公司的核心。
準兒翻譯機最初沒有設計屏幕,目的是小巧便攜。之后為應對溝通缺失問題,增設了屏幕設計,但是在顯示方面又略顯不足。當前我們正在使用的這一代,是觸摸式LED液晶屏,在溝通過程中起到很好的輔助作用。這幾次產品的迭代,都源于用戶的真實反饋。
緊接著,分音塔會在離線方面做更多探究,因為在旅游場景中,很多地方是WIFI,乃至未來的5G覆蓋不到的。
根據實際需求 對后端服務器進行調整優化
當問及在服務用戶過程中,是否對架構進行調整,張明坦言,在后端服務器部署方面初期確實沒有考慮周全。
在旅游行業,用戶使用翻譯機一般不會牽扯到高并發的問題,因為出售的所有翻譯機不可能同一時間被使用。所以在設計后端服務器時候并沒有過多考慮,只是滿足了當時在功能上的正常需求。
但在實際過程中,高并發問題雖然不會出現,但由于使用翻譯機的用戶會分布在不同國家,不同地區,傳統寬帶就表現的有些吃力。只能去尋找合適的節點進行部署,盡可能保證用戶在不同國家的訪問速度不會受到影響。
這里值得注意的是,在實際部署過程中,要結合重點客戶分布、使用分布地的情況,以及中國人出現最多的幾個國家,如日本、泰國、東南亞地區等。
采訪最后,張明表示,分音塔未來依然深扎旅游行業,核心還是圍繞吃住行,游娛購這六個方面。分音塔是一個初創公司,可能沒有大公司的資源豐富,沒有大公司的品牌影響力,但是有的是更多的專注,所有的團隊全部集中在旅游領域,真正從用戶需求、市場需求出發,致力為他們提供更好的產品與服務。
【51CTO原創稿件,合作站點轉載請注明原文作者和出處為51CTO.com】