成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

火山引擎在機器翻譯多媒體領域的實踐和探索

企業動態
語音翻譯的問題比較復雜。視頻中人的講話往往有口音,或者有背景噪音,或者是翻譯之后的語言風格不符合預期。

   技術變革帶來了無限機遇,也帶來了更多的挑戰。作為服務于字節跳動等大規模企業的機器翻譯團隊,火山翻譯不斷在翻譯的各個領域進行探索。如今處于短視頻的風口,火山翻譯如何做到乘風而上?

  近日,在第十七屆全國機器翻譯大會(CCMT 2021)上,來自字節跳動火山翻譯團隊的產品經理劉堅就這一話題做了分享。以下是劉堅演講全文:

  

圖片1.png

 

  

圖片2.png

 

  火山引擎是字節跳動面向企業的一個智能科技品牌,就是大家俗稱的 to B——我們面向的是企業用戶。字節內部也有很多類似的服務是對外開放的。火山翻譯是火山引擎的核心中臺能力之一,是由我們機器翻譯和自然語言處理部門研發的。

  我們有幾大矩陣產品,產品列表包括同傳相關的直播翻譯服務、大會服務,通用翻譯的 API 和 SDK,視頻翻譯。能力上包含了文本、語音、圖像、語種識別、交互式翻譯和私有部署。到目前為止,火山翻譯從事翻譯工作已經有幾年時間,但真正對外服務只有一年多。此前,火山翻譯都是在內部為字節提供每天上億次的各種場景的翻譯需求,翻譯技術已經得到了驗證。

  

圖片3.png

 

  大家知道字節跳動,可能都是因為抖音這種app。多媒體內容的確也是公司關注的重點。我們首要的工作除了文本翻譯以外,就是要解決公司內部多媒體內容的翻譯。

  第一個擺在我們面前的就是視頻翻譯的需求。視頻里面一共有兩部分需要被翻譯。第一種是視頻里面可能存在的一些圖片內容,或者是一些硬字幕(即內嵌字幕:嵌入視頻畫面與視頻畫面融為一體的字幕),它們其實相當于圖像,我們需要對它們進行識別和翻譯。

  

圖片4.png

 

  抖音的深度用戶都知道,抖音視頻里會有很多貼紙,如果要翻譯它們,我們就需要用一個圖片翻譯的引擎,先借助OCR識別,再進行翻譯。

  以目前ppt上的圖片(我桌上的日歷)為例。我隨手一拍,然后用我們的圖片翻譯引擎去翻譯。它的特點是能還原一個區域內的顏色。大家可以看到日歷頂部的顏色得以保留,下面文本的位置也基本做到了保持原樣,這樣的方式應用在視頻翻譯中,就可以有比較好的翻譯效果。

  

圖片5.png

 

  語音翻譯的問題比較復雜。視頻中人的講話往往有口音,或者有背景噪音,或者是翻譯之后的語言風格不符合預期。我們不能直接把機器跑出來的結果傳給觀眾,這樣可能會讓觀眾費解或產生誤解。我們開發了一個平臺,通過這個平臺可以讓譯者把原來的很多修改工作去通過 AI迅速完成,從而節約時間。

  視頻翻譯技術在行業內有不少應用,我們著重講一講在直播這個領域的翻譯。

  直播有一個比較重要的特點是速度非常快,那么,我們如何在這么短的時間之內做到對直播進行翻譯,而且保證翻譯質量可控呢?

  目前業界有一些產品,提供的字幕是逐字同步ASR的結果,然后再翻譯。在這種情況下, 往往會有個問題 :它提交給翻譯的API結果會是一個字或者詞,這個時候翻譯出來的結果都是基于字和詞處理出來的,如果對于長篇幅的內容進行實時翻譯,斷句效果不好的話、翻譯質量會很差,無法真正實現對直播內容的同傳翻譯。如果用戶是通過譯文來理解會議內容的話,難度就會很高,看懂直播的話就更難了。

  所以我們自己開發了一個影院式 AI 字幕的解決方式。原理是這樣的:我們在線上收到一個直播流之后,先把這個直播流進行緩存,再對聲音和畫面進行拆解,并識別聲音。我們形成對應字幕,字幕支持人工進行修改。字幕整句整句地出現在屏幕上,和看電影的效果一樣。在說第一個字的時候,這句話就完整出現了。然后,等這句話全部說完時這個字幕才會消失。

  

圖片6.png

 

  大家可以看一下我們的效果。這是我們在抖音上為日本藝術家村上隆做的直播首秀。

  

圖片7.png

 

  下一個是我們一位同學模仿的主播帶貨場景。

  

圖片8.png

 

  這種翻譯方式有一個好處:因為字幕是一句句出的,所以我們可以針對一句的內容進行配音,用機器去合成。這樣,直播翻譯的效果就比較好。目前這個技術已經在公司內部的產品上面進行規模化應用,它可以大大提升不同國家之間跨語言的理解和溝通。

  最后介紹一下我們的另外一款智能翻譯產品。

  在大會場景下,大家都會遇到看字幕的問題。之前的方案就是在屏幕下方有一個字幕條。這個方案或多或少會有一些問題:其一,如果英國人參加中文會議,他想聽到的語言應該是英語;但如果是日本人或者法國人 ,那么英語可能不是你最理想的選擇。這時候如何能夠生成定制化的字幕?其二,如果在比較大的會場,坐在后排的人其實可能是看不見字幕的。那這個問題怎么解決?所以我們做了一款 AR 智能翻譯眼鏡(在我們展臺可以體驗)。

  

圖片9.png

 

  我們開發這么多的應用,本質上還是為了解決好“機器翻譯算法跟行業應用之間的最后一公里”的問題。

  智能翻譯眼鏡還在不斷優化,現在已經能實現語音翻譯、會議接入以及圖片翻譯等功能。比如看書、看菜單或者是看路標,都可以用這個眼鏡去翻譯。我們也在探索更多場景,比如最近我們就發現了一個比較有意思的場景:聽障人士也可以用這款眼鏡來獲取更多信息。

  最后,歡迎大家跟我們一起探討更多想法與發現,可以通過關注公眾號“火山翻譯”聯系到我們,也可以搜索“火山翻譯”進入我們的官網,來體驗我們的翻譯效果。

  

圖片10.png

 

責任編輯:張誠 來源: 互聯網
相關推薦

2021-10-13 18:57:59

AI

2023-05-31 14:54:32

2021-10-13 18:59:42

AI

2024-07-18 21:26:44

2021-10-28 17:52:51

機器翻譯人工智能AI

2023-03-27 21:24:18

架構數據處理分析服務

2023-08-15 13:57:08

開發者

2022-04-06 15:58:25

火山引擎差分隱私LDPDC

2021-12-15 07:24:57

人工神經網絡翻譯

2022-12-23 09:29:52

大數據

2020-10-11 22:05:22

機器翻譯谷歌AI

2021-10-23 09:20:39

AI

2017-03-22 12:39:33

人工智能機器翻譯

2017-08-21 16:00:14

機器學習機器翻譯

2024-09-23 19:53:27

數據飛輪數據驅動數字化轉型

2022-05-20 11:23:01

火山引擎A/B 測試ToB 市場
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 久久久久免费 | 国产日本精品视频 | 欧美一区二区大片 | 国产精品 欧美精品 | 亚洲国产精品一区在线观看 | 精品视频在线观看 | 日韩欧美不卡 | 国产成人综合网 | 成人精品国产免费网站 | 亚洲精品一区二区三区在线 | 在线日韩欧美 | 免费看a | 午夜视频大全 | 午夜精品久久 | 国产69精品久久99不卡免费版 | 日韩欧美黄色 | 国产成人精品久久 | 在线精品亚洲欧美日韩国产 | 午夜精品久久久 | 久久久黄色 | 一级爱爱片 | 免费av直接看| 男女激情网 | 国产精品久久久久无码av | 91久久久久久久久 | 久久亚洲国产精品日日av夜夜 | 亚欧洲精品在线视频免费观看 | 国产一区二区三区四区三区四 | 久久成人亚洲 | 成人在线精品视频 | 久久久一区二区三区 | 国产一区二区三区色淫影院 | 精品国产欧美 | 欧美情趣视频 | 九九免费视频 | 久久久久久成人 | 亚洲美女在线一区 | 中文字幕欧美日韩一区 | 在线观看日韩精品视频 | 国产色黄| 在线精品一区二区三区 |