成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Meta 開源首個 AI 語音翻譯系統,閩南話和英語可以直接語音互譯!

開源 新聞
這是由 Meta 開源的第一個由 AI 驅動的非書面的、語音到語音的翻譯系統。

機器翻譯是現今人類消除語言障礙、重建巴別塔的新工具。然而,在世界現存的 7000 多種已知語言中,許多低資源語言還未得到足夠的關注,尤其是有近一半的語言沒有標準的書面系統,這是構建機器翻譯工具的一大障礙,所以目前 AI 翻譯主要集中在書面語言上。

在利用 AI 推動自然語言翻譯這件事上,Meta 一直致力于“No Language Left Behind”(沒有一種語言被落下)的目標。

比如漢語方言之一閩南話,現在也有了專屬的機器翻譯系統,講閩南話的人可以與講英語的人進行無障礙對話了。

這是由 Meta 開源的第一個由 AI 驅動的非書面的、語音到語音的翻譯系統。來聽聽這項工作的負責人、Meta AI 研究員 Peng-Jen Chen 與小扎的對話,Chen 出生于中國臺灣。

該系統可以將閩南話的語音翻譯成英語語音,反之亦可。會講閩南話的讀者可以來檢驗一下,是不是翻譯效果還挺不錯?

據了解,這個開源翻譯系統是 Meta 的通用語音翻譯(UST) 項目的一部分,該項目致力于開發新的人工智能方法,幫助實現所有現存語言的實時語音到語音的翻譯。目前,Meta 已經開源了該翻譯模型和評估數據集,研究論文如下:

圖片

論文地址:https://research.facebook.com/file/799432337944526/Speech-to-speech-translation-for-a-real-world-unwritten-language.pdf

克服訓練數據的挑戰

閩南話是漢語方言之一,是一種低資源語言,沒有標準的書寫系統,人工的英語到閩南話翻譯人員也相對很少,所以為模型收集和標注訓練數據就變得更加困難。

圖片

圖注:講閩南話(Hokkien)的人的數量

為此,來自 Meta AI 的研究團隊采用了一種特殊放方案,利用漢語普通話(屬于高資源語言)作為中間語言來構建偽標簽和人工翻譯。他們首先將英語(或閩南話)語音翻譯成普通話文本,然后再翻譯成閩南話(或英語)并將其添加到訓練數據中。這種方法通過利用來自類似高資源語言的數據,極大地提高了模型性能。

語音挖掘是訓練數據生成的另一種方法。使用預訓練的語音編碼器,能夠將閩南話語音嵌入編碼到與其他語言相同的語義空間中,所以閩南話沒有書面形式也不造成問題。閩南話語音可以與語義嵌入相似的英語語音和文本對齊,然后從文本中合成英語語音,產生并行的閩南話和英語語音。

圖片

圖注:無需人類標注的語音翻譯模型

新的建模方法:語音到語音

許多語音翻譯系統都依賴轉錄或者是語音到文本的系統。但是,閩南話的形式主要是口語,缺乏標準的書面文字系統,無法轉錄成文本作。所以,Meta 所構建的是一個語音到語音的翻譯系統。

研究人員使用語音到單元(speech-to-unit,S2UT)翻譯,將輸入語音直接翻譯成一系列的聲學單元,這也是 Meta 先前最早開創的一種路徑。然后,從這些聲學單元中生成波形。此外,研究人員還采用了 UnitY 作為雙通道解碼機制,第一通道解碼器生成相關語言(即漢語普通話)的文本,第二通道解碼器創建單元。

圖片

圖注:UnitY 模型架構

新的準確性評估系統

語音翻譯系統的評估工具通常是 ASR-BLEU 指標,該指標首先使用自動語音識別 (ASR) 將翻譯后的語音轉錄為文本,然后將轉錄文本與人工翻譯的文本進行比較,計算 BLEU 分數。

但要評估閩南話的語音翻譯系統,難處還是在于它沒有標準的書面文字系統。所以,為了實現自動評估,研究人員開發了一個系統,將閩南語語音轉錄為一種稱為 Tai-l? 的標準化注音符號。這樣就能在音節的層面上計算 BLEU 分數,從而比較不同方法的翻譯質量。

除了開發這種評估閩-英語音翻譯的方法外,研究人員還基于閩南話語料庫 Taiwanese Across Taiwan,創建了第一個閩-英雙向語音到語音翻譯基準數據集。該基準數據集將開源,以方便更多研究人員從事閩南話語音翻譯工作。

不止閩南話

這項工作所用技術可以進一步擴展到許多其他書面和非書面語言。

為此,Meta 還發布了  SpeechMatrix,它是一個大型的語音到語音翻譯語料庫,使用了 Meta 的創新數據挖掘技術 LASER, 從歐洲議會錄音的真實演講中挖掘數據。該數據庫包含 136 種語言對的語音對齊,共 41.8 萬小時的語音。挖掘的數據和模型都是免費的,研究人員可以創建自己的語音到語音翻譯 (S2ST) 系統。

圖片

圖注:LASER 挖掘獲得的語音到語音成對數據

Meta 在無監督語音識別 ( wav2vec-U ) 和無監督機器翻譯( mBART )方面的研究進展,也為口語翻譯工作提供了支持。比如用于預訓練語音模型的無監督域自適應技術,提高了下游無監督語音識別的性能,尤其是對于低資源語言,在沒有任何人工標注的情況下,可以構建高質量語音到語音翻譯模型。

該模型仍在不斷推進中,目前一次只能翻譯一個完整的句子,但這邁出了未來實現語言間同聲傳譯的一步。

據 Meta AI 的研究員 Peng-Jen Chen 說,這個閩南話翻譯系統其實有一部分是出于他的一個私人心愿。他在中國臺灣長大,同時會講普通話,但是他的父親普通話不好,他希望他的父親能夠用閩南話與每個人都順暢地交流。這也是 AI 之于人類的意義之一。

責任編輯:張燕妮 來源: AI科技評論
相關推薦

2023-05-25 16:24:13

2025-06-27 05:00:00

AI語音詐騙AI語音識別人工智能

2023-08-29 13:54:00

AI技術

2023-08-23 11:15:20

2023-12-03 08:57:54

開源模型

2015-12-22 17:40:54

面包英語

2019-06-24 09:30:00

開源技術 趨勢

2014-12-08 09:40:38

ACAT語音系統

2022-04-08 14:58:22

AI語音智能

2023-08-28 00:33:48

開源語音識別

2017-09-06 10:51:22

Facebook

2021-06-21 15:57:03

阿里云AI語音語義

2023-02-25 16:12:08

2021-05-06 11:18:23

人工智能語音識別

2021-05-06 11:13:06

人工智能語音識別

2023-06-13 13:45:35

框架語音

2018-12-27 10:52:10

Facebook 開發開源
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 中文字幕99| 国产在线精品一区二区三区 | 伊人久久综合 | 国产不卡在线播放 | 国产欧美视频一区 | 免费观看成人性生生活片 | 欧美啪啪网站 | 亚洲欧美综合 | 欧美在线一区视频 | 国产成人久久av免费高清密臂 | 亚洲欧美精| 三区在线 | 欧美成人激情 | 激情国产 | av入口 | 国产午夜精品福利 | 亚洲视频中文字幕 | 国产精品久久精品 | 日韩中文字幕 | 日日噜噜噜夜夜爽爽狠狠视频97 | 中文字幕 在线观看 | 国产日韩欧美一区 | 中国美女av| 亚洲日韩中文字幕一区 | 日本污视频 | 国产精品v | 免费在线观看一区二区 | 精品亚洲一区二区 | 久久久爽爽爽美女图片 | 久久精品99 | 成人一区二区三区在线观看 | 亚洲精品国产a久久久久久 午夜影院网站 | 国产欧美日韩一区二区三区在线 | 免费亚洲一区二区 | 91在线一区二区三区 | 国产一区免费 | 午夜亚洲 | 亚洲综合在线播放 | 99精品视频在线 | 黄色毛片视频 | 精品国产91亚洲一区二区三区www |