成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Meta發布支持128種語言的新語音模型:指向元宇宙跨語種交流

新聞 語音識別
Facebook AI(bushi),更準確地說是Meta AI,剛剛發布了自監督語音處理模型XLS-R,共支持128種語言。

本文經AI新媒體量子位(公眾號ID:QbitAI)授權轉載,轉載請聯系出處。

 Facebook AI(bushi),更準確地說是Meta AI,剛剛發布了自監督語音處理模型XLS-R,共支持128種語言

[[436245]]

這項技術與Meta公司最新“元宇宙”愿景緊密相關。

相互交談是人們互動的一種自然方式,隨著語音技術的發展,未來的虛擬世界可以使用我們技術進行互動,虛擬體驗將與物理世界融為一體。

說人話,就是讓母語不同的人在元宇宙里社交:一位說著英語,一位說著漢語,兩人可以靠XLS-R在元宇宙中無障礙對話。

Meta發布支持128種語言的新語音模型:指向元宇宙跨語種交流

實際效果如何呢?

MetaAI在HuggingFace上發布了試用版語音直譯模型,支持從22種語言轉換到16種語言,我們先來試試它的英譯中效果。

Meta發布支持128種語言的新語音模型:指向元宇宙跨語種交流

Meta發布支持128種語言的新語音模型:指向元宇宙跨語種交流

(雖然翻譯腔較濃,但仍算準確,7秒鐘的句子完成翻譯僅1.53秒)

我們知道,世界上的語言有上千種,要用AI實現這些語言的互通并非易事。

一般語料庫的豐富程度決定了語言翻譯模型的質量,語音翻譯一般集中于幾個資源多大語種之間。但是由于小語種往往語料匱乏,使用這類母語的人往往很難獲得較高的AI翻譯質量。

XLS-R通過自監督技術對10倍的語音數據進行訓練,大大改善了以前的多語言模型,尤其是小語種的處理。

XLS-R的原理

XLS-R基于Facebook去年發布的wav2vec 2.0技術。

wav2vec 2.0與BERT類似,是通過預測音頻mask部分的語音單元來訓練的。它們的區別是,語音音頻是一種連續的信號,不能輕易清晰地分割成單詞或其他單位。

wav2vec 2.0通過學習25毫秒長的基本單元來解決這個問題,以便能夠學習高級上下文表示。

Meta發布支持128種語言的新語音模型:指向元宇宙跨語種交流

在僅擁有一小時的標記訓練數據的情況下,wav2vec 2.0能通過后續無監督的訓練數據,在LibreSpeech測試基準的100小時子集上達到SOTA水平。

之后,Facebook又推出了完全無監督的高性能語音識別模型wav2vec-U,它純粹從錄制的語音音頻和未配對的文本中學習。

為了wav2vec-U讓學習識別音頻錄音中的單詞,Facebook訓練了一個GAN。生成器根據嵌入在自監督表示中的每個音頻段,預測與語言中的聲音對應的音素。

而鑒別器負責評估預測的音素序列是否真實。最初,轉錄非常糟糕,但隨著時間的推移,隨著鑒別器的反饋,轉錄變得準確。

Meta發布支持128種語言的新語音模型:指向元宇宙跨語種交流

通過這種方式,它學會了區分生成器的語音識別輸出和真實文本。

Facebook在此基礎上推出了包含53種語言的XLSR。

而最新發布的XLS-R有128種語言之多,語種數量是XLSR的兩倍多,數據量更是后者10倍——共計長達43.6萬小時的語音。

Meta發布支持128種語言的新語音模型:指向元宇宙跨語種交流

XLS-R共有20億參數,它在測試的37種語言中,表現優于大多數語種先前的工作。甚至在老撾語等小語種識別上,也能低于之前的錯誤率。

Meta發布支持128種語言的新語音模型:指向元宇宙跨語種交流

此外XLS-R也讓低資源語言與英語之間的翻譯大幅改進,例如從印度尼西亞語到英語的翻譯,其中BLEU(雙語互譯質量評估)的準確性平均翻了一番。

CoVoST-2語音翻譯基準測試中,XLS-R在21個英語翻譯方向上比之前技術平均提高了7.4 BLEU。

從下圖中可以看出,XLS-R對低資源語種的提升尤為明顯。

Meta發布支持128種語言的新語音模型:指向元宇宙跨語種交流

微調XLS-R

XLS-R只是一個預訓練模型,為了能更好地服務于具體任務,還需要對模型進行微調。

Hugging Face官方提供了詳細的微調教程。

Meta發布支持128種語言的新語音模型:指向元宇宙跨語種交流

此外官方還提供不同參數規模的語音識別模型,以及15種語言與英語之間的互譯模型,供用戶下載。

傳送門

官方博客:
https://ai.facebook.com/blog/xls-r-self-supervised-speech-processing-for-128-languages/

GitHub頁:
https://github.com/pytorch/fairseq/tree/main/examples/wav2vec/xlsr

論文地址:
https://arxiv.org/abs/2111.09296v1

試用網頁地址:
https://huggingface.co/spaces/facebook/XLS-R-2B-22-16

微調方法簡介:
https://huggingface.co/blog/fine-tune-xlsr-wav2vec2

 

責任編輯:張燕妮 來源: 量子位
相關推薦

2023-08-23 11:15:20

2023-05-25 16:24:13

2023-12-03 08:57:54

開源模型

2022-07-20 16:36:02

模型AI

2022-07-28 14:22:50

元宇宙AI

2022-02-28 14:54:40

FacebookMeta元宇宙

2022-02-24 12:46:03

3D元宇宙AI

2021-11-04 23:17:50

人工智能自然語言技術

2023-02-03 17:50:29

元宇宙資本

2021-11-05 11:01:47

人工智能元宇宙面部識別

2022-04-26 23:35:52

元宇宙Meta數據隱私

2022-06-17 08:30:00

元宇宙Meta架構

2022-04-01 11:13:48

語音識別機器學習微軟

2022-05-09 10:53:31

虛擬元宇宙

2023-02-13 08:01:56

2022-11-01 14:40:41

元宇宙

2023-05-23 14:14:14

技術模型

2023-07-03 09:47:38

AI語音

2022-11-28 09:18:03

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 日韩一级电影免费观看 | 亚洲二区在线 | 日韩中文字幕一区 | 午夜成人免费视频 | 久久y| 中文字幕一区二区三区精彩视频 | 日韩欧美手机在线 | 韩国av一区二区 | 欧美日韩久久精品 | 天天操 天天操 | 性在线 | 久久久久久久久久久久久九 | 99久久久久| 日韩一区二区福利视频 | 免费在线成人 | 日韩视频在线免费观看 | 一区二区三区高清在线观看 | 色悠悠久| 精品一区二区三区四区外站 | 亚洲a毛片| 久久国产精品视频 | 亚洲三区在线播放 | 日韩精品在线播放 | 日日日日日日bbbbb视频 | 国产成人精品久久二区二区91 | 亚洲福利av| 日韩在线视频免费观看 | 涩涩视频网站在线观看 | 欧美日韩高清免费 | 中文字幕精品一区二区三区精品 | 精品久久久久国产免费第一页 | 日韩精品一区二区三区免费观看 | 成人啊啊啊 | 中文字幕91av | 在线视频 欧美日韩 | 久久69精品久久久久久久电影好 | 毛片视频观看 | 午夜影院在线观看版 | 黄色大全免费看 | 精品久久久久久久久久 | 免费在线观看av的网站 |