成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

<cite id="484oy"><pre id="484oy"></pre></cite>

<rt id="484oy"><tr id="484oy"></tr></rt>

<rt id="484oy"></rt>

<button id="484oy"></button>

<li id="484oy"></li>

<rt id="484oy"><tr id="484oy"></tr></rt>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

賬號(hào)設(shè)置退出

Meta 開源語(yǔ)音 AI 模型支持 1,100 多種語(yǔ)言

作者：佚名 2023-05-25 16:24:13

自從ChatGPT火爆以來(lái)，各種通用的大型模型層出不窮，GPT4、SAM等等，本周一Meta 又開源了新的語(yǔ)音模型MMS，這個(gè)模型號(hào)稱支持4000多種語(yǔ)言，并且發(fā)布了支持1100種語(yǔ)言的預(yù)訓(xùn)練模型權(quán)重，最主要的是這個(gè)模型不僅支持ASR，還支持TTS，也就是說(shuō)不僅可以語(yǔ)音轉(zhuǎn)文字，還可以文字轉(zhuǎn)語(yǔ)音。

自從ChatGPT火爆以來(lái)，各種通用的大型模型層出不窮，GPT4、SAM等等，本周一Meta 又開源了新的語(yǔ)音模型MMS，這個(gè)模型號(hào)稱支持4000多種語(yǔ)言，并且發(fā)布了支持1100種語(yǔ)言的預(yù)訓(xùn)練模型權(quán)重，最主要的是這個(gè)模型不僅支持ASR，還支持TTS，也就是說(shuō)不僅可以語(yǔ)音轉(zhuǎn)文字，還可以文字轉(zhuǎn)語(yǔ)音。

因?yàn)橐郧皩?duì)語(yǔ)音方面沒(méi)有研究，所以我就查閱了一下資料，世界上一共有 7,000 多種語(yǔ)言（我一直以為只有幾百），目前的語(yǔ)音識(shí)別技術(shù)目前僅能覆蓋100多種，其實(shí)我覺(jué)得100多種已經(jīng)夠用了，當(dāng)然如果有特殊的研究需要那要另說(shuō)。

Facebook （Meta） AI 的最新大型多語(yǔ)言語(yǔ)音 (MMS) 項(xiàng)目可以為 1,100 多種語(yǔ)言提供語(yǔ)音轉(zhuǎn)文本、文本轉(zhuǎn)語(yǔ)音等功能。這是現(xiàn)有模型的 10 倍！它的官網(wǎng)blog上特別提到了Tatuyo 語(yǔ)，只有幾百人在使用。這其實(shí)對(duì)于日常來(lái)說(shuō)沒(méi)什么用，但是對(duì)于研究來(lái)說(shuō)這是一個(gè)很好的例子，因?yàn)橹挥袔装偃巳绾握业讲⒂行У奶釤挃?shù)據(jù)集呢？

Meta 與 OpenAI 的 Whisper 做了詳細(xì)的對(duì)比，在數(shù)據(jù)上訓(xùn)練的模型實(shí)現(xiàn)了一半的單詞錯(cuò)誤率，并且訓(xùn)練數(shù)據(jù)更少：

可以看到它的訓(xùn)練數(shù)據(jù)只有45k 小時(shí)的標(biāo)注數(shù)據(jù)，要比Whisper少10倍，而語(yǔ)言支持也多了10倍，這是一個(gè)大的提高。在blog中還特意提到了使用了《圣經(jīng)》這種流傳廣泛，翻譯語(yǔ)種多的內(nèi)容作為數(shù)據(jù)集，我覺(jué)得這是一個(gè)很好方向。

MMS 項(xiàng)目還利用了 wav2vec 2.0 自監(jiān)督語(yǔ)音表示學(xué)習(xí)技術(shù)的優(yōu)勢(shì)。在 1,400 種語(yǔ)言的大約 500,000 小時(shí)的語(yǔ)音數(shù)據(jù)上進(jìn)行自監(jiān)督的訓(xùn)練，明顯減少了對(duì)標(biāo)記數(shù)據(jù)的依賴。然后針對(duì)特定的語(yǔ)音任務(wù)對(duì)生成的模型進(jìn)行微調(diào)，例如多語(yǔ)言語(yǔ)音識(shí)別和語(yǔ)言識(shí)別。

Whisper 的效果對(duì)于我來(lái)說(shuō)就已經(jīng)非常好了，我也一直在使用他做為語(yǔ)言轉(zhuǎn)文字的工具，如果MMS的效果更好，那對(duì)于我們來(lái)說(shuō)簡(jiǎn)直太棒了，并且MMS還支持 language identification (LID) 也就說(shuō)可以自動(dòng)識(shí)別所說(shuō)的語(yǔ)言，但是經(jīng)過(guò)我的測(cè)試，這個(gè)對(duì)于支持這么多種語(yǔ)言的模型來(lái)說(shuō)有一個(gè)致命的錯(cuò)誤，就是轉(zhuǎn)錄或錯(cuò)誤解釋可能會(huì)導(dǎo)致冒犯性或不準(zhǔn)確的語(yǔ)言。

還記得大張偉嗎,越是準(zhǔn)確的模型越會(huì)出問(wèn)題：

這種多語(yǔ)言語(yǔ)音模型的出現(xiàn)使得語(yǔ)言障礙將被打破，來(lái)自全球每個(gè)角落人們都可以通過(guò)聲音正常的交流。還記得META爛尾的VR和AR應(yīng)用嗎，我覺(jué)得MMS應(yīng)該是它們VR的一個(gè)子項(xiàng)目，VR爛尾很正常，但是這個(gè)MMS會(huì)為我們帶來(lái)更多的進(jìn)步。

最后地址,里面有預(yù)訓(xùn)練模型下載和安裝方法：

https://github.com/facebookresearch/fairseq/tree/main/examples/mms

責(zé)任編輯：華軒來(lái)源： DeepHub IMBA

ChatGPT 人工智能語(yǔ)音識(shí)別

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營(yíng)

主站蜘蛛池模板：男人的天堂在线视频 | www.日本国产| 日韩久草| 欧美亚洲一区二区三区 | 国产九九av | 国产日韩免费视频 | 欧美性a视频 | 亚洲视频三区 | 亚洲欧美日韩在线不卡 | 久久亚洲一区二区三区四区 | 精品视频久久久 | 久久夜色精品国产 | 久久88 | 精品国产18久久久久久二百 | 国产日产精品一区二区三区四区 | 中文字幕日韩一区 | 综合精品久久久 | 美女一级黄 | 91亚洲精品国偷拍自产在线观看 | 亚洲欧美一区二区三区1000 | 成人免费观看网站 | 日本a在线| 超碰97人人人人人蜜桃 | 亚洲国产精品激情在线观看 | 国产成人99久久亚洲综合精品 | 免费成人高清在线视频 | 国产黄色在线观看 | 亚洲成人在线视频播放 | 中文字幕在线观看日韩 | 国产精品无 | 在线观看电影av | 欧美精品一区二区在线观看 | 亚洲高清在线 | 欧美视频在线播放 | 国产电影一区二区三区爱妃记 | 色影视| 美女久久| 精品在线免费看 | 91人人在线 | 五月婷婷丁香婷婷 | 亚洲一区视频在线 |

<s id="8mi88"></s>

<abbr id="8mi88"></abbr>

<nav id="8mi88"><dl id="8mi88"></dl></nav>

<button id="8mi88"></button>