成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Facebook 開源首個全卷積語音識別工具包 wav2letter++

新聞 開源
近日,Facebook 人工智能研究院 ( FAIR ) 宣布開源首個全卷積語音識別工具包 wav2letter++。

 近日,Facebook 人工智能研究院 ( FAIR ) 宣布開源首個全卷積語音識別工具包 wav2letter++。系統基于全卷積方法進行語音識別,訓練語音識別端到端神經網絡的速度是其他框架的 2 倍多。他們在博客中對此次開源進行了詳細介紹。

[[253591]]

由于端到端語音識別技術能夠輕易擴展至多種語言,同時能在多變的環境下保證識別質量,因此被普遍認為是一種高效且穩定的語音識別技術。雖說遞歸卷積神經網絡在處理具有遠程依賴性的建模任務上很占優勢,如語言建模、機器翻譯和語音合成等,然而在端到端語音識別任務上,循環架構才是業內的主流。

有鑒于此,Facebook 人工智能研究院 (FAIR) 的語音小組上周推出首個全卷積語音識別系統,該系統完全由卷積層組成,取消了特征提取步驟,僅憑端到端訓練對音頻波形中的轉錄文字進行預測,再通過外部卷積語言模型對文字進行解碼。隨后 Facebook 宣布開源 wav2letter ++——這種高性能框架的出現,讓端到端語音識別技術得以實現快速迭代,為技術將來的優化工作和模型調優打下夯實的基礎。

與 wav2letter++ 一同宣布開源的,還有機器學習庫 Flashlight。Flashlight 是建立在 C++基礎之上的機器學習庫,使用了 ArrayFire 張量庫,并以 C++進行實時編譯,目標是最大化 CPU 與 GPU 后端的效率和規模,而 wave2letter ++工具包建立在 Flashlight 基礎上,同樣使用 C++進行編寫,以 ArrayFire 作為張量庫。

這里著重介紹一下 ArrayFire,它可以在 CUDA GPU 和 CPU 支持的多種后端上被執行,支持多種音頻文件格式(如 wav、flac 等),此外還支持多種功能類型,其中包括原始音頻、線性縮放功率譜、log 梅爾譜 (MFSC) 和 MFCCs 等。

Github 開源地址:

https://github.com/facebookresearch/wav2letter/

在 Facebook 對外發布論文中,wav2letter++被拿來與其他主流開源語音識別系統進行對比,發現 wav2letter++訓練語音識別端到端神經網絡速度是其他框架的 2 倍還多。其使用了 1 億個參數的模型測試,使用從 1~64 個 GPU,且訓練時間是線性變化的。

圖片來源:Facebook

上面為系統的網絡結構圖,主要由 4 個部分組成:

可學習前端(Learnable front end):這部分包含寬度為 2 的卷積(用于模擬預加重流程)和寬度為 25 ms 的復卷積。在計算完平方模數后,由低通濾波器和步長執行抽取任務。最后應用于 log-compression 和 per-channel mean-variance normalization 上。

聲學模型:這是一款帶有門線性單元(GLU)的卷積神經網絡,負責處理可學習前端的輸出內容。基于自動分割準則,該模型在字母預測任務上進行訓練。

語言模型:該卷積語言模型一共包含 14 個卷積殘差塊,并將門線性單元作為激活函數,主要用來對集束搜索解碼器中語言模型的預備轉錄內容進行評分。

集束搜索解碼器(Beam-search decoder):根據聲學模型的輸出內容生成詞序列。

文章轉載自:https://www.leiphone.com/news/201812/t4K6BSfiYXkruwZb.html 作者:黃善清

責任編輯:張燕妮 來源: 雷鋒網
相關推薦

2016-01-27 13:34:07

開源語音識別CNTK

2017-06-26 15:15:24

開源語音識別工具包

2021-03-16 14:44:30

工具代碼開發

2020-12-21 15:11:33

機器學習工具開源

2021-01-25 21:01:42

開源技術 工具

2016-02-16 13:21:33

2019-05-13 09:22:21

微軟開源機器學習

2017-09-06 10:51:22

Facebook

2009-04-02 17:37:38

dom4jXMLJava

2018-05-03 09:03:16

微軟工具包Windows

2024-06-18 12:26:50

2014-02-26 09:44:59

Facebook開源工具Fbthrift

2016-10-13 09:20:21

FacebookWindows 10osquery

2009-06-18 15:42:15

J2EE架構

2009-04-13 11:27:53

IBMdW

2022-04-09 10:02:59

HTTPLInux開源

2024-01-08 19:30:15

AI開源語音識別

2021-06-17 10:28:42

谷歌開源轉譯器

2015-11-11 14:01:26

微軟開源分布式

2022-06-19 14:09:04

開源AdobeCAI
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 99国产欧美| 久久亚洲一区 | 秋霞av国产精品一区 | 午夜精品一区二区三区免费视频 | 国产精品亚洲一区二区三区在线 | 午夜男人天堂 | 欧美a级成人淫片免费看 | 久久久婷婷 | 亚洲精品小视频在线观看 | 奇色影视 | 日韩一区二区三区视频 | 欧美日韩一区二区在线播放 | 欧美九九九 | 中文字幕 欧美 日韩 | 国产高清一区二区 | 91精品国产自产在线老师啪 | 国产精品一码二码三码在线 | 国产精品久久二区 | 国产精品亚洲视频 | 日韩欧美中文字幕在线视频 | 成人永久免费 | 中文字幕在线免费观看 | 成年无码av片在线 | 99久久精品视频免费 | 国产 欧美 日韩 一区 | 日韩在线不卡 | 一区二区三区四区在线 | 亚洲精品一区二区三区中文字幕 | 成人免费淫片aa视频免费 | 一级a爱片性色毛片免费 | 亚洲精品www | 国产伦一区二区三区视频 | 99久久精品国产一区二区三区 | 亚洲天堂男人的天堂 | 欧美理伦片在线播放 | 日韩福利 | 国产亚洲欧美另类一区二区三区 | 欧美在线视频不卡 | 亚洲视频区| 国产欧美一区二区三区在线看蜜臀 | 色综合99|