成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

一個開源庫搞定各類文本到音頻生成,Meta發布AudioCraft

人工智能 新聞
為了高質量地生成各類音頻,AudioCraft 包含三個模型:MusicGen、AudioGen 和 EnCodec。其中,MusicGen 使用 Meta 具有版權的音樂數據進行訓練,基于用戶輸入的文本生成音樂。

近來,Meta 發布并開源了多個 AI 模型,例如 Llama 系列模型、分割一切的 SAM 模型。這些模型推動了開源社區的研究進展。現在,Meta 又開源了一個能夠生成各種音頻的 PyTorch 庫 ——AudioCraft,并公開了其技術細節。

圖片


  • 代碼地址:https://github.com/facebookresearch/audiocraft
  • 項目主頁:

https://audiocraft.metademolab.com/?utm_source=twitter&utm_medium=organic_social&utm_campaign=audiocraft&utm_cnotallow=card

AudioCraft 能夠基于用戶輸入的文本生成高質量、高保真的音頻。我們先來聽一下生成效果。

AudioCraft 可以生成一些現實場景中的聲音,例如輸入文本 prompt:「Whistling with wind blowing(風呼嘯而過)」

語音1,機器之心,5秒

還能生成有旋律的音樂,例如輸入文本 prompt:「Pop dance track with catchy melodies, tropical percussions, and upbeat rhythms, perfect for the beach(流行舞曲,具有朗朗上口的旋律、熱帶打擊樂和歡快的節奏,非常適合海灘)」

語音2,機器之心,30秒

甚至還可以選擇具體的樂器,生成特定的音樂,例如輸入文本輸入文本 prompt:「Earthy tones, environmentally conscious, ukulele-infused, harmonic, breezy, easygoing, organic instrumentation, gentle grooves(樸實的曲調,環保理念,尤克里里,和聲,輕松,隨和,有機樂器,柔和的節奏)」

語音3,機器之心,30秒

AudioCraft 簡介

相比于文本、圖像,音頻生成是更具挑戰性的,因為生成高保真音頻需要對復雜的信號和模式進行建模。

為了高質量地生成各類音頻,AudioCraft 包含三個模型:MusicGen、AudioGen 和 EnCodec。其中,MusicGen 使用 Meta 具有版權的音樂數據進行訓練,基于用戶輸入的文本生成音樂;AudioGen 使用公共音效數據進行訓練,基于用戶輸入的文本生成音頻;EnCodec 用于壓縮音頻并以高保真度重建原始信號,保證生成的音樂是高質量的。

圖片

從原始音頻信號生成音頻需要對極長的序列進行建模。例如,以 44.1 kHz 采樣的幾分鐘音樂曲目由數百萬個時間步(timestep)組成。相比之下,Llama 和 Llama 2 等基于文本的生成模型是將文本處理成子詞,每個樣本僅需要幾千個時間步。

MusicGen 是專門為音樂生成量身定制的音頻生成模型。音樂曲目比環境聲音更復雜,在創建新的音樂作品時,在長程(long-term)結構上生成連貫的樣本非常重要。MusicGen 在大約 400000 個錄音以及文本描述和元數據上進行訓練,總計 20000 小時的音樂。

AudioGen 模型可以生成環境聲音及聲效,例如狗叫聲、汽車喇叭聲或腳步聲。

圖片

AudioGen 模型架構。

EnCodec 神經音頻編解碼器從原始信號中學習離散音頻 token,這相當于給音樂樣本提供了新的固定「詞匯」;然后研究團隊又在這些離散的音頻 token 上訓練自回歸語言模型,以在使用 EnCodec 的解碼器將 token 轉換回音頻空間時生成新的 token、聲音和音樂。

總的來說,AudioCraft 簡化了音頻生成模型的整體設計。MusicGen 和 AudioGen 均由單個自回歸語言模型組成,并在壓縮的離散音樂表征流(即 token)上運行。AudioCraft讓用戶可以使用不同類型的條件模型來控制生成,例如使用預訓練的文本編碼器完成文本到音頻生成。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2023-08-03 07:24:40

MetaAI 語言模型

2023-08-04 17:33:27

Meta音頻AI

2024-02-07 12:37:23

模型數據

2023-02-13 13:58:15

模型開源

2023-04-03 10:04:44

開源模型

2012-07-30 09:40:52

Lua

2025-06-11 09:12:00

視頻生成AI

2023-11-28 14:22:54

Python音頻

2025-06-18 16:42:15

視頻生成AI模型

2024-12-04 11:07:09

2022-05-26 10:42:30

數據權限注解

2012-07-17 17:05:55

JavaScript

2022-02-15 15:38:02

人工智能機器學習Meta

2023-04-23 13:32:28

MetaAI開源

2025-03-03 08:32:00

模型AI訓練

2022-06-14 10:47:27

項目日志PUT

2024-12-09 17:32:37

2024-05-28 07:06:44

2023-10-10 08:22:12

Tesseract庫開源

2023-05-10 07:07:23

開源人工智能
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 亚洲视频一区在线观看 | 国产精品国产三级国产播12软件 | 免费观看一级特黄欧美大片 | 日韩午夜电影在线观看 | 亚洲精品成人网 | 中文av网站 | 福利网站导航 | 久久久久久久久综合 | 97精品国产97久久久久久免费 | 欧美另类视频 | 国内毛片毛片毛片毛片 | 国产视频久久 | 伊人网99 | 亚洲欧洲在线观看视频 | 成人日韩 | 日韩av成人 | 一区二区免费 | 在线a视频网站 | 天天操夜夜操免费视频 | 欧美www在线观看 | 午夜视频在线 | 免费成人在线网站 | 亚洲精品久久久久久一区二区 | 97精品国产97久久久久久免费 | 久在线 | 欧美又大粗又爽又黄大片视频 | 久久久久国产精品一区三寸 | 日韩高清一区 | 99久久久无码国产精品 | 91精品国产一区二区在线观看 | 久久综合久久综合久久 | 日韩毛片在线视频 | 看av电影| 久久伊人操 | 日韩av手机在线观看 | 在线免费观看黄色 | 日韩一区二区三区四区五区六区 | 欧美精品片 | 日韩一区二区在线观看视频 | 成人日韩精品 | 国产片侵犯亲女视频播放 |