成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

時(shí)域音頻分離模型登GitHub熱榜,效果超傳統(tǒng)頻域方法

新聞 前端
用AI對(duì)歌曲音軌的分離研究很多,不過(guò)大多數(shù)都是在頻域上進(jìn)行的。這類方法先把聲音進(jìn)行傅立葉變換,再?gòu)念l譜空間中把人聲、樂(lè)曲聲分別抽離出來(lái)。

 本文經(jīng)AI新媒體量子位(公眾號(hào)ID:QbitAI)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請(qǐng)聯(lián)系出處。

用AI對(duì)歌曲音軌的分離研究很多,不過(guò)大多數(shù)都是在頻域上進(jìn)行的。這類方法先把聲音進(jìn)行傅立葉變換,再?gòu)念l譜空間中把人聲、樂(lè)曲聲分別抽離出來(lái)。

時(shí)域音頻分離模型登GitHub熱榜,效果超傳統(tǒng)頻域方法

比如,上個(gè)月在GitHub上大熱的Spleeter,就是這樣。

[[284644]]

但是由于要計(jì)算頻譜,這類工具存在著延遲較長(zhǎng)的缺點(diǎn)。雖然之前也有一些對(duì)聲音波形進(jìn)行處理的方法,但實(shí)際效果與頻域處理方法相差甚遠(yuǎn)。

最近,F(xiàn)acebook AI研究院提供了兩種波形域方法的PyTorch實(shí)現(xiàn),分別是DemucsConv-Tasnet,而且測(cè)試結(jié)果均優(yōu)于其他常見(jiàn)的頻域方法,目前登上了GitHub日榜

效果對(duì)比

話不多說(shuō),我們先來(lái)聽(tīng)聽(tīng)這段30s音頻的分離實(shí)測(cè)效果。

vocals.mp3

00:30.069

來(lái)自量子位

這兩種方法在MusDB上的訓(xùn)練結(jié)果已經(jīng)接近了頻域方法的最優(yōu)結(jié)果,加入150首額外的訓(xùn)練數(shù)據(jù)后,總體信號(hào)失真比(overall SDR)達(dá)到了6.3,超過(guò)了其他所有方法。

時(shí)域音頻分離模型登GitHub熱榜,效果超傳統(tǒng)頻域方法

安裝與使用方法

先將代碼下載到本地,根據(jù)自己用CPU還是GPU來(lái)選擇不同的安裝環(huán)境:

  1. conda env update -f environment-cpu.yml # if you don’t have GPUs 
  2. conda env update -f environment-cuda.yml # if you have GPUs 
  3. conda activate demucs 

在代碼庫(kù)的根目錄下運(yùn)行以下代碼(Windows用戶需將python3換為python.exe):

  1. python3 -m demucs.separate --dl -n demucs PATH_TO_AUDIO_FILE_1 [PATH_TO_AUDIO_FILE_2 ...] # for Demucs 
  2. python3 -m demucs.separate --dl -n tasnet PATH_TO_AUDIO_FILE_1 ... # for Conv-Tasnet 
  3. # Demucs with randomized equivariant stabilization (10x slower, suitable for GPU, 0.2 extra SDR) 
  4. python3 -m demucs.separate --dl -n demucs --shifts=10 PATH_TO_AUDIO_FILE_1 

其中—dl將自動(dòng)下載預(yù)訓(xùn)練模型,-n后的參數(shù)代表選用的預(yù)訓(xùn)練模型類型:

demucs:表示在MusDB上進(jìn)行訓(xùn)練的Demucs;
demucs_extra:使用額外數(shù)據(jù)訓(xùn)練的Demucs;
tasnet:表示在MusDB上進(jìn)行訓(xùn)練的Conv-Tasnet;
tasnet_extra:使用額外數(shù)據(jù)訓(xùn)練的Conv-Tasnet。

在—shifts=SHIFTS執(zhí)行多個(gè)預(yù)測(cè)與輸入和平均他們的隨機(jī)位移(又名隨機(jī)等變穩(wěn)定)。這使預(yù)測(cè)SHIFTS時(shí)間變慢,但將Demucs的精度提高了SDR的0.2點(diǎn)。它對(duì)Conv-Tasnet的影響有限,因?yàn)樵撃P捅举|(zhì)上幾乎是等時(shí)的。原始紙張使用10的值,盡管5產(chǎn)生的增益幾乎相同。默認(rèn)情況下禁用它。

原理簡(jiǎn)介

Demucs是Facebook人工智能研究院在今年9月提出的弱監(jiān)督訓(xùn)練模型,基于受Wave-U-Net和SING啟發(fā)的U-Net卷積架構(gòu)。

研究人員引入了一個(gè)簡(jiǎn)單的卷積和遞歸模型,使其比Wave-U-Net的比信號(hào)失真比提高了1.6個(gè)點(diǎn)。

時(shí)域音頻分離模型登GitHub熱榜,效果超傳統(tǒng)頻域方法

上圖是Demucs的完整框架結(jié)構(gòu),右側(cè)是編碼器和解碼器層的詳細(xì)表示。

與之前的Wave-U-Net相比,Demucs的創(chuàng)新之處在于編碼器和解碼器中的GLU激活函數(shù),以及其中的雙向LSTM和倍增的通道數(shù)量。

Conv-TasNet是哥大的一名中國(guó)博士生Yi Luo提出的一種端到端時(shí)域語(yǔ)音分離的深度學(xué)習(xí)框架。

Conv-TasNet使用線性編碼器來(lái)生成語(yǔ)音波形的表示形式,該波形針對(duì)分離單個(gè)音軌進(jìn)行了優(yōu)化。音軌的分離則是通過(guò)將一組加權(quán)函數(shù)(mask)用于編碼器輸出來(lái)實(shí)現(xiàn)。

時(shí)域音頻分離模型登GitHub熱榜,效果超傳統(tǒng)頻域方法

然后使用線性解碼器將修改后的編碼器表示形式反轉(zhuǎn)回波形。由卷積的一維擴(kuò)張卷積塊組成的時(shí)間卷積網(wǎng)絡(luò)(TCN)查找mask,使網(wǎng)絡(luò)可以對(duì)語(yǔ)音信號(hào)的長(zhǎng)期依賴性進(jìn)行建模,同時(shí)保持較小的模型尺寸。

Conv-TasNet具有顯著較小的模型尺寸和較短的延遲,是脫機(jī)和實(shí)時(shí)語(yǔ)音分離應(yīng)用程序的合適解決方案。

傳送門

項(xiàng)目地址:
https://github.com/facebookresearch/demucs

測(cè)試結(jié)果論文:
https://hal.archives-ouvertes.fr/hal-02379796/document

責(zé)任編輯:張燕妮 來(lái)源: 量子位
相關(guān)推薦

2023-10-20 12:45:00

AI數(shù)據(jù)

2023-02-22 15:02:52

GitHub指南

2024-01-04 14:46:10

AI開(kāi)發(fā)者GPT

2019-12-26 15:31:17

騰訊框架開(kāi)源

2023-10-10 07:19:07

Github開(kāi)源庫(kù)系統(tǒng)

2024-09-04 15:09:58

AI模型

2024-02-21 12:19:00

AI模型

2020-01-03 16:00:28

谷歌GitHub機(jī)器學(xué)習(xí)

2023-04-19 08:14:24

2022-09-20 15:24:09

程序員項(xiàng)目

2025-02-17 07:00:00

蘋果模型

2023-07-10 19:13:19

代數(shù)課程Strang

2024-02-01 13:02:00

AI模型

2021-12-14 15:54:01

AI 數(shù)據(jù)人工智能

2024-11-20 14:10:00

搜索AI

2021-10-20 11:12:49

工具代碼開(kāi)發(fā)

2019-08-08 16:37:31

開(kāi)源技術(shù) 數(shù)據(jù)

2022-06-07 10:49:32

算法代碼迷宮

2020-04-16 15:10:56

COBOLGitHub編程語(yǔ)言

2024-05-28 14:46:00

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

主站蜘蛛池模板: 日韩精品一区二区三区中文在线 | 日本不卡免费新一二三区 | 中国av在线免费观看 | 国产精品久久久久久中文字 | 午夜av毛片 | 亚洲视频免费观看 | 国产精品午夜电影 | 雨宫琴音一区二区在线 | 亚洲一区二区三区在线播放 | 黄色网址av| 午夜电影网 | 精品一级毛片 | 日本一本视频 | 亚洲欧美国产精品一区二区 | 欧美日韩国产中文字幕 | 日韩国产精品一区二区三区 | 久久久久久久一区 | 欧美精品一区在线 | 日本一区二区高清不卡 | 天天天天天天天干 | 精品国产青草久久久久福利 | 欧美日韩视频在线第一区 | 亚洲国产成人在线观看 | 国产激情视频网址 | 国产精品色av | 亚洲精品一区二区三区在线 | а天堂中文最新一区二区三区 | 不卡一区二区三区四区 | 中文字幕在线观看一区 | 99久久久久久| 日日夜夜天天 | 欧美黄在线观看 | 密色视频 | 欧美亚洲激情 | 国产成人精品一区二区三区网站观看 | 天天曰天天曰 | 一级特黄视频 | jizz亚洲人 | 亚洲一区二区久久久 | 亚洲欧美国产毛片在线 | 国产精品片 |