時間卷積網絡:時間序列的下一場革命?
這篇文章回顧了幾個最新的基于TCN的解決方案。
我們首先介紹運動檢測的案例研究,并簡要回顧一下TCN架構及其相對于傳統方法(如卷積神經網絡(CNN)和遞歸神經網絡(RNN))的優勢。然后介紹了TCN的幾個新穎應用,包括改善交通預測,聲音事件定位和檢測以及概率預測。
TCN簡要回顧
Lea等人的開創性工作。(2016)首先提出了基于視頻的動作分割的時間卷積網絡(TCN)。此常規過程的兩個步驟包括:首先,使用(通常)對時空信息進行編碼的CNN來計算低級特征,其次,將這些低級特征輸入到使用(通常是)捕獲高級時域信息的分類器中)RNN。這種方法的主要缺點是需要兩個單獨的模型。 TCN提供了一種統一的方法來分層捕獲所有兩個級別的信息。
編碼器-解碼器框架如圖1所示,其中有關體系結構的更多信息可以在前兩個參考文獻中找到(在文章末尾)。提供了最關鍵的問題,如下所示:TCN可以采用一系列任意長度并將其輸出為相同長度。在使用一維完全卷積網絡體系結構的情況下,使用因果卷積。一個關鍵特征是,時間t的輸出 僅與t之前發生的元素卷積 。
隨著Yan等人最近發表的研究成果,圍繞TCN的話題甚至傳到了《自然》雜志上。(2020)在TCN上進行天氣預報任務。在他們的工作中,使用TCN和LSTM進行了對比實驗。他們的結果之一是,除其他方法外,TCN在使用時序數據的預測任務中表現出色。
下一部分提供了此經典TCN的實現和擴展。
改善流量預測
拼車和在線導航服務可以改善交通預測效果并改變人們的出行方式。通過更好的交通預測可以實現更少的交通擁堵,更少的污染,安全和快速的駕駛等。由于這是實時數據驅動的問題,因此有必要利用即將到來的流量的累積數據?;诖耍珼ai等人最近(2020)提出了一種混合時空圖卷積網絡(H-STGCN)??傮w思路是利用分段襯里流量密度關系的優勢,并將即將來臨的交通量轉換為等效的行進時間。他們在這項工作中使用的最有趣的方法之一是圖卷積以捕獲空間依賴性。復合鄰接矩陣捕獲流量近似的固有特征(更多信息,請參見Li,2017)。在以下架構中,提出了四個模塊來描述整個預測過程。
聲音事件定位和檢測
聲音事件定位和檢測(SELD)的領域在不斷增長。對環境的了解在自主導航中起著至關重要的作用。Guirguis等最近(2020)提出了一種聲音事件SELD-TCN的新穎架構。他們聲稱,他們的框架在現場培訓方面比當前最先進的技術領先。在他們的SELDnet(以下結構)中,以44.1 kHz采樣的多聲道音頻記錄通過應用短時傅立葉變換提取頻譜的相位和幅度,并將其堆疊為單獨的輸入特征。然后,連接卷積塊和循環塊(雙向GRU),然后連接完全連接的塊。SELDnet的輸出是聲音事件檢測(SED)和到達方向(DOA)。
為了超越它,他們提出了SELD-TCN:
由于擴張的卷積使網絡能夠處理各種輸入,因此可能需要更深入的網絡(在反向傳播期間,網絡會受到不穩定梯度的影響)。他們通過適應WaveNet(Dario et al。,2017)架構克服了這一挑戰。他們表明SELD任務不需要循環層,并成功檢測到活動聲音事件的開始和結束時間。
概率預測
由Chen等人設計的新穎框架(2020)可用于估計概率密度。時間序列預測改善了許多業務決策方案(例如,資源管理)。概率預測可以從歷史數據中提取信息,并最大限度地減少未來事件的不確定性。當預測任務是預測數以百萬計的相關數據系列時(如在零售業務中),它需要大量的勞動力和計算資源來進行參數估計。為了解決這些困難,他們提出了基于CNN的密度估計和預測框架。他們的框架可以學習系列之間的潛在關聯。他們的工作中的新穎之處在于他們提出的深層TCN,如其體系結構所示:
編碼器-解碼器模塊解決方案可能有助于實際的大規模應用設計。