五種時頻圖像一鍵切換,CVPR 頂會+多模態融合
前言
本期推出結合 CVPR2022 視覺頂會論文 RepLKNet 的多模態故障診斷創新模型,適合各種故障診斷領域、電能質量擾動信號、各種聲信號、腦電信號等分類任務!
創新模型還未發表!!!有小論文、畢業論文需求的不容錯過!
提供馬爾可夫轉換場 MTF 、遞歸圖 RP 、格拉姆矩陣GAF、連續小波變換CWT、短時傅里葉變換STFT五種時頻圖像變換方法,可靈活替換多模態特征中的時頻圖像類型!
1 創新模型相關解釋
● 數據集:CWRU西儲大學軸承數據集
● 環境框架:python 3.9 pytorch 2.1 及其以上版本均可運行
● 時頻圖像變換:提供5種時頻圖像變換方法
● 準確率:測試集100%
● 使用對象:論文需求、畢業設計需求者
● 代碼保證:代碼注釋詳細、即拿即可跑通。
注意:我們還有配套的模型講解(方便學習網絡結構)和參數調節講解!有畢業設計或者發小論文需求的同學必看,模塊豐富,創新度高,性能優越!!
2 多模態創新模型介紹
2.1 模型創新點介紹:
將時頻圖像和一維時序信號相結合,并使用RepLKNet和BiGRU-GlobalAttention進行分類的多模態特征融合模型,來進行故障信號分類,能夠有效地結合視覺特征和時間序列特征。是一個非常強大的模型架構,能夠充分利用多模態特征的優勢。
(1)多模態融合:
本模型將時頻圖像和一維時序信號進行多模態融合,充分利用這兩類數據的互補性。時頻圖像通過連續小波變換CWT,將信號的頻率和時間特征可視化。而一維時序信號則保留了原始時間依賴信息,適合使用遞歸神經網絡(RNN)或BiGRU進行處理。通過融合這兩種特征:
- 時頻圖像捕捉了信號中的高頻、低頻變化趨勢,有助于識別頻域中的故障特征。
- 一維時序信號保留了信號的時間依賴特性,能夠反映出故障在時間上的動態演化。
這種雙通道的數據融合使得模型能夠同時利用時間、頻率和圖像特征,從而大幅提升了故障分類的準確性。
我們在時頻圖像的特征提取中引入了RepLKNet(Re-parameterized Large Kernel Network),這是一種使用大卷積核的卷積神經網絡(CNN)。RepLKNet的優勢在于:
- 大卷積核能夠捕捉到更大范圍的局部特征,使其在處理時頻圖像時,能夠有效提取到大尺度上下文信息,例如信號中的長期頻率變化趨勢。
- 通過重參數化技術,RepLKNet在訓練階段保持了卷積計算的高效性,同時增強了模型的泛化能力,有助于提高分類任務的準確性。
這一創新點讓模型在時頻圖像特征提取過程中,能夠捕捉到信號的更多高層次信息,使得分類模型在復雜信號環境下依然表現出色。
在處理一維時序信號時,我們采用了BiGRU(雙向門控循環單元)來提取時序特征。為了進一步提升特征提取的效果,我們引入了GlobalAttention機制,這一設計的優勢在于:
- BiGRU通過雙向處理,能夠同時捕捉信號的前向和后向依賴關系,使得模型可以更好地理解時間序列中的隱含信息。
- GlobalAttention機制通過動態分配不同時間步長的重要性權重,讓模型更加關注關鍵的時刻信息,而忽略噪聲或不重要的時間段。
這一創新設計使得BiGRU在處理一維時序信號時,能夠更加有效地提取出故障發生時的關鍵特征,顯著提高了信號分類的精度。
模型中的多模態融合部分,通過RepLKNet提取時頻圖像特征和BiGRU-GATT處理一維信號特征后,我們采用特征拼接融合的方式,將兩種特征結合。相比于僅使用單一模式特征的傳統模型,融合后的特征在分類任務中的表現更加優越,主要優勢體現在:
- 時頻圖像和時序信號各自提供了不同視角的特征信息,前者提供頻率域特征,后者保留了時間依賴特性,兩者的結合能更加全面地反映信號的故障特征。
- 通過特征融合,模型在捕捉不同模式下的故障特征時更加魯棒,尤其在復雜的故障信號環境下,融合的特征能夠更好地應對噪聲干擾和信號變化。
這種特征融合策略使得我們的模型在多種故障模式下,依然能夠保持高效準確的分類性能,提升了模型在實際應用中的魯棒性和泛化能力。
2.2 模型效果展示
(1)模型訓練可視化:
(2)模型評估:
(3)混淆矩陣:
(4)分類標簽可視化:
(5)原始數據 t-SNE特征可視化:
(6)模型訓練后的 t-SNE特征可視化:
模型分類效果顯著,50個epoch,準確率100%,通過多模態融合、RepLKNet時頻圖像特征提取、GlobalAttention優化的BiGRU、特征融合策略等多方面的創新設計,使得模型在故障信號分類任務中表現更加出色。這種融合了時間、頻率和空間特征的多模態方法,特別適用于復雜的工業故障診斷場景,具有廣泛的應用前景,效果明顯,創新度高!
本文轉載自 ??建模先鋒??,作者: 小蝸愛建模
