聊聊基于 LSTM 的多特征序列預測-SHAP可視化!
前言
本文基于前期介紹的電力變壓器,介紹一種基于 LSTM 預測模型的 SHAP 可視化分析教程。
數據集是使用.csv形式進行存儲的,包括了除時間列外 “HUFL”, “HULL”, “MUFL”, “MULL”, “LUFL”, “LULL” 和 “OT”7個特征。
1 多特征變量數據集制作與預處理
1.1 導入數據集
取油溫數據 OT 為目標預測值!
1.2 數據集制作
按照 8:2 劃分訓練集,測試集,滑動窗口設置為12
2 基于Pytorch的 LSTM 預測模型
2.1 定義 LSTM 預測模型
2.2 設置參數,訓練模型
注意調整參數:
- 可以修改LSTM層數和每層神經元個數;
- 增加更多的 epoch (注意防止過擬合)
- 可以改變滑動窗口長度(設置合適的窗口長度)
3 模型評估與可視化
3.1 結果可視化
3.2 模型評估
4 SHAP 可視化分析
SHAP 特征重要性-Summary Plot
將 SHAP 值矩陣傳遞給條形圖函數會創建一個全局特征重要性圖,其中每個特征的全局重要性被視為該特征在所有給定樣本中的平均絕對值。
上面使用Summary Plot方法并設置參數plot_type="bar"繪制典型的特征重要性條形圖,而他默認繪制Summary_plot圖,他是結合了特征重要性和特征效果,取代了條形圖。
Summary_plot 為每一個樣本繪制其每個特征的Shapley value,它說明哪些特征最重要,以及它們對數據集的影響范圍。
y 軸上的位置由特征確定,x 軸上的位置由每 Shapley value 確定。顏色表示特征值(紅色高,藍色低),顏色使我們能夠匹配特征值的變化如何影響風險的變化。重疊點在 y 軸方向抖動,因此我們可以了解每個特征的 Shapley value分布,并且這些特征是根據它們的重要性排序的。
贊
收藏
回復
分享
微博
QQ
微信
舉報

回復
相關推薦