我們一起聊聊軸承故障特征—SHAP 模型 3D 可視化
前言
本文基于凱斯西儲大學(CWRU)軸承數據,使用特征提取和機器學習方法進行故障識,然后基于XGBoos模型介紹一種參數搜索策略,并通過SHAP模型可視化技術對結果進行分析。
1.數據集和特征提取
1.1 數據集導入
參考之前的文章,進行故障10分類的預處理,凱斯西儲大學軸承數據10分類數據集:
數據的讀取形式以及預處理思路。
1.2 故障信號特征提取
選擇峭度、熵值、分形值、波形指標、頻譜指標、頻域指標、 統計特征、振動特征等13種指標來捕捉軸承信號的多尺度特征,作為機器學習模型的訓練與識別。
2.基于參數搜索策略的XGBoost故障診斷模型
2.1 參數搜索策略:大步粗略搜索,小步細致搜索
對于XGBoost模型的重要參數:樹的棵樹、樹的深度、學習率,采取大范圍粗略搜索,先鎖定大概的參數范圍值,然后再采用小步細致搜索來準確定位參數值。
2.2 大步粗略搜索
采用網格搜索,確認大概的參數范圍值。
2.3 小步細致搜索
第一步,搜索樹的棵樹。
第二步,搜索樹的深度。
第三步,搜索學習率。
3.XGBoost模型評估和可視化
3.1 模型分數、準確率、精確率、召回率、F1 Score
3.2 故障十分類混淆矩陣
3.3 預測標簽對比可視化
3.4 SHAP 模型可視化
SHAP(SHapley Additive exPlanations)是一種用于解釋機器學習模型預測結果的方法。用于衡量每個特征對于模型輸出的貢獻程度。通過計算SHAP值,我們可以了解每個特征對于模型預測的影響,從而更好地理解模型的分類預測過程。這種可解釋性對于提高模型的可信度和可解釋性非常有幫助。能夠進一步分析故障信號所提取特征對軸承故障診斷的貢獻。
平均值(SHAP值)(對模型輸出大小的平均影響),可以明顯的看出來13個特征對每個類別的分類貢獻度!
使用 3D 可視化來展示 SHAP 值,可以更直觀地理解哪些特征在不同類別中對模型輸出有顯著影響,并且這些影響是如何分布的。特別是在故障特征分析中,能夠幫助用戶更好地理解數據之間的復雜關系,提高故障檢測和特征重要性分析的效率和準確性。
本文轉載自 ??建模先鋒??,作者: 小蝸愛建模
贊
收藏
回復
分享
微博
QQ
微信
舉報

回復
相關推薦