SHAP 模型可視化 + 參數搜索策略在軸承故障診斷中的應用
前言
本文基于凱斯西儲大學(CWRU)軸承數據,使用特征提取和機器學習方法進行故障識,然后基于XGBoos模型介紹一種參數搜索策略,并通過SHAP模型可視化技術對結果進行分析。
可視化結果圖:
十分類混淆矩陣
全局特征重要性圖:
十分類 ROC曲線和AUC值:?
標簽真實值和預測值對比:
1 數據集和特征提取
1.1 數據集導入
參考之前的文章,進行故障10分類的預處理,凱斯西儲大學軸承數據10分類數據集:
數據的讀取形式以及預處理思路;
1.2 故障信號特征提取
選擇峭度、熵值、分形值、波形指標、頻譜指標、頻域指標、 統計特征、振動特征等13種指標來捕捉軸承信號的多尺度特征,作為機器學習模型的訓練與識別。
2 基于參數搜索策略的XGBoost故障診斷模型
2.1 參數搜索策略:大步粗略搜索,小步細致搜索
對于XGBoost模型的重要參數:樹的棵樹、樹的深度、學習率,采取大范圍粗略搜索,先鎖定大概的參數范圍值,然后再采用小步細致搜索來準確定位參數值。
2.2 大步粗略搜索
采用網格搜索,確認大概的參數范圍值
2.3 小步細致搜索
第一步,搜索樹的棵樹
第二步,搜索樹的深度
第三步,搜索學習率
3 XGBoost模型評估和可視化
3.1 模型分數、準確率、精確率、召回率、F1 Score
3.2 故障十分類混淆矩陣
3.3 SHAP 模型可視化
SHAP(SHapley Additive exPlanations)是一種用于解釋機器學習模型預測結果的方法。用于衡量每個特征對于模型輸出的貢獻程度。通過計算SHAP值,我們可以了解每個特征對于模型預測的影響,從而更好地理解模型的分類預測過程。這種可解釋性對于提高模型的可信度和可解釋性非常有幫助。能夠進一步分析故障信號所提取特征對軸承故障診斷的貢獻。
平均值(SHAP值)(對模型輸出大小的平均影響),可以明顯的看出來13個特征對每個類別的分類貢獻度!
本文轉載自 ??建模先鋒??,作者: 小蝸愛建模
已于2024-7-17 11:11:30修改
贊
收藏
回復
分享
微博
QQ
微信
舉報

回復
相關推薦