SHAP 模型可視化 + 參數搜索策略在軸承故障診斷中的應用

Tang_Lan

發布于 2024-7-17 11:10

瀏覽

0收藏

前言

本文基于凱斯西儲大學（CWRU）軸承數據，使用特征提取和機器學習方法進行故障識，然后基于XGBoos模型介紹一種參數搜索策略，并通過SHAP模型可視化技術對結果進行分析。

可視化結果圖：

十分類混淆矩陣

SHAP 模型可視化 + 參數搜索策略在軸承故障診斷中的應用-AI.x社區

全局特征重要性圖：

SHAP 模型可視化 + 參數搜索策略在軸承故障診斷中的應用-AI.x社區

十分類 ROC曲線和AUC值：?

標簽真實值和預測值對比：

SHAP 模型可視化 + 參數搜索策略在軸承故障診斷中的應用-AI.x社區

1 數據集和特征提取

1.1 數據集導入

參考之前的文章，進行故障10分類的預處理，凱斯西儲大學軸承數據10分類數據集：

SHAP 模型可視化 + 參數搜索策略在軸承故障診斷中的應用-AI.x社區

數據的讀取形式以及預處理思路；

SHAP 模型可視化 + 參數搜索策略在軸承故障診斷中的應用-AI.x社區

1.2 故障信號特征提取

SHAP 模型可視化 + 參數搜索策略在軸承故障診斷中的應用-AI.x社區

選擇峭度、熵值、分形值、波形指標、頻譜指標、頻域指標、統計特征、振動特征等13種指標來捕捉軸承信號的多尺度特征，作為機器學習模型的訓練與識別。

2 基于參數搜索策略的XGBoost故障診斷模型

2.1 參數搜索策略：大步粗略搜索，小步細致搜索

對于XGBoost模型的重要參數：樹的棵樹、樹的深度、學習率，采取大范圍粗略搜索，先鎖定大概的參數范圍值，然后再采用小步細致搜索來準確定位參數值。

SHAP 模型可視化 + 參數搜索策略在軸承故障診斷中的應用-AI.x社區

2.2 大步粗略搜索

采用網格搜索，確認大概的參數范圍值

SHAP 模型可視化 + 參數搜索策略在軸承故障診斷中的應用-AI.x社區

2.3 小步細致搜索

第一步，搜索樹的棵樹

SHAP 模型可視化 + 參數搜索策略在軸承故障診斷中的應用-AI.x社區

第二步，搜索樹的深度

SHAP 模型可視化 + 參數搜索策略在軸承故障診斷中的應用-AI.x社區

第三步，搜索學習率

SHAP 模型可視化 + 參數搜索策略在軸承故障診斷中的應用-AI.x社區

3 XGBoost模型評估和可視化

3.1 模型分數、準確率、精確率、召回率、F1 Score

SHAP 模型可視化 + 參數搜索策略在軸承故障診斷中的應用-AI.x社區

3.2 故障十分類混淆矩陣

SHAP 模型可視化 + 參數搜索策略在軸承故障診斷中的應用-AI.x社區

3.3 SHAP 模型可視化

SHAP（SHapley Additive exPlanations）是一種用于解釋機器學習模型預測結果的方法。用于衡量每個特征對于模型輸出的貢獻程度。通過計算SHAP值，我們可以了解每個特征對于模型預測的影響，從而更好地理解模型的分類預測過程。這種可解釋性對于提高模型的可信度和可解釋性非常有幫助。能夠進一步分析故障信號所提取特征對軸承故障診斷的貢獻。

SHAP 模型可視化 + 參數搜索策略在軸承故障診斷中的應用-AI.x社區