十個用于可解釋AI的Python庫
XAI的目標是為模型的行為和決定提供有意義的解釋,本文整理了目前能夠看到的10個用于可解釋AI的Python庫
什么是XAI?
XAI,Explainable AI是指可以為人工智能(AI)決策過程和預測提供清晰易懂的解釋的系統(tǒng)或策略。XAI 的目標是為他們的行為和決策提供有意義的解釋,這有助于增加信任、提供問責制和模型決策的透明度。XAI 不僅限于解釋,還以一種使推理更容易為用戶提取和解釋的方式進行 ML 實驗。
在實踐中,XAI 可以通過多種方法實現(xiàn),例如使用特征重要性度量、可視化技術,或者通過構建本質上可解釋的模型,例如決策樹或線性回歸模型。方法的選擇取決于所解決問題的類型和所需的可解釋性水平。
AI 系統(tǒng)被用于越來越多的應用程序,包括醫(yī)療保健、金融和刑事司法,在這些應用程序中,AI 對人們生活的潛在影響很大,并且了解做出了決定特定原因至關重要。因為這些領域的錯誤決策成本很高(風險很高),所以XAI 變得越來越重要,因為即使是 AI 做出的決定也需要仔細檢查其有效性和可解釋性。
可解釋性實踐的步驟
數(shù)據準備:這個階段包括數(shù)據的收集和處理。數(shù)據應該是高質量的、平衡的并且代表正在解決的現(xiàn)實問題。擁有平衡的、有代表性的、干凈的數(shù)據可以減少未來為保持 AI 的可解釋性而付出的努力。
模型訓練:模型在準備好的數(shù)據上進行訓練,傳統(tǒng)的機器學習模型或深度學習神經網絡都可以。模型的選擇取決于要解決的問題和所需的可解釋性水平。模型越簡單就越容易解釋結果,但是簡單模型的性能并不會很高。
模型評估:選擇適當?shù)脑u估方法和性能指標對于保持模型的可解釋性是必要的。在此階段評估模型的可解釋性也很重要,這樣確保它能夠為其預測提供有意義的解釋。
解釋生成:這可以使用各種技術來完成,例如特征重要性度量、可視化技術,或通過構建固有的可解釋模型。
解釋驗證:驗證模型生成的解釋的準確性和完整性。這有助于確保解釋是可信的。
部署和監(jiān)控:XAI 的工作不會在模型創(chuàng)建和驗證時結束。它需要在部署后進行持續(xù)的可解釋性工作。在真實環(huán)境中進行監(jiān)控,定期評估系統(tǒng)的性能和可解釋性非常重要。
1、SHAP (SHapley Additive exPlanations)
SHAP是一種博弈論方法,可用于解釋任何機器學習模型的輸出。它使用博弈論中的經典Shapley值及其相關擴展將最佳信用分配與本地解釋聯(lián)系起來。
2、LIME(Local Interpretable Model-agnostic Explanations)
LIME 是一種與模型無關的方法,它通過圍繞特定預測在局部近似模型的行為來工作。LIME 試圖解釋機器學習模型在做什么。LIME 支持解釋文本分類器、表格類數(shù)據或圖像的分類器的個別預測。
3、Eli5
ELI5是一個Python包,它可以幫助調試機器學習分類器并解釋它們的預測。它提供了以下機器學習框架和包的支持:
- scikit-learn:ELI5可以解釋scikit-learn線性分類器和回歸器的權重和預測,可以將決策樹打印為文本或SVG,顯示特征的重要性,并解釋決策樹和基于樹集成的預測。ELI5還可以理解scikit-learn中的文本處理程序,并相應地突出顯示文本數(shù)據。
- Keras -通過Grad-CAM可視化解釋圖像分類器的預測。
- XGBoost -顯示特征的重要性,解釋XGBClassifier, XGBRegressor和XGBoost . booster的預測。
- LightGBM -顯示特征的重要性,解釋LGBMClassifier和LGBMRegressor的預測。
- CatBoost:顯示CatBoostClassifier和CatBoostRegressor的特征重要性。
- lightning -解釋lightning 分類器和回歸器的權重和預測。
- sklearn-crfsuite。ELI5允許檢查sklearn_crfsuite.CRF模型的權重。
基本用法:
Show_weights() 顯示模型的所有權重,Show_prediction() 可用于檢查模型的個體預測
ELI5還實現(xiàn)了一些檢查黑盒模型的算法:
TextExplainer使用LIME算法解釋任何文本分類器的預測。排列重要性法可用于計算黑盒估計器的特征重要性。
4、Shapash
Shapash提供了幾種類型的可視化,可以更容易地理解模型。通過摘要來理解模型提出的決策。該項目由MAIF數(shù)據科學家開發(fā)。Shapash主要通過一組出色的可視化來解釋模型。
Shapash通過web應用程序機制工作,與Jupyter/ipython可以完美的結合。
5、Anchors
Anchors使用稱為錨點的高精度規(guī)則解釋復雜模型的行為,代表局部的“充分”預測條件。該算法可以有效地計算任何具有高概率保證的黑盒模型的解釋。
Anchors可以被看作為LIME v2,其中LIME的一些限制(例如不能為數(shù)據的不可見實例擬合模型)已經得到糾正。Anchors使用局部區(qū)域,而不是每個單獨的觀察點。它在計算上比SHAP輕量,因此可以用于高維或大數(shù)據集。但是有些限制是標簽只能是整數(shù)。
6、BreakDown
BreakDown是一種可以用來解釋線性模型預測的工具。它的工作原理是將模型的輸出分解為每個輸入特征的貢獻。這個包中有兩個主要方法。Explainer()和Explanation()
7、Interpret-Text
Interpret-Text 結合了社區(qū)為 NLP 模型開發(fā)的可解釋性技術和用于查看結果的可視化面板??梢栽诙鄠€最先進的解釋器上運行實驗,并對它們進行比較分析。這個工具包可以在每個標簽上全局或在每個文檔本地解釋機器學習模型。
以下是此包中可用的解釋器列表:
- Classical Text Explainer——(默認:邏輯回歸的詞袋)
- Unified Information Explainer
- Introspective Rationale Explainer
它的好處是支持CUDA,RNN和BERT等模型。并且可以為文檔中特性的重要性生成一個面板
8、aix360 (AI Explainability 360)
AI Explainbability 360工具包是一個開源庫,這個包是由IBM開發(fā)的,在他們的平臺上廣泛使用。AI Explainability 360包含一套全面的算法,涵蓋了不同維度的解釋以及代理解釋性指標。
工具包結合了以下論文中的算法和指標:
- Towards Robust Interpretability with Self-Explaining Neural Networks, 2018. ref
- Boolean Decision Rules via Column Generation, 2018. ref
- Explanations Based on the Missing: Towards Contrastive Explanations with Pertinent Negatives, 2018. ref
- Improving Simple Models with Confidence Profiles, , 2018. ref
- Efficient Data Representation by Selecting Prototypes with Importance Weights, 2019. ref
- TED: Teaching AI to Explain Its Decisions, 2019. ref
- Variational Inference of Disentangled Latent Concepts from Unlabeled Data, 2018. ref
- Generating Contrastive Explanations with Monotonic Attribute Functions, 2019. ref
- Generalized Linear Rule Models, 2019. ref
9、OmniXAI
OmniXAI (Omni explable AI的縮寫),解決了在實踐中解釋機器學習模型產生的判斷的幾個問題。
它是一個用于可解釋AI (XAI)的Python機器學習庫,提供全方位的可解釋AI和可解釋機器學習功能,并能夠解決實踐中解釋機器學習模型所做決策的許多痛點。OmniXAI旨在成為一站式綜合庫,為數(shù)據科學家、ML研究人員和從業(yè)者提供可解釋的AI。
10、XAI (eXplainable AI)
XAI 庫由 The Institute for Ethical AI & ML 維護,它是根據 Responsible Machine Learning 的 8 條原則開發(fā)的。它仍處于 alpha 階段因此請不要將其用于生產工作流程。