模型解释性:SHAP包的使用

news2025/4/10 17:49:12

本篇博客介绍另一种事后可解释性方法：SHAP(SHapley Additive exPlanation)方法。

1. Shapley值理论

Shapley值是博弈论中的一个概念，通过衡量联盟中各成员对联盟总目标的贡献程度，从而根据贡献程度来进行联盟成员的利益分配，避免了分配的平均主义。
当Shapley理论用于解释机器学习模型的时候，将输入特征 $x$ 视为参与成员，模型输出的概率分布 $f (x)$ 视为联盟总目标，通过衡量各特征的贡献度来挖掘重要特征，从而提供可解释性判断依据。其数学模型如下： $g(Z^{'})=\varphi_{0}+\sum_{j=1}^{M}\varphi_{j}Z^{'}_{j}\approx f(x) \tag{1}$ 其中， $g$ 是解释模型， $f (x)$ 是原机器学习模型， $Z^{'}_{j}=\{0,1\}^{M}$ 表示相应特征是否被观察到， $M$ 是输入特征的数目， $\varphi_{i}$ 是每个特征的归因值， $\varphi_{0}$ 是解释模型的常数。
对于一个特定的输入数据 $x_{0}$ ，其Shapley值的计算公式如下： $\varphi_{i}(f,x_{0})=\sum_{S\subseteq N_{S}/ \{i\}}\frac{|S|!(M-|S|-1)!}{|N_{S}|!}[f(S\cup\{i\})-f(S)]\tag{2}$ 其中， $\varphi_{i}(f)$ 代表函数 $f$ 中特征 $i$ 的贡献度， $N_{S}$ 是所有特征组成的集合， $S$ 代表特征子集， $N_{S}/\{i\}$ 代表在集合 $N_{S}$ 中去除特征 $i$ ， $S\cup \{i\}$ 表示子集 $S$ 中增加特征 $i$ ， $∣ S ∣$ 表示集合 $S$ 中元素的个数。
为了方面公式(2)的计算，通常将公式(2)转化为如下公式计算： $\varphi_{i}(f,x_{0})=\sum_{z^{'}\in\{0,1\}^{M}}\frac{|z^{'}|!(M-|z^{'}|-1)!}{M!}[f_{S}(z^{'})-f_{S}(z^{'}|i)]\tag{3}$ 其中， $f_{S}=E[f(x)|z_{S}^{'}]=\frac{1}{N}\sum_{j=1}^{N}f(x_{j}^{'})$ 其中， $z_{S}^{'}$ 为集合 $S$ 中特征的取值所组成的集合， $N$ 为原函数 $f$ 训练数据的个数， $x_{j}^{'}$ 的取值如下： $x_{j}^{'}=\left\{\begin{aligned} x_{0i},& F_{i}\in z_{S}^{'} \\ x_{ji},&F_{i}\notin z_{S}^{'} \end{aligned}\right.$ 其中， $x_{0i}$ 为待解释数据 $x_{0}$ 的第 $i$ 个特征值， $x_{ji}$ 表示第 $j$ 个训练数据中第 $i$ 个特征的取值， $F_{i}$ 表示第 $i$ 个特征值。
SHAP值具备扎实的理论基础，但 $\varphi_{i}$ 的计算复杂度和 $E[f(x)|z_{S}^{'}]$ 的有效估计是其在实际应用中的最大阻碍，为了解决这个问题，Lundberg等人提出了Tree SHAP方法。
Tree SHAP是用于树模型的快速SHAP值估计方法，大大增加了SHAP值的实际应用能力。

2 SHAP包用法

这里仍然以Boston房价为例，使用XGBoost方法训练模型。其用法举例如下：
模型训练

import pandas as pd
import numpy as np
from sklearn.datasets import load_boston
from xgboost import XGBRegressor
from sklearn.model_selection import train_test_split
import shap
shap.initjs()
#分类
boston=load_boston()
X=boston.data
y=boston.target
features=boston.feature_names
X_train,X_test,y_train,y_test=train_test_split(X,y,test_size=0.2,random_state=0)

xgbr=XGBRegressor(n_estimators=200,max_depth=4)
xgbr.fit(X_train,y_train)

对单个样本进行解释

explainer=shap.TreeExplainer(xgbr)
shap_values=explainer.shap_values(X_test[1].reshape(1,-1))
shap.force_plot(explainer.expected_value,shap_values,X_test[1].reshape(1,-1),feature_names=features)

其结果如下：
在这里插入图片描述
关于上图，有以下几个方面需要说明：

base_value:全体样本Shape平均值，这里的全体样本指的是模型的训练样本；
output_value: 当前样本的Shap输出值，即为模型的预测值；
正向作用特征：红色特征即为正向作用的特征；
反向作用特征：蓝色特征即为反向作用的特征；

整个测试集的Shap分布

explainer=shap.TreeExplainer(xgbr)
shap_values=explainer.shap_values(X_test)
shap.force_plot(explainer.expected_value,shap_values,X_test,feature_names=features)

其结果如下(可以通过调节横纵坐标观察当个特征的效果):
在这里插入图片描述
从特征角度观察样本Shap值

shap.summary_plot(shap_values,X_test,feature_names=features)

其结果如下：
在这里插入图片描述

参考文献

《基于图模型机器学习算法的可解释性技术研究与实现》
《稳定评估机器学习模型可解释性研究》
https://blog.csdn.net/tMb8Z9Vdm66wH68VX1/article/details/106131890

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/343816.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！