可视化模型的特征权重
1、流程
1、导入库:
numpy:用于处理数组和矩阵。
matplotlib.pyplot:用于绘图。
sklearn.datasets:用于加载数据集。
sklearn.ensemble.RandomForestClassifier:用于训练随机森林模型。
2、加载数据集:
使用load_iris函数加载Iris数据集。
3、训练模型:
初始化RandomForestClassifier并训练模型。
4、提取特征重要性:
使用model.feature_importances_获取特征重要性。
5、绘制条形图:
使用plt.barh绘制水平条形图。
plt.yticks设置y轴标签为特征名称。
plt.gca().invert_yaxis()反转y轴,使最重要的特征显示在图的顶部。
2、feature_importances_获取特征重要性
以鸢尾花为例,有以下特征:
'sepal length (cm)':萼片长度(厘米)
萼片是花朵最外层的绿色或彩色的叶状结构,这个特征指的是萼片的长度,单位是厘米。
'sepal width (cm)':萼片宽度(厘米