机器学习100天,今天讲的是:分类模型评价指标-混淆矩阵。
《机器学习100天》完整目录:目录
一、准确率(Accuracy)
逻辑回归是一个分类模型,那么对于分类模型,如何评估它的优劣呢?
好,我们先来认识一个名词:混淆矩阵(confusion matrix)。混淆矩阵是用来衡量一个分类器分类的准确程度。以二分类为例,混淆矩阵是一个2x2的矩阵。
如上图所示,列代表分类器对于样本的类别预测,Positive 为预测正类,Negative 为预测负类;行代表样本所属的真实类别。混淆矩阵中的四个元素这里用 TN、FN、FP、TP 表示。其中,TP 表示预测为正类且真实类别也是正类的样本个数;TN 表示预测为负类且真实类别也是负类的样本个数;FP 表示预测为正类但真实类别为负类的样本个数;FN 表示预测为负类但真实类别为正类的样本个数。
我们来看,其实对列进行分析,TN+FN 就是模型预测为负类的总个数,FP+TP 就是模型预测为正类的总个数;对行进行分析,TN+FP 就是真实标签为负类的总个数,FN+TP 就是真实标签为正类的总个数。TN+FN+FP+TP就是总的样本个数。
好,知