常用模型评估指标

news2025/1/20 18:24:35

分类模型

混淆矩阵

混淆矩阵(Confusion Matrix)是一种用于评估分类模型性能的表格,它可以显示模型预测结果与真实标签之间的关系。混淆矩阵的行表示实际类别,列表示预测类别。
一个典型的二分类混淆矩阵包含四个单元格,分别代表了真阳性(True Positive,TP)、假阳性(False Positive,FP)、真阴性(True Negative,TN)和假阴性(False Negative,FN):
Predicted Positive Predicted Negative Actual Positive TP FN Actual Negative FP TN \begin{matrix} & \text{Predicted Positive} & \text{Predicted Negative} \\ \text{Actual Positive} & \text{TP} & \text{FN} \\ \text{Actual Negative} & \text{FP} & \text{TN} \\ \end{matrix} Actual PositiveActual NegativePredicted PositiveTPFPPredicted NegativeFNTN
其中,TP 表示模型将正例预测为正例的数量,FN 表示模型将正例预测为负例的数量,FP 表示模型将负例预测为正例的数量,TN 表示模型将负例预测为负例的数量。
混淆矩阵可以帮助我们对分类模型的性能进行更细致的评估,例如计算准确率、精确率、召回率和 F1 分数等指标。

from sklearn.metrics import confusion_matrix

# 示例数据
y_true = [1, 0, 1, 1, 0, 1]
y_pred = [1, 1, 1, 0, 0, 1]

# 计算混淆矩阵
cm = confusion_matrix(y_true, y_pred)

print("Confusion Matrix:")
print(cm)
召回率

召回率(Recall),也称为真正例率(True Positive Rate,TPR)或灵敏度(Sensitivity),是衡量分类模型对正例样本的识别能力的指标。它表示模型正确识别出的正例样本数量占所有实际正例样本数量的比例。
召回率的计算公式如下:
R e c a l l = T P T P + F N Recall = \frac{TP}{TP + FN} Recall=TP+FNTP
其中,TP 表示真阳性(模型将正例预测为正例的数量),FN 表示假阴性(模型将正例预测为负例的数量)。
召回率的取值范围在 0 到 1 之间,越接近 1 表示模型对正例样本的识别能力越好。

from sklearn.metrics import recall_score

# 示例数据
y_true = [1, 0, 1, 1, 0, 1]
y_pred = [1, 1, 1, 0, 0, 1]

# 计算召回率
recall = recall_score(y_true, y_pred)

print("Recall:", recall)
精确度

精确度(Precision)是分类模型的一个指标,用于衡量模型在预测为正例的样本中,有多少是真正的正例。精确度与召回率一起评估分类模型的性能。
精确度的计算公式如下:
P r e c i s i o n = T P T P + F P Precision = \frac{TP}{TP + FP} Precision=TP+FPTP
其中,TP 表示真阳性(模型将正例预测为正例的数量),FP 表示假阳性(模型将负例预测为正例的数量)。
精确度的取值范围在 0 到 1 之间,越接近 1 表示模型在预测为正例的样本中有更高的准确率。

from sklearn.metrics import precision_score

# 示例数据
y_true = [1, 0, 1, 1, 0, 1]
y_pred = [1, 1, 1, 0, 0, 1]

# 计算精确度
precision = precision_score(y_true, y_pred)

print("Precision:", precision)
准确率

准确率(Accuracy)是分类模型的一个指标,用于衡量模型在所有样本中正确分类的比例。它是一个综合评估模型性能的指标。
准确率的计算公式如下:
A c c u r a c y = T P + T N T P + T N + F P + F N Accuracy = \frac{TP + TN}{TP + TN + FP +FN} Accuracy=TP+TN+FP+FNTP+TN
其中,TP 表示真阳性(模型将正例预测为正例的数量),TN 表示真阴性(模型将负例预测为负例的数量),FP 表示假阳性(模型将负例预测为正例的数量),FN 表示假阴性(模型将正例预测为负例的数量)。
准确率的取值范围在 0 到 1 之间,越接近 1 表示模型的分类准确率越高。

from sklearn.metrics import accuracy_score

# 示例数据
y_true = [1, 0, 1, 1, 0, 1]
y_pred = [1, 1, 1, 0, 0, 1]

# 计算准确率
accuracy = accuracy_score(y_true, y_pred)

print("Accuracy:", accuracy)
F1分数

F1 分数是一个综合评价分类模型性能的指标,综合考虑了精确度(Precision)和召回率(Recall)。F1 分数是精确度和召回率的调和平均数。
F1 分数的计算公式如下:
F 1 = 2 × P r e c i s i o n × R e c a l l P r e c i s i o n + R e c a l l F1 = 2 \times \frac{Precision \times Recall}{Precision + Recall} F1=2×Precision+RecallPrecision×Recall
其中,Precision 是精确度,Recall 是召回率。
F1 分数的取值范围在 0 到 1 之间,越接近 1 表示模型的性能越好。F1 分数相比于单独的精确度和召回率能够更全面地评价模型的性能。

from sklearn.metrics import f1_score

# 示例数据
y_true = [1, 0, 1, 1, 0, 1]
y_pred = [1, 1, 1, 0, 0, 1]

# 计算 F1 分数
f1 = f1_score(y_true, y_pred)

print("F1 Score:", f1)

ROC曲线与AUC面积

ROC 曲线(Receiver Operating Characteristic Curve)是用于评估分类模型性能的一种常用工具。ROC 曲线以假正例率(False Positive Rate, FPR)为横坐标,真正例率(True Positive Rate, TPR)为纵坐标,将模型在不同阈值下的性能表现可视化。
假正例率(FPR)是指所有实际为负例样本中,被错误地划分为正例的样本所占比例,计算公式为:
F P R = F P F P + T N FPR = \frac{FP}{FP + TN} FPR=FP+TNFP
真正例率(TPR)是指所有实际为正例样本中,被正确地划分为正例的样本所占比例,即召回率,计算公式为:
T P R = T P T P + F N TPR = \frac{TP}{TP + FN} TPR=TP+FNTP
在 ROC 曲线上,理想情况下,模型的曲线会尽可能地靠近左上角,这意味着模型在各种阈值下都能保持较低的假正例率的同时获得较高的真正例率,即具有较高的性能。
ROC 曲线下的面积(Area Under the ROC Curve, AUC)是一个常用的性能评估指标,用于衡量分类模型在不同阈值下的性能表现。AUC 值越接近 1,表示模型的性能越好;如果 AUC 值接近 0.5,则表示模型的性能与随机猜测相近;如果 AUC 值小于 0.5,则表示模型的性能比随机猜测还差。

import numpy as np
from sklearn.metrics import roc_curve, auc, roc_auc_score
import matplotlib.pyplot as plt

# 生成随机示例数据
np.random.seed(42)
y_true = np.random.randint(0, 2, size=100)
y_scores = np.random.rand(100)

# 计算 ROC 曲线
fpr, tpr, thresholds = roc_curve(y_true, y_scores)
roc_auc = auc(fpr, tpr)

# 计算 ROC 曲线下的面积
auc_score = roc_auc_score(y_true, y_scores)

print("AUC Score:", auc_score)

# 绘制 ROC 曲线
plt.figure()
plt.plot(fpr, tpr, color='darkorange', lw=2, label='ROC curve (area = %0.2f)' % roc_auc)
plt.plot([0, 1], [0, 1], color='navy', lw=2, linestyle='--')
plt.xlim([0.0, 1.0])
plt.ylim([0.0, 1.05])
plt.xlabel('False Positive Rate')
plt.ylabel('True Positive Rate')
plt.title('Receiver Operating Characteristic (ROC) Curve')
plt.legend(loc='lower right')
plt.show()

ROC.png

回归模型

均方误差MSE

均方误差(MSE)是衡量预测值与实际观测值之间差异的一种方法,常用于评估模型的性能。MSE 是预测误差的平方的平均值,计算方式如下:
MSE = (1/n) * Σ(yᵢ - ŷᵢ)²
其中,n 是样本数量,yᵢ 是实际观测值,ŷᵢ 是对应的预测值。MSE 的值越小,表示模型的预测能力越好。
MSE 的优点之一是它惩罚了较大的误差,因为误差被平方了。这意味着在计算 MSE 时,较大的误差将对最终结果有更大的影响,这有助于更好地识别模型的预测能力。
然而,需要注意的是,MSE 有一个缺点,即它对异常值(离群值)比较敏感,因为它是对误差的平方求平均。这意味着如果存在异常值,MSE 可能会受到其影响,导致对模型性能的评估不准确。

import numpy as np

# 示例数据
actual_values = np.array([1, 2, 3, 4, 5])
predicted_values = np.array([1.2, 2.1, 2.9, 4.2, 5.3])

# 计算均方误差
mse = np.mean((actual_values - predicted_values) ** 2)

print("Mean Squared Error:", mse)

均方根误差RMSE

均方根误差(Root Mean Square Error,RMSE)是一种常用的衡量预测模型误差的指标。在统计学和机器学习领域中经常用于评估模型的预测性能。RMSE 表示观测值与预测值之间的差异程度,其计算公式如下:
RMSE = 1 n ∑ i = 1 n ( y i − y ^ i ) 2 \text{RMSE} = \sqrt{\frac{1}{n}\sum_{i=1}^{n}(y_i - \hat{y}_i)^2} RMSE=n1i=1n(yiy^i)2
其中,n是样本数量, y i y_i yi是观测值, y ^ i \hat{y}_i y^i是对应的预测值。RMSE 的计算方法是将每个观测值与其对应的预测值之差的平方求和,然后取平均值,最后再对结果进行平方根操作。
RMSE 的值越小,表示模型的预测能力越好,因为它表示了观测值与预测值之间的平均偏差。

import numpy as np

# 示例数据
actual_values = np.array([1, 2, 3, 4, 5])
predicted_values = np.array([1.2, 2.1, 2.9, 4.2, 5.3])

# 计算均方误差
mse = np.mean((actual_values - predicted_values) ** 2)

# 计算均方根误差
rmse = np.sqrt(mse)

print("Root Mean Squared Error:", rmse)

残差平方和RSS

残差平方和(Residual Sum of Squares,RSS)是另一个常用于评估模型拟合优度的指标。它表示模型预测值与实际观测值之间的差异的平方和,通常用于线性回归模型的评估。
残差平方和的计算公式如下:
RSS = ∑ i = 1 n ( y i − y ^ i ) 2 \text{RSS} = \sum_{i=1}^{n}(y_i - \hat{y}_i)^2 RSS=i=1n(yiy^i)2
其中,n是样本数量, y i y_i yi是观测值, y ^ i \hat{y}_i y^i是对应的预测值。计算方法是将每个观测值与其对应的预测值之差的平方求和。
RSS 越小表示模型的拟合程度越好,因为它表示了观测值与预测值之间的总体偏差的平方和越小。

import numpy as np

# 示例数据
actual_values = np.array([1, 2, 3, 4, 5])
predicted_values = np.array([1.2, 2.1, 2.9, 4.2, 5.3])

# 计算残差
residuals = actual_values - predicted_values

# 计算残差平方和
rss = np.sum(residuals**2)

print("Residual Sum of Squares (RSS):", rss)

决定系数 R 2 R^2 R2

决定系数(Coefficient of Determination),通常用 R 2 R^2 R2表示,是一种用于衡量一个回归模型的拟合优度的统计量。它表示模型能够解释的目标变量方差的比例。
决定系数的计算公式如下:
R 2 = 1 − R S S T S S R^2 = 1 - \frac{RSS}{TSS} R2=1TSSRSS
其中,RSS是残差平方和(Residual Sum of Squares),TSS是总平方和(Total Sum of Squares)。
总平方和表示目标变量(因变量)的方差,计算方法为观测值与观测值的均值之差的平方和:
T S S = ∑ i = 1 n ( y i − y ˉ ) 2 TSS = \sum_{i=1}^{n}(y_i - \bar{y})^2 TSS=i=1n(yiyˉ)2
其中,n是样本数量, y i y_i yi是观测值, y ˉ \bar{y} yˉ是观测值的均值。
决定系数 R 2 R^2 R2的取值范围在 0 到 1 之间,越接近1表示模型拟合得越好,即模型能够解释目标变量方差的比例越高。当 R 2 R^2 R2等于1时,表示模型完美拟合数据,解释了目标变量方差的100%。而当 R 2 R^2 R2等于0时,表示模型无法解释目标变量的变异性,预测值与真实值之间的差异全部由随机误差导致。

from sklearn.metrics import r2_score
import numpy as np

# 示例数据
actual_values = np.array([1, 2, 3, 4, 5])
predicted_values = np.array([1.2, 2.1, 2.9, 4.2, 5.3])

# 计算决定系数 R^2
r_squared = r2_score(actual_values, predicted_values)

print("Coefficient of Determination (R^2):", r_squared)

平均绝对误差MAE

平均绝对误差(Mean Absolute Error,MAE)是一种衡量预测模型误差的指标,它表示观测值与预测值之间的绝对差异的平均值。
MAE 的计算公式如下:
MAE = 1 n ∑ i = 1 n ∣ y i − y ^ i ∣ \text{MAE} = \frac{1}{n} \sum_{i=1}^{n} \left| y_i - \hat{y}_i \right| MAE=n1i=1nyiy^i
其中,n是样本数量, y i y_i yi是观测值, y ^ i \hat{y}_i y^i是对应的预测值。
MAE 的计算方法是将每个观测值与其对应的预测值之差取绝对值后求和,然后再取平均值。
MAE 越小表示模型的预测能力越好,因为它表示了观测值与预测值之间的平均绝对偏差。

import numpy as np

# 示例数据
actual_values = np.array([1, 2, 3, 4, 5])
predicted_values = np.array([1.2, 2.1, 2.9, 4.2, 5.3])

# 计算绝对误差
absolute_errors = np.abs(actual_values - predicted_values)

# 计算平均绝对误差
mae = np.mean(absolute_errors)

print("Mean Absolute Error (MAE):", mae)

聚类模型

轮廓系数

轮廓系数(Silhouette Coefficient)是一种用于评估聚类结果的指标,它同时考虑了簇内的紧密度和簇间的分离度。轮廓系数的取值范围在 -1 到 1 之间,数值越接近 1 表示聚类结果越好,数值越接近 -1 则表示聚类结果越差。
轮廓系数的计算方式如下:
对于每个样本 i:
计算样本 i 到同簇其他样本的平均距离,记作 a i a_i ai a i a_i ai 越小表示样本 i 越应该被分到该簇。
计算样本 i 到其他某个簇中所有样本的平均距离,取最小值,记作 b i b_i bi,即样本 i 与最近其他簇的平均距离, b i b_i bi 越大表示样本 i 越不应该被分到其他簇。
根据以下公式计算样本 i 的轮廓系数:
silhouette i = b i − a i max ⁡ ( a i , b i ) \text{silhouette}_i = \frac{b_i - a_i}{\max(a_i, b_i)} silhouettei=max(ai,bi)biai
最后,对所有样本的轮廓系数取平均,即为整个数据集的轮廓系数。
在实际应用中,轮廓系数可以用来选择最优的聚类数目或者比较不同聚类算法的性能。

from sklearn.metrics import silhouette_score
from sklearn.cluster import KMeans
import numpy as np

# 示例数据
X = np.array([[1, 2], [2, 3], [6, 7], [8, 9]])

# 使用 KMeans 聚类算法进行聚类
kmeans = KMeans(n_clusters=2)
kmeans.fit(X)
labels = kmeans.labels_

# 计算轮廓系数
silhouette_avg = silhouette_score(X, labels)

print("Silhouette Score:", silhouette_avg)

互信息

互信息(Mutual Information)是一种用于度量两个随机变量之间的相关性的指标。它衡量的是在已知一个随机变量的情况下,另一个随机变量的不确定性减少了多少。
互信息的计算公式如下:
I ( X ; Y ) = ∑ y ∈ Y ∑ x ∈ X p ( x , y ) log ⁡ ( p ( x , y ) p ( x ) p ( y ) ) I(X;Y) = \sum_{y \in Y} \sum_{x \in X} p(x, y) \log \left( \frac{p(x, y)}{p(x)p(y)} \right) I(X;Y)=yYxXp(x,y)log(p(x)p(y)p(x,y))
其中, I ( X ; Y ) I(X;Y) I(X;Y)表示变量 X X X Y Y Y之间的互信息, p ( x , y ) p(x, y) p(x,y)是变量 X X X Y Y Y同时取值 x x x y y y的概率, p ( x ) p(x) p(x) p ( y ) p(y) p(y)分别是变量 X X X Y Y Y单独取值 x x x y y y的概率。
互信息越大表示变量之间的相关性越强,互信息为 0 表示两个变量之间没有相关性。

from sklearn.metrics import mutual_info_score

# 示例数据
X = [1, 2, 3, 4, 5]
Y = [1, 2, 2, 3, 3]

# 计算互信息
mutual_info = mutual_info_score(X, Y)

print("Mutual Information:", mutual_info)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1441529.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

UE4运用C++和框架开发坦克大战教程笔记(十九)(第58~60集)完结

UE4运用C和框架开发坦克大战教程笔记(十九)(第58~60集)完结 58. 弹窗显示与隐藏59. UI 面板销毁60. 框架完成与总结 58. 弹窗显示与隐藏 这节课我们先来补全 TransferMask() 里对于 Overlay 布局类型面板的遮罩转移逻辑&#xff…

[Angular 基础] - 指令(directives)

[Angular 基础] - 指令(directives) 这里假设已经知道如何创建 Angular 组件以及数据绑定,不然可以参考前两篇笔记: [Angular 基础] - Angular 渲染过程 & 组件的创建 [Angular 基础] - 数据绑定(databinding) 就像中文翻译一样,dire…

Vue-Vue3 集成编辑器功能

1、安装依赖 编辑器插件需要安装 wangeditor/editor 和 wangeditor/editor-for-vue 两个插件 npm install wangeditor/editor --savevue3运行如下命令安装 npm install wangeditor/editor-for-vuenext --savevue2运行如下命令安装 npm install wangeditor/editor-for-vue -…

清平乐-春风丽日

今天,是2024年农历除夕日,远方家人已于昨夜风尘扑扑地倦鸟归巢,团聚过龙年,今晨酣睡未起。老龄笔者心情极佳,一夜好梦醒来,推窗仰头展望苍穹,喜上心头:啊!接连几天的小雨…

containerd中文翻译系列(十八)containerd支持NRI

节点资源接口 NRI 是节点资源接口(Node Resource Interface),它是一个通用框架,用于将扩展功能插入兼容 OCI 的容器运行时。它提供了插件跟踪容器状态并对其配置进行有限的更改改的基本机制。 NRI 本身与任何容器运行时的内部实…

MySQL篇----第十五篇

系列文章目录 文章目录 系列文章目录前言一、实践中如何优化 MySQL二、优化数据库的方法三、简单描述 MySQL 中,索引,主键,唯一索引,联合索引的区别,对数据库的性能有什么影响(从读写两方面)前言 前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分…

Cilium CNI深度指南

Cilium是基于eBPF的功能强大的CNI插件,为云原生环境提供了强大的网络和安全支持。原文: Cilium CNI: A Comprehensive Deep Dive Guide for Networking and Security Enthusiasts! 🌓简介 欢迎阅读为网络和安全爱好者提供的全面深入的指南! 本…

Django(十)

1. Ajax请求 浏览器向网站发送请求时:URL 和 表单的形式提交。 GETPOST 特点:页面刷新。 除此之外,也可以基于Ajax向后台发送请求(偷偷的发送请求)。 依赖jQuery编写ajax代码 $.ajax({url:"发送的地址"…

《剑指 Offer》专项突破版 - 面试题 37 : 小行星碰撞(C++ 实现)

题目链接:LCR 037. 行星碰撞 - 力扣(LeetCode) 题目: 输入一个表示小行星的数组,数组中每个数字的绝对值表示小行星的大小,数字的正负号表示小行星运动的方向,正号表示向右飞行,负…

探索设计模式的魅力:代理模式揭秘-软件世界的“幕后黑手”

设计模式专栏:http://t.csdnimg.cn/U54zu 目录 引言 一、魔法世界 1.1 定义与核心思想 1.2 静态代理 1.3 动态代理 1.4 虚拟代理 1.5 代理模式结构图 1.6 实例展示如何工作(场景案例) 不使用模式实现 有何问题 使用模式重构示例 二、…

HttpClient | 支持 HTTP 协议的客户端编程工具包

目录 1、简介 2、应用场景 3、导入 4、API 5、示例 5.1、GET请求 5.2、POST请求 🍃作者介绍:双非本科大三网络工程专业在读,阿里云专家博主,专注于Java领域学习,擅长web应用开发、数据结构和算法,初…

Spring Boot 笔记 004 自动配置和自定义starter

003讲到了导入jar包中的方法,但其实是个半成品,别人写的jar包中的方法我要在自己的代码中去调用,非常的不方便。原则上写给别人用的jar包,人家要能直接用,而不用写注入的方法。 在springboot中会自动扫描imports文件中…

ThinkPad X201 经典小黑 折腾玩

前段时间,在折腾ThinkPad T430时,偶然看到了ThinkPad X200,一个12.1英寸的高端便携小本。 想当年,但那是总裁级别才能用的,应该是接近2万元,我们是一直用DELL的。 没想到的是,在海鲜市场上&am…

[office] excel如何计算毛重和皮重的时间间隔 excel计算毛重和皮重时间间隔方法 #笔记#学习方法

excel如何计算毛重和皮重的时间间隔 excel计算毛重和皮重时间间隔方法 在日常工作中经常会到用excel,有时需要计算毛重和皮重的时间间隔,具体的计算方式是什么,一起来了解一下吧 在日常工作中经常会到用excel,在整理编辑过磅数据…

贵金属交易包括哪些?香港有哪些贵金属交易平台?

随着金融市场的不断发展,贵金属交易作为一种投资方式,越来越受到投资者的关注。贵金属交易不仅具有投资价值,还能够为投资者提供规避风险和保值的工具。本文将介绍贵金属交易的种类和香港的贵金属交易平台。 一、贵金属交易的种类 贵金属交…

【开源】JAVA+Vue.js实现高校实验室管理系统

目录 一、摘要1.1 项目介绍1.2 项目录屏 二、研究内容2.1 实验室类型模块2.2 实验室模块2.3 实验管理模块2.4 实验设备模块2.5 实验订单模块 三、系统设计3.1 用例设计3.2 数据库设计 四、系统展示五、样例代码5.1 查询实验室设备5.2 实验放号5.3 实验预定 六、免责说明 一、摘…

个人IP塑造与短视频带货,人人都是吸金的网红博主

一、教程描述 网红带货,就是网络红人通过推荐和分享,间接销售产品的一种方式。网红带货并不是直接带货,而是需要打造自己,用时下热门的话讲叫塑造IP,一般通过旅行、工作、日常服装搭配等这些行为,输出自己…

2024-02-08 Unity 编辑器开发之编辑器拓展1 —— 自定义菜单栏与窗口

文章目录 1 特殊文件夹 Editor2 在 Unity 菜单栏中添加自定义页签3 在 Hierarchy 窗口中添加自定义页签4 在 Project 窗口中添加自定义页签5 在菜单栏的 Component 菜单添加脚本6 在 Inspector 为脚本右键添加菜单7 加入快捷键8 小结 1 特殊文件夹 Editor ​ Editor 文件夹是 …

数据在内存中的存储:深入了解与理解技巧

​ ✨✨ 欢迎大家来到贝蒂大讲堂✨✨ ​ 🎈🎈养成好习惯,先赞后看哦~🎈🎈 ​ 所属专栏:C语言学习 ​ 贝蒂的主页:Betty‘s blog 引言 ​ 我们早就学完基本的数据类型,那这些数据类型…

PCIe学习笔记(1)Hot-Plug机制

文章目录 Hot-Plug InitHot Add FlowSurprise Remove FlowNPEM Flow Hot-Plug Init PCIe hot-plug是一种支持在不关机情况下从支持的插槽添加或删除设备的功能,PCIe架构定义了一些寄存器以支持原生热插拔。相关寄存器主要分布在Device Capabilities, Slot Capabili…