模型评估 (Model Assessment)

news2025/4/12 14:37:59

1.模型评估 (Model Assessment)

笔记来源于《白话机器学习的数学》

我们训练好模型后，要对知道这个模型到底好不好，定量描述这个模型好坏就是模型评估

把获取的全部训练数据分成两份：一份用于测试，一份用于训练。然后用前者来评估模型。大多数情况会采用 3 : 7 或者 2 : 8 这种训练数据更多的比例
把全部训练数据分为测试数据和训练数据的做法称为交叉验证

假如我们要进行 4 折交叉验证，那么就会这样测量精度

不切实际地增加 K 值会非常耗费时间，所以我们必须要确定一个合适的 K 值

1.1 回归问题的验证

对于回归的情况，只要在训练好的模型上计算测试数据的误差的平方，再取其平均值就可以了。（其实是个误差函数，回归问题的目标函数也是误差函数）
测试数据有 n 个，则均方误差（MSE）

MSE越小，精度就越高，模型也就越好
除了MSE外，还有均方根误差（RMSE）、平均绝对误差（MAE）、均方根对数误差(RMSLE)等

1.2 分类问题的验证

精度（Accuracy）
表示在整个数据集中，被正确分类的数据 TP 和 TN 所占的比例，得到精度基本可以掌握分类结果的整体的精度了

精确率（Precision）（以TP为主）
在被分类为 Positive 的数据中，本来就是 True 的数据所占的比例

精确率（Precision）（以TN为主）

召回率（Recall）（以TP为主）
在True数据中，实际被分类为 Positive 的数据所占的比例

召回率（Recall）（以TN为主）

怎么选择用以TP为主的精确率和召回率还是用以TN为主的？

当数据不平衡时，使用数量少的那个会更好
如果 Positive 少，就使用 TP为主的
如果 Negative 少，就使用 TN为主的

通常情况下精确率和召回率会一个高一个低，需要我们取舍，有些麻烦

F1值
精确率和召回率的调和平均值

带权重的F值
$\beta$ 为权重，权重为1时就是上式

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/680890.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

数据库实训报告3000字

数据库实训报告3000字

数据库实训报告1 一、实习目的认识实习是本科教学计划中非常重要的实践性教学环节，其目的是使学生了解和掌握电力生产知识、印证、巩固和丰富已学过的计算机专业课程内容，培养学生理论联系实际，提高其在生产实践中调查研究、观察问题、分析问…

阅读更多...

银行账户管理系统

银行账户管理系统

1. 目的与要求 1、目的: (1)熟练掌握 C语言的基本知识和技能: (2)掌握面向对象程序设计的基本思想和方法;(3)能够利用所学的面向对象基本知识和技能，解决简单应用的程序设计 2、基本要求:(1)利用面向对象的方法以及 C的编程思想来完成系统的设计;(2)在设计的过程中…

阅读更多...

抽象工厂模式（Abstract Factory）

抽象工厂模式（Abstract Factory）

定义抽象工厂是一种创建型设计模式，它能创建一系列相关的对象，而无需指定其具体类。前言 1. 问题假设你正在开发一款家具商店模拟器。你的代码中包括一些类，用于表示： 一系列相关产品，例如椅子（Chai…

阅读更多...

091基于深度学习的手写汉字数字识别含10多种模型

091基于深度学习的手写汉字数字识别含10多种模型

emo仓库和视频演示找091期： 银色子弹zg的个人空间-银色子弹zg个人主页-哔哩哔哩视频效果展示图如下： 代码文件展示如下： 运行01数据集文本生成制作.py可以读取图片路径保存再txt文本中， 运行02train.py可以对txt文本中的图片路…

阅读更多...

同程数科基于 Apache Doris 构建统一实时数仓，查询提速数十倍！

同程数科基于 Apache Doris 构建统一实时数仓，查询提速数十倍！

本文导读： 同程数科是同程集团旗下的旅游产业金融科技服务平台，为上下游企业和个人消费者提供数字金融科技服务。近年来，随着同程数科业务的不断拓展和用户量的增加，高效可靠的一站式数据中心建设已成为必不可少的需求。为帮助业…

阅读更多...

团体程序设计天梯赛-练习集L2篇④

团体程序设计天梯赛-练习集L2篇④

🚀欢迎来到本文🚀 🍉个人简介：Hello大家好呀，我是陈童学，一个与你一样正在慢慢前行的普通人。 🏀个人主页：陈童学哦CSDN 💡所属专栏：PTA 🎁希望各…

阅读更多...

WPF 零基础入门笔记（1）：WPF静态页面，布局+样式+触发器

WPF 零基础入门笔记（1）：WPF静态页面，布局+样式+触发器

文章目录官方文档往期回顾零基础笔记项目实战（已完结） WPF项目创建为什么选net core版本 WPF 静态页面WPF 页面布局WPF样式Style样式行内样式行外样式如果是简单样式，可以这么写如果是复杂样式 WPF样式继承WPF触发器单条件触发器多条件触发 …

阅读更多...

LLDP（链路层发现协议）详解及C/C++代码实现

LLDP（链路层发现协议）详解及C/C++代码实现

LLDP（链路层发现协议）是一种IEEE标准协议（IEEE 802.1AB），它定义了封装在以太网帧中的消息，目的是通过默认情况下每30秒从每个端口定期重传一次，为设备提供一种向LAN（局域网&#xff…

阅读更多...

20个Java编程技巧

20个Java编程技巧

1. 把字符串常量放在前面通过把字符串常量放在比较函数equals()比较项的左侧来防止偶然的 NullPointerException 从来都不是一个坏主意，就像这样： 这是毫无疑问的，把一种表达式转换成另一种更好的表达式，并不会失去什么。只要我…

阅读更多...

mysql锁机制及MVCC底层原理

mysql锁机制及MVCC底层原理

一、锁介绍按性能可分为乐观锁（适用于读多写少的情况下，如果是写多，导致过多cpu空转，影响性能）和悲观锁（适用于写多的情况）按数据库操作粒度可分为表锁、页锁、行锁按数据库操作类型可分为读锁…

阅读更多...

UE4/5动画系列（1.模板制作）

UE4/5动画系列（1.模板制作）

目录动画模板制作同步模板组制作有模板做什么都方便，所以这里我们做一个动画蓝图的模板（动物专用） 动画模板制作第一步创建一个动画蓝图的模板然后找到第三人称的模板，将其模板的蓝图改名： 在动画蓝图的模板里…

阅读更多...

团体程序设计天梯赛-练习集L2篇②

团体程序设计天梯赛-练习集L2篇②

🚀欢迎来到本文🚀 🍉个人简介：Hello大家好呀，我是陈童学，一个与你一样正在慢慢前行的普通人。 🏀个人主页：陈童学哦CSDN 💡所属专栏：PTA 🎁希望各…

阅读更多...

首个跨云元数据KV存储Xline正式进入CNCF沙箱

首个跨云元数据KV存储Xline正式进入CNCF沙箱

2023年6月13日，云原生计算基金会（CNCF）宣布Xline正式被纳入CNCF沙箱(Sandbox）项目。Xline是由达坦科技（DatenLord）于2022年年底推出的开源项目，是一个用Rust语言写就的，用于元数据管…

阅读更多...

hello算法笔记之图

hello算法笔记之图

一、图的基础知识图是一种非线性数据结构，由「顶点 Vertex」和「边 Edge」组成。 1.图的类型： 根据边是否具有方向可以分为有向图，无向图根据所有顶点是否连通可以分为连通图（对于连通图，从某个顶点出发&#xf…

阅读更多...

gdb系列-入门篇-day01

gdb系列-入门篇-day01

gdb基础命令一个程序要被调试，编译的时候要加上-g选项，例如gcc -g … 先准备一个调试的小代码 #include <stdio.h>int hello() {printf("hello\n");return 0; }int main() {int a[5] {1,2,3,4,5};hello();for(int i0; i<5; i){pri…

阅读更多...

springboot使用@Valid 和 @Validated 注解校验详解以及编写一个自定义全局异常类

springboot使用@Valid 和 @Validated 注解校验详解以及编写一个自定义全局异常类

package com.test.springvalid.config;import lombok.Data; import java.util.HashMap; import java.util.Map;/*** 通用返回结果，服务端响应的数据最终都会封装成此对象* param <T>*/ Data public class R<T> {private Integer code; //编码&#xff1…

阅读更多...

Mybatis源码分析_Mapper接口是如何实例化的（2）

Mybatis源码分析_Mapper接口是如何实例化的（2）

我们在使用Springmybatis的时候，经常都是直接写一个接口和一个对应的 ***Mapper.xml文件，然后业务代码就可以直接注入这个接口了。它是如何做到的呢？ 接口： xml 想搞清楚这个问题，那还是要从Mybatis底层源码进行分析的…

阅读更多...

智能小车使用IIC屏幕做动作显示界面

智能小车使用IIC屏幕做动作显示界面

一、简介使用0.96寸IIC屏幕作为遥控动作的显示界面。外设引脚 stm32f103c8t6单片机IIC引脚有两组使用I2C1，对应的时钟与数据线分别为PB6、PB7。 IIC屏幕指令 // OLED_WR_Byte(0xAE,OLED_CMD);//--turn off oled panel // OLED_WR_Byte(0x00,OLED_CMD);//---se…

阅读更多...

07- c语言指针 (C语言)

07- c语言指针 (C语言)

一指针的引入 1、一般把内存中的一个字节称为一个内存单元。 2、为了正确地访问这些内存单元，必须为每个内存单元编上号。根据一个内存单元的编号即可准确地找到该内存单元。内存单元的编号也叫做地址，通常也把这个地址称为指针。 3、如果在程序中定义…

阅读更多...

车载网络测试 - CANCANFD - 基础篇_03

车载网络测试 - CANCANFD - 基础篇_03

十、发送方式与过滤方式 1、广播发送及规则我们以小组讨论现场为例来说明CAN总线广播发送规则： 1）一个房间代表同一路CAN总线，每一个小组代表一个CAN Node，每一个小组成员发言代表发送一帧CAN报文，对所有的小组成员进…

阅读更多...

推荐文章

最新文章