机器学习(二十二):精度和召回率

news2024/12/24 8:29:04

一、倾斜数据集

倾斜数据集:一个数据集中的正面和负面例子的比例非常不平衡,比如数据集中,结果为1的占比20%,结果为0的占比80%

例子:如果数据集的结果中只有0.5%是1,其余结果是0。有一个模型的预测准确度是99.5%,但是预测了所有数据的结果都是0,这个模型的准确度很高,但是预测不出结果为1,这不能代表这个模型是好模型。因此需要引入其他的误差度量方式来评估模型好坏。

二、精度和召回率

精度:预测为1的数据中,实际真正为1的占比。

召回率:实际为1的数据中,预测真正为1的占比。

例子:下图是实际结果为1和0时,预测结果为1和0的数量统计。

  • 实际为1,预测真1的数据有15个;
  • 实际为1,预测假0的数据有10个;
  • 实际为0,预测假1的数据有5个;
  • 实际为0,预测真0的数据有70个

精度计算:

精度=真正1的数量/预测为1的数量=真1的数量/(真1的数量+假1的数量)=15/(15+5)

召回率计算:

召回率=真正1的数量/实际1的数量=真1的数量/(真1的数量+假0的数量)=15/(15+10)

三、精度和召回的权衡

以逻辑回归为例:模型预测出结果为1的概率是f_{\vec{w},b}(\vec{x})

可以设定阈值为0.5,当f_{\vec{w},b}(\vec{x})≥0.5时,结果为1,当f_{\vec{w},b}(\vec{x})<0.5时,结果为0

也可以设定阈值为0.7,当f_{\vec{w},b}(\vec{x})≥0.7时,结果为1,当f_{\vec{w},b}(\vec{x})<0.7时,结果为0

也可以设定阈值为0.3,当f_{\vec{w},b}(\vec{x})≥0.3时,结果为1,当f_{\vec{w},b}(\vec{x})<0.3时,结果为0

当提高阈值,能提高精度,但是会降低召回率

当降低阈值,能提高召回率,但是会降低精度

如何权衡精度和召回率?

可以使用F1 score结合精度和召回率,F1 score也称为谐波平均值,是一种取平均值的方法,计算结果更偏向于较小的值。

计算公式(P为精度,R为召回):

F1 score = \frac{1}{\frac{1}{2}(\frac{1}{P}+\frac{1}{R}))} = 2\frac{PR}{P+R}

学习来源:吴恩达机器学习,14.1-14.2节

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1954026.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

24.7.17数据结构|顺序表

目录 大O的工程意义? 线性表 引入: 主要掌握【代码实现】: 一、线性结构 1、逻辑描述 2、顺序表 1、如何定义结构 1)静态顺序表 1)动态顺序表 2、写代码 (1)【clion创建工程】 ​编…

Unity横板动作游戏 - 素材导入和整理

导入素材 编辑器布局 点击每个窗口右上角的三个点可以有更多的窗口选项。 在屏幕的右上角有一个菜单可以保存布局或读取已经报错的布局。 工具按钮 编辑器上的工具按钮在启动的时候是蓝色的,在不启动的时候是灰色的。 这个按钮将会决定场景中的物体是以锚点显示还…

大模型算法面试题(十三)

本系列收纳各种大模型面试题及答案。 1、微调后的模型出现能力劣化,灾难性遗忘是怎么回事 微调后的模型出现能力劣化,灾难性遗忘(Catastrophic Forgetting)是一个在机器学习领域,尤其是在深度学习和大模型应用中频繁出…

麒麟系统信创改造

麒麟系统信创改造 一、查看操作系统架构下载相应的依赖,压缩包1、查看Linux系统架构、CPU(1)uname -m(2)lscpu(3)cat /proc/cpuinfo(4)arch(5)getconf LONG_BIT(6)dmidecode2、根据Linux系统架构、CPU的差异进行下载相关依赖,看第二项二、以下是根据本系统的aarc…

Golang | Leetcode Golang题解之第297题二叉树的序列化与反序列化

题目: 题解: type Codec struct{}func Constructor() (_ Codec) {return }func (c Codec) serialize(root *TreeNode) string {if root nil {return "X"}left : "(" c.serialize(root.Left) ")"right : "("…

WordPress插件介绍页源码单页Html

源码介绍 WordPress插件介绍页源码单页Html源码,这是一款产品介绍使用页面,也可以用来做其他软件或者应用介绍下载页,界面简约美观,源码由HTMLCSSJS组成,双击html文件可以本地运行效果,也可以上传到服务器…

理解文件系统(上)

模拟实现文件库 创建文件以便理解 自己想实现的文件接口,进行模拟实现 模拟的头文件要准备的头文件 open接口的实现 write接口的实现fflush接口的实现 flose接口的实现 文件实现 stdio.h stdio.c test.c makefile 创建makefile 编译运行 执行后输出log.txt,看…

宏集物联网工控屏网关实现Modbus TCP数据采集并通过TCP转发

前言 在日常的生产活动中,许多企业需要使用底层PLC或传感器数据,但部分企业的终端平台仅支持TCP协议,而不支持常见的PLC或Modbus协议。为了实现兼容性,需要使用协议转换网关,将底层协议转换为TCP协议。 宏集物联网工…

Python客户端操作Elasticsearch

一.Python与Elasticsearch交互示例 这段代码是使用Python的elasticsearch模块与Elasticsearch进行交互的示例: from elasticsearch import Elasticsearch# 一.创建连接 # 建立到Elasticsearch的连接,指定主机和端口,设置请求超时时间为3600…

【数据结构】单链表面试题(Java + 力扣 + 详解)

🎇🎉🎉🎉点进来你就是我的人了 博主主页:🙈🙈🙈戳一戳,欢迎大佬指点! 人生格言: 当你的才华撑不起你的野心的时候,你就应该静下心来学习! 欢迎志同道合的朋友…

【日常记录】【插件】Typed.js:用于创建打字效果的 JavaScript 库

文章目录 1. 引言2. 安装3. 基本使用参考链接 1. 引言 Typed.js是一个用于创建打字效果的 JavaScript 库。这个效果就是 chatgpt、百度的文心一言等其他的大模型,回复用户的问题的时候的效果 typed-js 官网typed 案例 2. 安装 CDN方式 这俩都可以,还有其…

17 推荐系统方案中那些不得不知的坑

你好,我是大壮。《易经》中说:“上九:亢龙有悔”。上九是指阳爻在卦中处于最高位,亢龙是指飞向尽头的龙,穷尽至极力终有尽时,力尽则悔,悔不可及。 在前面的 18 讲我们已经讨论了整个推荐算法的…

C语言中的IO控制流

文章目录 一、什么是C语言中的IO控制流二、open函数 1.使用open函数创建文件2.使用使用open函数打开文件三、文件的权限四、文件的描述符五、read函数六、write函数七、lseek函数八、close函数 一、什么是C语言中的IO控制流 在linux系统中一切皆文件,C语言中的IO控…

【SQL 新手教程 4/20】关系模型 --索引

💗 关系数据库建立在关系模型上⭐ 关系模型本质上就是若干个存储数据的二维表 记录 (Record): 表的每一行称为记录(Record),记录是一个逻辑意义上的数据 字段 (Column):表的每一列称为字段(Colu…

Java | Leetcode Java题解之第299题猜数字游戏

题目&#xff1a; 题解&#xff1a; class Solution {public String getHint(String secret, String guess) {int bulls 0;int[] cntS new int[10];int[] cntG new int[10];for (int i 0; i < secret.length(); i) {if (secret.charAt(i) guess.charAt(i)) {bulls;} e…

C语言条件语句中switch语句的一些用法

目录 1. switch语句写一个简单的switch语句 2. if语句和else语句的对比判断3的倍数情况 3. switch语句中break详解4. switch语句的一项小练习5. switch语句中的default6. switch语句中的顺序问题 1. switch语句 C语言除了if...else...作为条件语句外&#xff0c;还提供了switc…

Java(十)——接口

个人简介 &#x1f440;个人主页&#xff1a; 前端杂货铺 ⚡开源项目&#xff1a; rich-vue3 &#xff08;基于 Vue3 TS Pinia Element Plus Spring全家桶 MySQL&#xff09; &#x1f64b;‍♂️学习方向&#xff1a; 主攻前端方向&#xff0c;正逐渐往全干发展 &#x1…

数据库表的行列转换(行转列,列转行)

目录 前言 行转列 创建测试表 score1 插入测试数据 需求与通用SQL写法 列转行 创建测试表 score2 插入测试数据 需求与通用SQL写法 前言 在工作中&#xff0c;多多少少都会遇到一些数据展示的需求&#xff0c;开发一个接口&#xff0c;从数据库中查询数据返回页面展示…

Thinkphp仿华为商城源码/红色风格电脑手机数码商城系统网站源码

Thinkphp仿华为商城&#xff0c;主要实现了商品首页展示、用户意见、商品分类列表、商品搜索、商品详细展示、购物车、订单生成、在线付款、以及个人中心完善个人资料、用户修改收货地址、余额查询、消费查询、订单管理、商品评价、热销商品和最近商品浏览&#xff1b; 后台是…

Langchain核心模块与实战[8]:RAG检索增强生成[loader机制、文本切割方法、长文本信息处理技巧]

Langchain核心模块与实战[8]:RAG(Retrieval Augmented Generation,检索增强生成) RAG(Retrieval-Augmented Generation)技术是一种结合检索和生成功能的自然语言处理(NLP)技术。该技术通过从大型外部数据库中检索与输入问题相关的信息,来辅助生成模型回答问题。其核心…