precision指标的average参数

news2026/2/11 3:51:05

同样适用于recall、F1

分类任务种类

先说一下分类任务分几种，分类任务主要分为二分类、多分类和多标签这三种。
现在假设我们有一个样本，叫s
二分类是最常见的，将s分给A或B这两类。
多分类是将s分给A或B或C或更多的类别。
多标签是有A、B、C等多个标签，s可能是A、也可能是AB，总之s可能会被分给不止一类。

TP、FN、FP、TN

在分类问题中，accuracy往往不是唯一适用的指标，有时我们更关注precision、recall或F1（还有ROC、PR などなど）

precision、recall、F1都通过TP、FN、FP、TN四个值来计算，直接上图理解四个值的含义
在这里插入图片描述

在这里插入图片描述

average参数

在sklearn的precision指标中有average参数有六种取值，分别是
‘micro’, ‘macro’, ‘samples’, ‘weighted’, ‘binary’, None（pytorch metrics也差不多，不同的是将binary拆分了出去，None以字符串’none’赋值）

下面依次讲解：

‘binary’:
只适用于二分类任务，也是二分类最常用的。
只报告正例（pos_label）的结果

‘micro’:
先计算出全局TP、FP等的总数，再代入公式进行计算

‘macro’:
计算每个标签的对应指标，在对指标求平均值（由于是求平均，所以对样本不平衡不敏感，这个也是多分类中最常用的）

‘weighted’:
和macro差不多，只不过在求平均时给每个标签按照支持度赋予了权重，这可能会导致F1指标不再precision和recall之间

举个例子：
假如在三分类中，用macro是每个类别的precision乘以1/3。用weighted是乘以该类别在总样本中的占比。（说白了，weighted会更重视占比多的类别）

‘samples’:
只对多标签任务有效

None:
计算出每个类别的precision值，返回一个列表(在多分类中这种方法可以让你查看你重点关注的类别信息)

Custom Weights:
这并不属于average的参数，这是利用None返回的列表乘以自定义的权重后返回一个值。这让模型可以更加关注我们所感兴趣的标签的指标。当然这个权重的设置是一个玄学问题，最好在我们关注的指标在总样本中占比少时使用。（更好的解决办法或许是将你的多分类问题转化为二分类问题，或者利用过采样等方法增加你所感兴趣的标签在样本中的占比。）

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/911654.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

基于C++的QT实现贪吃蛇小游戏

基于C++的QT实现贪吃蛇小游戏

文章目录： 一：效果演示二：实现思路三：代码实现 widget.h widget.cpp main.cpp 一：效果演示效果图◕‿◕✌✌✌ 代码下载二：实现思路通过按键控制蛇的移动，每吃一个商品蛇身就会加长…

阅读更多...

16.5.6 【Linux】一个网络服务案例及登录文件协助

16.5.6 【Linux】一个网络服务案例及登录文件协助

setroubleshoot --> 错误讯息写入 /var/log/messages 几乎所有 SELinux 相关的程序都会以 se 为开头，这个服务也是以 se 为开头。troubleshoot是错误克服，因此setroubleshoot要启动。这个服务会将关于 SELinux 的错误讯息与克服方法记录到 /var/log/…

阅读更多...

优化指南：带宽限制的可行策略

优化指南：带宽限制的可行策略

大家好！作为一名专业的爬虫程序员，我们经常面临的一个挑战就是带宽限制。尤其是在需要快速采集大量数据时，带宽限制成为了我们提升爬虫速度的一大阻碍。今天，我将和大家分享一些解决带宽限制的可行策略，希望能帮助大家…

阅读更多...

问道管理：沪指失守3100点机构判断“市场底”渐行渐近

问道管理：沪指失守3100点机构判断“市场底”渐行渐近

8月21日，沪深两市股指盘中全线走低，三大股指收盘均跌超1%，其间沪指收盘指数今年以来初次失守3100点，创业板指更是3年多来初次跌破2100点。截至收盘，沪指跌1.24%报3092.98点，深证成指跌1.32%报10320.39点&am…

阅读更多...

ResizeObserver监听元素大小的变化

ResizeObserver监听元素大小的变化

window.resize不适用于dom的监听。 ResizeObserver ResizeObserver 接口监视 Element 内容盒或边框盒或者 SVGElement 边界尺寸的变化。方法 ResizeObserver.disconnect() 取消特定观察者目标上所有对 Element 的监听。 ResizeObserver.observe() 开始对指定 Element 的监…

阅读更多...

NLP预训练模型超大规模探索

NLP预训练模型超大规模探索

总共从四方面来进行比较。第一个方面，高层次方法（自监督的预训练方法）对比，总共三种方式。语言模型式，就是 GPT-2 那种方式，从左到右预测；BERT-style 式，就是像 BERT 一样将一部…

阅读更多...

通过几段代码，详解Python单线程、多线程、多进程

通过几段代码，详解Python单线程、多线程、多进程

在使用爬虫爬取数据的时候，当需要爬取的数据量比较大，且急需很快获取到数据的时候，可以考虑将单线程的爬虫写成多线程的爬虫。下面来学习一些它的基础知识和代码编写方法。一、进程和线程进程可以理解为是正在运行的程序的实例。进程是拥…

阅读更多...

卷积神经网络实现天气图像分类 - P3

卷积神经网络实现天气图像分类 - P3

🍨 本文为🔗365天深度学习训练营中的学习记录博客🍦 参考文章：Pytorch实战 | 第P3周：彩色图片识别：天气识别🍖 原作者：K同学啊 | 接辅导、项目定制🚀 文章来源&#xff…

阅读更多...

问道管理：中国十大科技板块？

问道管理：中国十大科技板块？

跟着科技的开展，各种高科技工业在我国迅猛开展，其中十大板块就是一个比较典型的代表。这十大科技板块涵盖了从电子信息、生命健康到新材料等多个范畴，让我们一起来了解一下这十大板块的开展现状。一、电子信息作为国家重点支持开展的工业之…

阅读更多...

剑指offer(C++)-JZ64：求1+2+3+...+n(算法-位运算)

剑指offer(C++)-JZ64：求1+2+3+...+n(算法-位运算)

作者：翟天保Steven 版权声明：著作权归作者所有，商业转载请联系作者获得授权，非商业转载请注明出处题目描述： 求123...n，要求不能使用乘除法、for、while、if、else、switch、case等关键字及条件判断语句&…

阅读更多...

如何使用数学将 NumPy 函数的性能提高 50%

如何使用数学将 NumPy 函数的性能提高 50%

一、说明 2D 傅里叶变换是本世纪最重要的计算机科学算法之一。它已在我们的日常生活中得到应用，从Instagram过滤器到MP3文件的处理。普通用户最常用的实现，有时甚至是在不知不觉中，是 NumPy 的改编。然而，尽管它很受欢迎&#xf…

阅读更多...

CDH集群离线配置python3环境，并安装pyhive、impyla、pyspark

CDH集群离线配置python3环境，并安装pyhive、impyla、pyspark

背景： 项目需要对数仓千万级数据进行分析、算法建模。因数据安全，数据无法大批量导出，需在集群内进行分析建模，但CDH集群未安装python3 环境，需在无网情况下离线配置python3环境及一系列第三方库。采取策略&#xf…

阅读更多...

python分析实战(4)--获取某音热榜

python分析实战(4)--获取某音热榜

1. 分析需求打开某音热搜，选择需要获取的热榜如图查找包含热搜内容的接口返回如图将url地址保存 2. 开发定义请求头 headers {Cookie: 自己的cookie,Accept: application/json, text/plain, */*,Accept-Encoding: gzip, deflate,Host: www.douyin.com,…

阅读更多...

vue3+element下拉多选框组件

vue3+element下拉多选框组件

<template><div class"select-checked"><el-select v-model"selected" :class"{ all: optionsAll, hidden: selectedOptions.data.length < 2 }" multipleplaceholder"请选择" :popper-app…

阅读更多...

C++信息学奥赛1129：统计数字字符个数

C++信息学奥赛1129：统计数字字符个数

这段代码的功能是计算一个输入字符串中的数字字符个数。解析注释后的代码如下： #include<bits/stdc.h> using namespace std; int main() {string arr; // 定义字符串变量arr，用来存储输入的字符串getline(cin, arr); // 通过getline函数输入完…

阅读更多...

企业文件透明加密软件——「天锐绿盾」数据防泄密管理软件系统

企业文件透明加密软件——「天锐绿盾」数据防泄密管理软件系统

PC访问地址： 首页一、文档透明加密软件文档透明加密功能：在不影响单位内部员工对电脑任何正常操作的前提下，文档在复制、新建、修改时被系统强制自动加密。文档只能在单位内部电脑上正常使用，在外部电脑上使用是乱码或无法打…

阅读更多...

前端通信（渲染、http、缓存、异步、跨域）自用笔记

前端通信（渲染、http、缓存、异步、跨域）自用笔记

SSR/CSR：HTML拼接？网页源码？SEO/交互性 SSR （server side render）服务端渲染，是指由服务侧（server side）完成页面的DOM结构拼接，然后发送到浏览器，为其绑定状…

阅读更多...

Qt+C++串口调试接收发送数据曲线图

Qt+C++串口调试接收发送数据曲线图

程序示例精选 QtC串口调试接收发送数据曲线图如需安装运行环境或远程调试，见文章底部个人QQ名片，由专业技术人员远程协助！ 前言这篇博客针对<<QtC串口调试接收发送数据曲线图>>编写代码，代码整洁，规则&…

阅读更多...

为何lazada、亚马逊、速卖通卖家都选择自养账号测评？

为何lazada、亚马逊、速卖通卖家都选择自养账号测评？

无论是做亚马逊还是shopee、Lazada、速卖通、wish、煤炉、拼多多Temu、敦煌网、eBay、Etsy、Newegg、美客多、Allegro、阿里国际、poshmark、沃尔玛、joom、OZON等平台。如果想要销量好，免不了进行补单测评的，因为不管对于哪一个平台的店铺新产品而言&am…

阅读更多...

探工业互联网的下一站！腾讯云助力智造升级

探工业互联网的下一站！腾讯云助力智造升级

引言数字化浪潮正深刻影响着传统工业形态。作为第四次工业革命的重要基石，工业互联网凭借其独特的价值快速崛起，引领和推动着产业变革方向。面对数字化时代给产业带来的机遇与挑战，如何推动工业互联网的规模化落地，加速数字经济…

阅读更多...

推荐文章

最新文章