Pandas | value_counts() 的详细用法

Pandas | value_counts() 的详细用法

news2026/2/15 21:09:12

value_counts() 函数得作用

用来统计数据表中，指定列里有多少个不同的数据值，并计算每个不同值有在该列中的个数，同时还能根据指定得参数返回排序后结果。
返回得是Series对象

value_counts(values,sort=True, ascending=False, normalize=False,bins=None,dropna=True)

sort=True：是否要进行排序；默认进行排序
ascending=False：默认降序排列；
normalize=False：是否要对计算结果进行标准化并显示标准化后的结果，默认是False。
bins=None：可以自定义分组区间，默认是否
dropna=True：是否删除缺失值nan，默认删除

数据集：

要求：统计不同lable出现得次数

任何参数都不带

train_df['label'].value_counts()

ascending=True

normalize=True
数据标准化：在多指标评价体系中，由于各评价指标的性质不同，通常具有不同的量纲和数量级。当各指标间的水平相差很大时，如果直接用原始指标值进行分析，就会突出数值较高的指标在综合分析中的作用，相对削弱数值水平较低指标的作用。因此，为了保证结果的可靠性，需要对原始指标数据进行标准化处理。
数据的标准化（normalization）是将数据按比例缩放，使之落入一个小的特定区间。在某些比较和评价的指标处理中经常会用到，去除数据的单位限制，将其转化为无量纲的纯数值，便于不同单位或量级的指标能够进行比较和加权。

train_df['label'].value_counts(ascending=False,normalize=True)

数据标准化以后，所有得项得和为1（可能因为计算机存储数据而有误差）
常用来计算各数据占的比例

bins分组统计
对于数值型的可以进行分组，分组以后返回结果

几种使用方式

先取出列（Series对象），然后调用函数这时候相当于
train_df['label'].value_counts()

DataFrame对每一列都进行统计
train_df.apply(pd.value_counts)
直接使用Pandas调用
pd.value_counts(train_df['label'],ascending=True)

同样的统计还可以使用 groupby,这个的过程是先按‘label’分组然后再统计每组的值，这样的效率较低，不建议使用

train_df.groupby('label').count()

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1559562.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

《Linux运维实战：达梦DM8数据库之基本操作》

《Linux运维实战：达梦DM8数据库之基本操作》

一、创建表空间 1.1、使用客户端工具创建 1、使用 SYSDBA 用户登录 DM 管理工具。右键表空间模块，点击【新建表空间】，如下图所示： 2、可根据项目需要，修改表空间文件、路径、大小、是否自动扩充、扩充上限等信息，如下…

阅读更多...

网络类型整理

网络类型整理

1、点到点 ：在一个网段内只能存在，两个物理节点 MA-多路访问 -- 在一个网段内物理节点的数量不限制 MA--- BMA NBMA 2、BMA -- 广播型多路访问 3、NBMA--非广播型多路访问注：不同网络类型实际为不同的数据链路层技术；由于二…

阅读更多...

力扣--对链表进行插入排序--147

力扣--对链表进行插入排序--147

该题是不带哨兵位的！！！ 目录该题是不带哨兵位的！！！ 首先先进行带哨兵位的代码展示： 但是就提论题，力扣上的这道题，没有明确说明附带哨兵位，我们一律按照…

阅读更多...

11-SpringSecurity：Session共享，菜鸟驿站java面试题

11-SpringSecurity：Session共享，菜鸟驿站java面试题

pom依赖 org.springframework.boot spring-boot-starter-web org.springframework.boot spring-boot-starter-security org.springframework.boot spring-boot-starter-data-redis org.springframework.session spring-session-data-redis org.projectlombok lombok …

阅读更多...

1.java 安装

1.java 安装

操作步骤下载: https://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html1 通过Xftp将下载下来的jdk上传到指定虚拟机上传到/usr目录下 2 通过Xshell连接到虚拟机，执行如下命令，解压文件： $ tar zxvf jdk-8u…

阅读更多...

算法沉淀 —— 动态规划篇（简单多状态dp问题下）

算法沉淀 —— 动态规划篇（简单多状态dp问题下）

算法沉淀 —— 动态规划篇（简单多状态dp问题下） 前言一、买卖股票的最佳时机含冷冻期二、买卖股票的最佳时机含手续费三、买卖股票的最佳时机 IV 前言几乎所有的动态规划问题大致可分为以下5个步骤，后续所有问题分析都将基于此 1.、状态表示…

阅读更多...

概率论经典题目-二维随机变量及分布--由概率密度求分布函数和概率

概率论经典题目-二维随机变量及分布--由概率密度求分布函数和概率

解答： 由概率密度函数求解分布函数的公式可知： 辅助图形加以确定积分上下限

阅读更多...

LCX端口转发

LCX端口转发

LCX介绍 LCX是一款端口转发工具，分为Windows版和Linux版，Linux版本为PortMap。LCX有端口映射和端口转发两大功能，例如当目标的3389端口只对内开放而不对外开放时，可以使用端口映射将3389端口映射到目标的其他端口使用&#xff1b…

阅读更多...

k8s1.28.8版本配置Alertmanager报警方式（邮件，企业微信）

k8s1.28.8版本配置Alertmanager报警方式（邮件，企业微信）

文章目录总结部署流程 Alertmanager 三大核心1. 分组告警2. 告警抑制3. 告警静默报警过滤静默通知方案一：方案二： 抑制报警规则案例一参考文档自定义路由告警，分来自不同路由的告警，艾特不同的人员进行区分修改 alertmanager …

阅读更多...

Spark-Scala语言实战（9）

Spark-Scala语言实战（9）

之前的文章中，我们学习了如何在spark中使用RDD方法的flatMap,take,union。想了解的朋友可以查看这篇文章。同时，希望我的文章能帮助到你，如果觉得我的文章写的不错，请留下你宝贵的点赞，谢谢。 Spark-Scala语言实战&am…

阅读更多...

keepalived+LVS高可用部署

keepalived+LVS高可用部署

目录一.两台设备（2.130和2.133）作为调度器，前主后备 1.部署keepalived 2.修改配置文件准备启动 3.配置keepalived的系统日志并启动二.模拟调度器掉点和web服务进程丢失 1.调度器掉点 2.当类似于httpd这种网站服务掉点三.以三种健康…

阅读更多...

【A-008】基于SSH的员工信息管理系统（含论文）

【A-008】基于SSH的员工信息管理系统（含论文）

员工信息管理系统主要功能如下： (1)员工方面： ①人事管理：能够看到自己的基本信息，对自己的合同进行下载，可以看公司的培训信息； ②招聘管理：查看企业的招聘信息，包括应聘者&#x…

阅读更多...

基于SpringBoot和Vue的学生笔记共享平台的设计与实现

基于SpringBoot和Vue的学生笔记共享平台的设计与实现

今天要和大家聊的是一款基于SpringBoot和Vue的学生笔记共享平台的设计与实现 ！！！ 有需要的小伙伴可以通过文章末尾名片咨询我哦！！！ 💕💕作者：李同学 💕&…

阅读更多...

【Qt】常用控件（输入类）

【Qt】常用控件（输入类）

目录一、Line Edit二、Text Edit三、ComBo四、DateTimeEdit五、Slider 一、Line Edit QLineEdit 用来表示单行输入框，可以输入一段文本，但是不能换行。属性说明test输入框中的文本inputMask输入内容格式约束maxLength最大长度frame是否添加边框echoM…

阅读更多...

AES加密解密算法

AES加密解密算法

一，AES算法概述 AES属于分组加密，算法明文长度固定为128位（单位是比特bit，1bit就是1位，128位等于16字节） 而密钥长度可以是128、192、256位当密钥为128位时，需要循环10轮完成加密&#xff0…

阅读更多...

OpenEuler华为欧拉系统安装教程及联网配置

OpenEuler华为欧拉系统安装教程及联网配置

OpenEuler简介 openEuler是一款开源操作系统。当前openEuler内核源于Linux，支持鲲鹏及其它多种处理器，能够充分释放计算芯片的潜能，是由全球开源贡献者构建的高效、稳定、安全的开源操作系统，适用于数据库、大数据、云计算、人工智…

阅读更多...

人脸检测项目 | 基于C++在英特尔+ARM-CPU上部署人脸检测算法_推理速度可达1000fps

人脸检测项目 | 基于C++在英特尔+ARM-CPU上部署人脸检测算法_推理速度可达1000fps

项目应用场景面向在英特尔ARM CPU 平台部署轻量级的人脸检测算法，要求人脸检测算法的速度是能够达到实时的的场景，项目采用 C 开发，支持跨平台移植到包括 Linux、Windows 等项目效果： 项目细节 > 具体参见项目 README.md (1…

阅读更多...

【LeetCode: 330. 按要求补齐数组 + 贪心 + 构造区间】

【LeetCode: 330. 按要求补齐数组 + 贪心 + 构造区间】

🚀 算法题 🚀 🌲 算法刷题专栏 | 面试必备算法 | 面试高频算法 🍀 🌲 越难的东西,越要努力坚持，因为它具有很高的价值，算法就是这样✨ 🌲 作者简介：硕风和炜，…

阅读更多...

linux进程退出之exit与_exit

linux进程退出之exit与_exit

linux进程退出之exit与_exit _exitexit流程清理函数atexit()函数：on_exit()函数： _exit /* Terminate program execution with the low-order 8 bits of STATUS. */ /** status参数定义了进程的终止状态，父进程可以通过wait（&am…

阅读更多...

使用open3d分离背景和物体点云

使用open3d分离背景和物体点云

一、代码方法简单介绍 RANSAC（随机采样一致性）是一种常用的分割算法，通常用于从点云中分割出最大的平面（如地面、墙壁等）。RANSAC速度相对较快，特别是当点云数据量不是很大时。在物体与背景之间存在明显…

阅读更多...

推荐文章

最新文章