python学习——描述统计df.describe

news2026/2/12 6:05:26

文章目录

1 描述统计
- 1.1 查看常见统计量 describe
- 1.2 一般对数值型数据统计
- - 1.2.1 基于非空数值统计sum\mean\max\min\var\std
  - 1.2.2 每一列中最大值的行索引 idxmax
  - 1.2.3 每一行中最大值的列索引 idxmax（axis = 1）
  - 1.2.4 非空的数量 count()
- 1.3 一般对字符型数据统计
- - 1.3.1 序列有多少不同的取值
  - 1.3.2 统计分类次数

1 描述统计

描述统计学（descriptive statistics）是一门统计学领域的学科，主要研究如何取得反映客观现象的数据，并以图表形式对所搜集的数据进行处理和显示，最终对数据的规律、特征做出综合性的描述分析。Pandas 库将“描述统计学”作为理论基奠，是对描述统计学知识完美应用的体现。下列表格对 Pandas 常用的统计学函数做了简单的总结：

函数名称	描述说明
count()	统计某个非空值的数量。
sum()	求和
mean()	均值
median()	中位数
mode()	众数
std()	标准差
min()	最小值
max()	最大值
abs()	绝对值
describe（）	统计描述
prod()	所有数值的乘积。
cumsum()	计算累计和，axis=0，按照行累加；axis=1，按照列累加。
cumprod()	计算累计积，axis=0，按照行累积；axis=1，按照列累积。
corr()	计算数列或变量之间的相关系数，取值-1到1，值越大表示关联性越强。

数据集：鸢尾花数据集
链接：https://pan.baidu.com/s/1KXGcqRGkZ0etMach5sIRhg
提取码：2wfo
在这里插入图片描述

1.1 查看常见统计量 describe

df.describe()  #数值型统计描述，非空数值
df.describe(include = ['object'])  #类别型统计描述
df.describe(include = 'all') #包含所有

在这里插入图片描述

1.2 一般对数值型数据统计

1.2.1 基于非空数值统计sum\mean\max\min\var\std

df.iloc[:,:4].sum()  #默认按照列进行求和，添加参数axis = 1,可按行统计,可以同时处理数字和字符串数据,但是字符聚合通常不被使用 
#sum\mean\max\min\var\std 基于非空的数

在这里插入图片描述

1.2.2 每一列中最大值的行索引 idxmax

df.iloc[:,:4].idxmax()

在这里插入图片描述

1.2.3 每一行中最大值的列索引 idxmax（axis = 1）

df.iloc[:,:4].idxmax(axis = 1)

在这里插入图片描述

1.2.4 非空的数量 count()

df.count()

在这里插入图片描述

1.3 一般对字符型数据统计

1.3.1 序列有多少不同的取值

df[''].unique()  #取值
df[''].nunique() #取值数量

在这里插入图片描述

1.3.2 统计分类次数

df[''].value_counts()  #统计分类变量每种分类出现次数

在这里插入图片描述

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/585706.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

python学习——描述统计df.describe

文章目录

1 描述统计

1.1 查看常见统计量 describe

1.2 一般对数值型数据统计

1.2.1 基于非空数值统计sum\mean\max\min\var\std

1.2.2 每一列中最大值的行索引 idxmax

1.2.3 每一行中最大值的列索引 idxmax（axis = 1）

1.2.4 非空的数量 count()

1.3 一般对字符型数据统计

1.3.1 序列有多少不同的取值

1.3.2 统计分类次数

相关文章

Sugar BI 预测服务：快速通过机器学习，进行数据预测分析

赛灵思 ZYNQ UltraScale+ MPSoC Petalinux驱动开发：Linux字符驱动开发

遥感云大数据在灾害、水体与湿地领域典型案例实践及GPT模型应用

GRPC C++ windows下的简易安装方法

C++入门--初步认识类和对象

【网络协议详解】——电子邮件系统协议（学习笔记）

【软件设计与体系结构】软件体系结构风格

IIC接口

OFGF光流引导特征：用于视频动作识别的快速且稳健的运动表示【含源码】

基于MATLAB的数字滤波器语音信号去噪

C++高级数据结构——ST表（倍增表）

Tarball管理

win11使用命令行建立wifi热点，并可以设定名称密码等

信息安全实践1.2(重放攻击)

PyTorch 深度学习 || 专题二：PyTorch 编程基础

R实践——【rgplates】安装、介绍、入门

JMeter 性能测试基本过程及示例

javascript获取对象的键名列表、键值列表

STM32F4_位带操作

springboot+vue 刘老师