Pandas数据分析教程-描述性统计量

news2026/2/12 12:18:05

pandas基础介绍-命令模版

描述性统计量
- pandas 统计函数
- 相关与协方差
- 唯一值，频次统计,成员关系
- - 1. Series.unique()
  - 2. Series/DataFrame/array.value_counts()
  - 3. Series.isin()
  - 4. get_indexer() 索引对应转换

本文介绍pandas中一些常用的描述性统计量相关知识，包括pandas统计函数、相关系数与协方差、唯一值、频次统计和成员关系。希望可以帮助到有需要的小伙伴。

描述性统计量

pandas 统计函数

从 Series 中提取单个值（如总和或平均值）的方法，或从 DataFrame 的行或列中提取一系列值的方法。与 NumPy 数组上的类似方法相比，它们具有针对缺失数据的内置处理，默认跳过。

以sum举例

#默认沿行计算，得到每一列的和
df.sum()
df.sum(axis='index')
#通过制定axis 变为沿列计算，得到每一行的和
df.sum(axis='columns')

#若不想跳过缺失数据，某行中有NA 则结果就为NA，使用 skipna
df.sum(axis='columns',skipna=False)

可以选择的参数：
在这里插入图片描述

求达到最大值时的索引 df.idxmax()
数字类型和非数字类型统计描述 df.describe()
数字类型返回非零计数、均值、方差、最大最小值等。非数字烈性返回元素出现的频次
其他描述性统计方法

唯一值，频次统计,成员关系

1. Series.unique()

返回Series中元素去掉重复值的结果，不排序

2. Series/DataFrame/array.value_counts()

Series 统计某一列各种值出现的次数
DataFrame 把每一行当做整体，统计其出现的次数

Series.value_counts()
df.value_counts()

#计算DF中每一列每个值出现的次数
df.apply(pd.value_counts).fillna(0)

3. Series.isin()

判断元素是否在Series中，返回布尔值

mask = obj.isin(['b','c'])
obj[mask]

4. get_indexer() 索引对应转换

Index_A.get_indexer(Series_B) 得到B的值对应的A种的索引的数组

to_match = pd.Series(['c','a','b','b','c','a'])
unique_vals = pd.Series(['c','b','a'])

indices = pd.Index(unique_vals).get_indexer(to_match)

在这里插入图片描述

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/933258.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

Pandas数据分析教程-描述性统计量

pandas基础介绍-命令模版

描述性统计量

pandas 统计函数

相关与协方差

唯一值，频次统计,成员关系

1. Series.unique()

2. Series/DataFrame/array.value_counts()

3. Series.isin()

4. get_indexer() 索引对应转换

相关文章

【考研数学】线性代数第四章 —— 线性方程组（2，线性方程组的通解 | 理论延伸）

从“芯”出发，国产IDE来了？网友：VS Code 姊妹款？

22.查找，线性表的查找

深度学习11：Transformer

python下timer定时器常用的两种实现方法

python3GUI--PyQt5打包心得（详细图文演示）

HarmonyOS应用开发者高级认证练习题

深度学习4. 循环神经网络 – Recurrent Neural Network | RNN

css滚动条样式这样修改下很漂亮

Linux系统编程：线程控制

在编辑器中使用正则

探索AIGC人工智能（Midjourney篇）（二）

【车载开发系列】常用开发工具一览

红黑树基础理解

ICP算法

使用Python统计小说语言描写的字数

深度学习模型数值稳定性——梯度衰减和梯度爆炸的说明

读取SD卡图片bin文件显示LCD上

零基础学习正演的数值模拟（含代码）

汤普森采样(Thompson sampling): 理论支持