Python求均值，方差，标准差

news2026/2/12 17:52:11

参考链接：变异系数（Coefficient of Variation,COV）和协方差（Covariance, Cov）-CSDN博客

参考链接：pandas中std和numpy的np.std区别_numpy pandas std-CSDN博客

在计算蛋白质谱数据中的每个蛋白对应的变异系数（Coefficient of Variation, CV）时发现，使用numpy 里的 .std() 和 pandas 里的 .std()计算得到的标准差值有差异，于是我就想一探究竟，不查不知道，一查吓一跳，又学到了！

原因在于默认情况下：

numpy计算的为总体标准差，ddof=0；一般在拥有所有数据的情况下，计算所有数据的标准差时用，即最终除以n，而非n-1；

pandas计算的为样本标准偏差，ddof=1；一般在只有部分数据，但需要求总体标准差时用，当只有部分数据时，根据统计规律，除以n时计算的标准差往往偏小，因此需要除以n-1，即n-ddof；

numpy 的 .std() 和 pandas 的 .std() 函数之间是不同的

numpy 计算的是总体标准差，参数ddof = 0
pandas 计算的是样本标准差，参数ddof = 1

CV又称“离散系数”，是概率分布离散程度的一个归一化量度，其定义为标准差 $\sigma$ 与平均值 $\mu$ 之比：

$CV = \frac{\sigma }{\mu}$

变异系数的优点：

（1）消除单位的影响

（2）消除均值大小不同的影响

我们首先来看一下在统计学中怎么对总体标准差和样本标准差公式进行定义的：

如果是总体，标准差公式根号内除以N
如果是样本，标准差公式根号内除以（N-1）

我们一般用Numpy来求均值、方差、标准差

import numpy as np 
 
my_list = [1,2,3,4,5,6]

# 求均值
my_mean = np.mean(my_list)

# 求方差
my_var = np.var(my_list)

# 求标准差
my_std = np.std(my_list, ddof=1)

速度区别

速度由快到慢依次：

my_arr = pd.Series([1,2,3,4,5,6])

# 速度由快至慢
np.std(my_arr.values) > my_arr.std(ddof=0) > np.std(my_arr)

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1933498.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

Python求均值，方差，标准差

速度区别

相关文章

【Java面向对象】多态

新手小白攻略：如何用AI工具搭建个人知识库

python--实验 11 模块

nginx全局块的user指令

住宅IP解析：动态住宅IP和静态住宅IP区别详解

昇思25天学习打卡营第14天|munger85

layui 让table里的下拉框不被遮挡

[C++初阶]list的模拟实现

【Python游戏】编程开发贪吃蛇游戏（第一期）

13 个最受欢迎的技术写作工具

【Vue】Vue3 安装 Tailwind CSS 入门

Linux发行版CentOS 8 利用Docker安装应用

【大模型时代的PDF解析工具】

JavaEE--JavaWeb服务器的安装配置(Tomcat服务器安装配置)

VirtualBox虚拟机与主机互传文件的方法

Vue3渐变文字（GradientText）

【大模型】FAISS向量数据库记录：从基础搭建到实战操作

Java语言程序设计基础篇_编程练习题**14.29（游戏：豆机）

易保全参与起草的两项区块链全国团体标准正式发布

什么是反向代理？