Python求均值,方差,标准差

news2024/9/20 18:28:50

参考链接:变异系数(Coefficient of Variation,COV)和协方差(Covariance, Cov)-CSDN博客 

参考链接:pandas中std和numpy的np.std区别_numpy pandas std-CSDN博客


在计算蛋白质谱数据中的每个蛋白对应的变异系数(Coefficient of Variation, CV)时发现,使用numpy 里的 .std() 和 pandas 里的 .std()计算得到的标准差值有差异,于是我就想一探究竟,不查不知道,一查吓一跳,又学到了!

原因在于默认情况下

numpy计算的为总体标准差,ddof=0;一般在拥有所有数据的情况下,计算所有数据的标准差时用,即最终除以n,而非n-1;

pandas计算的为样本标准偏差,ddof=1;一般在只有部分数据,但需要求总体标准差时用,当只有部分数据时,根据统计规律,除以n时计算的标准差往往偏小,因此需要除以n-1,即n-ddof;

numpy 的 .std() 和 pandas 的 .std() 函数之间是不同的

  • numpy 计算的是总体标准差,参数ddof = 0
  • pandas 计算的是样本标准差,参数ddof = 1

CV又称“离散系数”,是概率分布离散程度的一个归一化量度,其定义为标准差 \sigma 与平均值 \mu 之比:

CV = \frac{\sigma }{\mu}

变异系数的优点:

(1)消除单位的影响

(2)消除均值大小不同的影响

我们首先来看一下在统计学中怎么对总体标准差和样本标准差公式进行定义的:

  • 如果是总体,标准差公式根号内除以N
  • 如果是样本,标准差公式根号内除以(N-1)

 我们一般用Numpy来求均值、方差、标准差

import numpy as np 
 
my_list = [1,2,3,4,5,6]

# 求均值
my_mean = np.mean(my_list)

# 求方差
my_var = np.var(my_list)

# 求标准差
my_std = np.std(my_list, ddof=1)
速度区别

速度由快到慢依次:

my_arr = pd.Series([1,2,3,4,5,6])

# 速度由快至慢
np.std(my_arr.values) > my_arr.std(ddof=0) > np.std(my_arr)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1933498.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【Java面向对象】多态

文章目录 1.动态绑定2.对象转换和 instanceof 操作符稍作总结3.Object 类的 equals 方法4.ArrayList 类5.继承体系中的权限问题6.final 1.动态绑定 多态意味着父类型的变量可以引用子类型的对象。 方法可以在沿着继承链的多个类中实现。JVM 决定运行时调用哪个方法。 一个变量…

新手小白攻略:如何用AI工具搭建个人知识库

个人知识库是指个人通过积累和整理,将各种领域的知识、经验和技能进行分类、归纳和存储的系统化工具或平台。 随着信息技术的飞速发展和知识经济的兴起,个人知识库不仅成为个人学习、成长和创新的基石,也是适应快速变化社会、提升竞争力的关…

python--实验 11 模块

目录 知识点 模块基础 模块使用方式 自定义模块示例 模块的有条件执行 Python包结构 定义和导入包 常用第三方库及安装 实例代码 第三方库自动安装脚本 Python标准库介绍 PyInstaller 小结 实验 1.(基础题)制作文本进度条。 2.(基础题) 蒙特卡罗方法计算圆周率…

nginx全局块的user指令

文章目录 1、user指令1.1、进入nginx解压的目录1.2、./configure --help1.3、工作进程默认是nobody 2、user指令的使用步骤:2.1、设置一个用户信息"www"2.2、 创建一个用户2.3、./nginx -s reload2.4、创建/root/html/index.html页面,添加如下内容2.5、修…

住宅IP解析:动态住宅IP和静态住宅IP区别详解

在互联网连接的世界中,IP地址是我们识别和访问网络资源的关键。住宅IP地址,特别是动态住宅IP和静态住宅IP,是两种不同类型的IP分配方式,它们在使用和功能上存在显著差异。 1. IP地址的稳定性 动态住宅IP:这种IP地址是…

昇思25天学习打卡营第14天|munger85

基于MindNLPMusicGen生成自己的个性化音乐 这个所谓的个性化的音乐就是指你输入一段文字它会根据这个文字输出一段音乐这个音乐是贴近于那段文字的所以叫做文生成音乐, 如果网络正常的话就可以直接从下载这个模型。 那么音乐生成的有两种方式呢有两种方式&#xff…

layui 让table里的下拉框不被遮挡

记录:layui 让table里的下拉框不被遮挡 /* 这个是让table里的下拉框不被遮挡 */ .goods_table .layui-select-title,.goods_table .layui-select-title input{line-height: 28px;height: 28px; }.goods_table .layui-table-cell {overflow: visible !important; }.…

[C++初阶]list的模拟实现

一、对于list的源码的部分分析 1.分析构造函数 首先,我们一开始最先看到的就是这个结点的结构体,在这里我们可以注意到这是一个双向链表。有一个前驱指针,一个后继指针。然后在有一个存储数据的空间 其次它的迭代器是一个自定义类型&#x…

【Python游戏】编程开发贪吃蛇游戏(第一期)

本文收录于 《一起学Python趣味编程》专栏,从零基础开始,分享一些Python编程知识,欢迎关注,谢谢! 文章目录 一、前言二、贪吃蛇游戏开发简介2.1 贪吃蛇游戏规则2.2 贪吃蛇游戏开发步骤 三、贪吃蛇游戏开发实战四、总结…

13 个最受欢迎的技术写作工具

13 个最受欢迎的技术写作工具 在我的职业生涯中,我作为技术作家工作了大约 10 年,根据需要使用了各种文档工具。作为技术作家,主要工作职责是提供正确的内容。 使用正确的技术写作工具可以使技术作家的生活变得轻松。有多种工具可用于不同的…

【Vue】Vue3 安装 Tailwind CSS 入门

初始化 Vue 3 项目 npm install -g vue/cli vue create my-project安装 Tailwind CSS 进入你的项目目录,然后安装 Tailwind CSS 和其依赖项: npm install -D tailwindcss postcss autoprefixer配置 PostCSS Tailwind CSS 需要通过 PostCSS 进行处理。…

Linux发行版CentOS 8 利用Docker安装应用

目录 一、什么是Docker? 主要功能: 二、安装Docker 1.安装yum配置工具 2.配置docker的yum源 3.安装 4.测试 5.启动,关闭,开机自启动 三、卸载Docker 1.停止服务 2.卸载 3.删除文件 四、Docker配置镜像源 1.在etc下创建docker…

【大模型时代的PDF解析工具】

去年(2023年)是大模型爆发元年。但是大模型具有两个缺点:缺失私有领域知识和幻觉。缺失私有领域知识是指大模型训练时并没有企业私有数据/知识,所以无法正确回答相关问题。并且在这种情况下,大模型会一本正经地胡说八道…

JavaEE--JavaWeb服务器的安装配置(Tomcat服务器安装配置)

前言: 本文介绍了 Java Web 服务器 Tomcat 的安装配置,并详细说明了如何在 IntelliJ IDEA 中配置服务器,创建 JavaEE 项目,并发布文章。文章首先解释了前端程序如何访问后端程序以及 Web 服务器的概念,然后详细介绍了安装 Tomcat…

VirtualBox虚拟机与主机互传文件的方法

建立共享文件夹 1.点击设置,点击共享文件夹,添加共享文件夹路径,保存 2.启动虚拟机,点击设备,点击安装增强功能,界面会出现一个光碟图标,点击光碟图标 3.打开光碟图标,出现一个目…

Vue3渐变文字(GradientText)

效果如下图:在线预览 APIs GradientText 参数说明类型默认值必传gradient文字渐变色参数string | Gradientundefinedfalsesize文字大小,不指定单位时,默认单位 pxnumber | string14falsetype渐变文字的类型‘primary’ | ‘info’ | ‘succ…

【大模型】FAISS向量数据库记录:从基础搭建到实战操作

文章目录 文章简介Embedding模型BGE-M3 模型亮点 FAISS是什么FAISS实战安装faiss加载Embedding模型创建FAISS数据库搜索FAISS数据删除FAISS数据保存、加载FAISS索引 总结 本人数据分析领域的从业者,拥有专业背景和能力,可以为您的数据采集、数据挖掘和数…

Java语言程序设计基础篇_编程练习题**14.29(游戏:豆机)

第十四章第二十九题 **14.29 (游戏:豆机) 请写一个程序,显示编程练习题 7.21 中介绍的豆机,如图 14-52c 所示 代码展示 package chapter_14;import javafx.application.Application; import javafx.scene.Scene; import javafx.scene.layou…

易保全参与起草的两项区块链全国团体标准正式发布

在数字化转型浪潮席卷全球的今天,区块链技术以其去中心化、透明性、不可篡改等独特优势,正逐步成为重塑各行各业信任机制与业务流程的关键力量。 近日,中国通信工业协会正式发布了《区块链服务 基于区块链的去中心化标识符技术要求》与《区块…

什么是反向代理?

这里写目录标题 一、什么是反向代理?二、反向代理的工作原理三、使用反向代理的好处四、反向代理的风险 在网络领域中,代理服务器是一种常见的技术,用于转发客户端和服务器之间的请求和响应。代理服务器又可以分为反向代理和正向代理两种类型…