python统计分析——单变量分布的特征描述之分布中心

python统计分析——单变量分布的特征描述之分布中心

news2026/2/16 12:40:13

参考资料：python统计分析【托马斯】

也可查看：python统计分析——单变量描述统计-CSDN博客

当我们有一个来自分布的数据样本时，我们可以用不同的参数来描述分布中心。因此，数据可以用两种方式来评估：

（1）用它们的值；

（2）用他们的秩（即按大小排序时的列表编号）。

1、均值

默认来说，当我们讲到均值的时候，我们指的是算术均值 $\bar{x}$

$\bar{x}=\frac{\sum_{i=1}^n x_i}{n}$

我们可以使用命令np.mean来找到数组x的均值。

现实生活中的数据通常包含缺失值，在许多情况下，缺失值用nan来代替（nan代表“非数字”，即not a number）。对于包括nan的数组的统计，numpy具有许多处理nan的函数。

import numpy as np

x=np.arange(10)
# 计算均值
np.mean(x)

# 在x数组中添加一个nan
xWithNan=np.hstack((x,np.nan))
xWithNan

当数组中有nan时，用np.nanmean()函数来计算数据均值。

2、中位数

中位数是当数据按顺序排序时中间的值。与均值不同，中位数不受离群数据点的影响。计算中位数的函数为np.median()，代码效果如下：

np.median(x)

注意，如果像我们这个例子中一样，一个分布是对称的，那么它的均值和中位数会重合。

3、众数

众数是一个分布中出现最频繁的值。

找到众数最简单的方法是scipy.stats中对应的函数，它能够提供众数值和频数。函数为：scipy.stats.mode()。代码展示如下：

# 导入库
from scipy import stats
# 模拟数据
data=[1,3,4,4,7]
# 求众数
stats.mode(data)

4、几何均值

在某些情况下，几何平均可以用来描述分布的位置。它可以通过计算每个值对数的算术平均数来得到。python中计算几何均值的函数为：scipy.stats.gmean()。代码展示如下：

# 模拟数据
x=np.arange(1,101)
# 计算几何均值
stats.gmean(x)

注意，计算几何均值的输入数字必须是正的。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1517530.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

Xcode15.3 -Library ‘iconv2.4.0‘ not found

Xcode15.3 -Library ‘iconv2.4.0‘ not found

今天升级了一下Mac mini 和Xcode15.3，运行项目就报 Library ‘iconv2.4.0’ not found的错误 xcode升级到：15.3(15A240d) 项目在旧版本下，是能通过编译并且能运行的。解决方法： 方案1：在Build Phases --> Link…

阅读更多...

SSL VPN基础原理

SSL VPN基础原理

目录 SSL ---安全传输协议（安全套接层）---TLS ----传输层安全协议 SSL的工作原理 SSL会话建立的过程编辑数据传输过程中的封装示意图无客户端认证的过程有客户端认证的过程 SSL VPN的核心技术---虚拟网关技术服务器验证的点： 资源…

阅读更多...

Gitlab光速发起Merge Request

Gitlab光速发起Merge Request

前言在我们日常开发过程中需要经常使用到Merge Request，在使用过程中我们需要来回在开发工具和UI界面之前来回切换，十分麻烦。那有没有一种办法可以时间直接开发开工具中直接发起Merge Request呢？ 答案是有的。使用 Git 命令方式创建 Me…

阅读更多...

npm、nodejs和vue之间关系和区别介绍

npm、nodejs和vue之间关系和区别介绍

本文讲解npm、Node.js和Vue.js这三者之间的关系和区别，以及它们各自的特点。首先，让我们来了解一下Node.js。 **Node.js** 是一个开源的服务器端运行环境，它允许开发者使用JavaScript来编写服务器端的代码。在传统的Web开发中&#…

阅读更多...

免费 Copilot 用户可以访问 OpenAI 的 GPT-4 Turbo；面向 3D 虚拟环境的多面手 AI 代理

免费 Copilot 用户可以访问 OpenAI 的 GPT-4 Turbo；面向 3D 虚拟环境的多面手 AI 代理

🦉 AI新闻 🚀 免费 Copilot 用户可以访问 OpenAI 的 GPT-4 Turbo 摘要：微软宣布免费版Copilot已升级到GPT-4 Turbo模型，所有用户都可以免费使用。此外，Copilot Pro新增了GPT Builder工具，订阅者可创建自定…

阅读更多...

网上商城购物系统|基于springboot框架+ Mysql+Java+B/S架构的网上商城购物系统设计与实现(可运行源码+数据库+设计文档+部署说明)

网上商城购物系统|基于springboot框架+ Mysql+Java+B/S架构的网上商城购物系统设计与实现(可运行源码+数据库+设计文档+部署说明)

推荐阅读100套最新项目最新ssmjava项目文档视频演示可运行源码分享最新jspjava项目文档视频演示可运行源码分享最新Spring Boot项目文档视频演示可运行源码分享目录前台功能效果图管理员功能登录前台功能效果图用户功能模块系统功能设计数据库E-R图设计 lunwen参…

阅读更多...

【数据结构】哈希表（哈希函数+负载因子+解决冲突方法）

【数据结构】哈希表（哈希函数+负载因子+解决冲突方法）

文章目录五、哈希表1.概念2.哈希函数1.设计哈希函数：2.常见的哈希函数1.直接定址法（常用）：2.除留余数法（常用） 3.负载因子4.解决冲突1.闭散列法（开放地址法）1.线性探测法&#xff1…

阅读更多...

docker容器启动rabbitmq

docker容器启动rabbitmq

docker容器启动rabbitmq 一、RabbitMQ部署1.1.在线拉取mq镜像1.2.运行mq容器1.3.访问mq 二、RabbitMQ的集群2.1.集群分类2.1.设置 /etc/hosts文件 endl 一、RabbitMQ部署 1.1.在线拉取mq镜像 # 在线拉取 docker pull rabbitmq:3-management1.2.运行mq容器 docker run \ -e R…

阅读更多...

python爬虫 Appium+mitmdump 京东商品

python爬虫 Appium+mitmdump 京东商品

爬虫系列：http://t.csdnimg.cn/WfCSx 前言我们知道通过Charles进行抓包可以发现其参数相当复杂，Form 表单有很多加密参数。如果我们只用 Charles 探测到这个接口链接和参数，还是无法直接构造请求的参数，构造的过程涉及一些加密…

阅读更多...

Kafka-生产者报错javax.management.InstanceAlreadyExistsException

Kafka-生产者报错javax.management.InstanceAlreadyExistsException

生产者发送消息到 kafka 中,然后控制台报错然后根据日志查看 kafka 的源码发现了问题原因说的是MBean已经注册了,然后报异常了,这样就会导致生产者的kafka注册失败, 原因是项目上生产者没有配置clientId,默认都是空导致的, 多个生产者(项目)注册到kafka集群中的 id 都相同。 …

阅读更多...

水泵房远程监控物联网系统

水泵房远程监控物联网系统

随着物联网技术的快速发展，越来越多的行业开始利用物联网技术实现设备的远程监控与管理。水泵房作为城市供水系统的重要组成部分，其运行状态的监控与管理至关重要。HiWoo Cloud作为专业的物联网云服务平台，为水泵房远程监控提供了高效、稳定、…

阅读更多...

SpringCloud(22)之Sentinel实战应用

SpringCloud(22)之Sentinel实战应用

一、Sentinel核心库 sentinel主页：主页 alibaba/Sentinel Wiki GitHub 1.1 Sentinel介绍随着微服务的流行，服务和服务之间的稳定性变得越来越重要。Sentinel 是面向分布式、多语言异构化服务架构的流量治理组件，主要以流量为切入点&…

阅读更多...

有趣的前端知识（三）

有趣的前端知识（三）

推荐阅读有趣的前端知识（一） 有趣的前端知识（二） 文章目录推荐阅读JS内置对象JS外部对象BOM模型history对象screen对象navigator对象 DOM（文档对象模型）DOM的方法（对于节点的操作&#xff09…

阅读更多...

Rudolf and the Ball Game

Rudolf and the Ball Game

传送门题意思路暴力枚举每一个妆台的转换条件 code #include<iostream> #include<cstdio> #include<stack> #include<vector> #include<algorithm> #include<cmath> #include<queue> #include<cstring> #include<ma…

阅读更多...

ChatGPT 插件Plugin集合

ChatGPT 插件Plugin集合

ChatGPT的插件功能推出一段时间了，陆陆续续的上架了得有200了。但是其中大部分都不是很好用，并且找起来也复杂。推荐一个不知名热心人做的导航页。 ChatGPT Plugins Overview 基本上集合了所有的插件，并且还在实时更新中。需要升级4.0&a…

阅读更多...

el-input设置max、min无效的解决方案

el-input设置max、min无效的解决方案

目录一、方式1：type“number” 二、方式2：oninput（推荐） 三、计算属性如下表所示，下面为官方关于max，min的介绍： el-input： max原生属性，设置最大值min原生属性&a…

阅读更多...

＜Senior High School Math＞: inequality question

＜Senior High School Math＞: inequality question

( 1 ) . o m i t (1). omit (1).omit ( 2 ) . ( a 2 − b 2 ) ( x 2 a 2 − y 2 b 2 ) ( x 2 y 2 ) − ( a 2 y 2 b 2 b 2 x 2 a 2 ) ≤ x 2 y 2 − 2 x y ( x − y ) 2 (2). (a^2-b^2)(\frac{x^2}{a^2} - \frac{y^2}{b^2})(x^2y^2)-(\frac{a^2y^2}{b^2}\frac{b^2x^2}{a^…

阅读更多...

自然语言处理NLP：tf-idf原理、参数及实战

自然语言处理NLP：tf-idf原理、参数及实战

大家好，tf-idf作为文体特征提取的常用统计方法之一，适合用于文本分类任务，本文将从原理、参数详解和实际处理方面介绍tf-idf，助力tf-idf用于文本数据分类。 1.tf-idf原理 tf 表示词频，即某单词在某文本中的出现次数与…

阅读更多...

【刷题】双指针进阶

【刷题】双指针进阶

请看入门篇 ：双指针入门送给我们一句话： 如今我努力奔跑，不过是为了追上那个曾经被寄予厚望的自己 —— 约翰。利文斯顿双指针进阶 Leetcode 611 有效三角形的个数Leetcode LCR179.查找总价格为目标值的两个商品Leetcode 15.三数之和Thanks…

阅读更多...

uniapp中人脸识别图片并圈起人脸

uniapp中人脸识别图片并圈起人脸

效果如上，我用的是阿里云的人脸识别。首先，我们先封装一个阿里云的请求js文件 faceRecognition.js import CryptoJS from crypto-js//SignatureNonce随机数字 function signNRandom() {const Rand Math.random()const mineId Math.round(Rand * 1000…

阅读更多...

推荐文章

最新文章