掌握Python Pingouin:数据统计新利器解析!

news2025/1/17 21:54:24

更多资料获取

📚 个人网站:ipengtao.com


Pingouin库基于pandas、scipy和statsmodels,为用户提供了执行常见统计分析的功能。它支持各种统计方法和假设检验,例如 t-tests、ANOVA、correlation analysis 等。让我们看一些示例代码,以更全面地了解如何使用Pingouin库进行统计分析。

安装Pingouin库

首先,确保已安装Pingouin库:

!pip install pingouin

示例1:独立样本t-检验

import pandas as pd
from pingouin import ttest

# 创建示例数据集
data = pd.DataFrame({
    'Group': ['A'] * 20 + ['B'] * 20,
    'Values': list(range(20)) + list(range(10, 30))
})

# 执行独立样本t-检验
ttest_result = ttest(data=data, dv='Values', between='Group')
print(ttest_result)

以上示例演示了如何使用Pingouin进行独立样本t-检验。首先,创建包含两个组的示例数据集。然后使用ttest()函数进行独立样本t-检验,指定数据、因变量和分组变量,并打印结果。

示例2:相关性分析

from pingouin import correlation

# 创建包含两个变量的示例数据集
data = pd.DataFrame({
    'X': range(20),
    'Y': range(20) + [5, 9, 3, 6, 8, 4, 7, 2, 1, 0]
})

# 计算Pearson相关系数和显著性
corr = correlation(data=data, x='X', y='Y', method='pearson')
print(corr)

这个示例展示了如何使用Pingouin执行Pearson相关性分析。创建一个包含两个变量的示例数据集,并使用correlation()函数计算了这两个变量之间的Pearson相关系数以及相关性的显著性。

示例3:双因素方差分析(ANOVA)

from pingouin import anova

# 创建包含两个因素的示例数据集
data = pd.DataFrame({
    'Group': ['A'] * 20 + ['B'] * 20,
    'Values': list(range(20)) + list(range(10, 30)),
    'Category': ['X'] * 10 + ['Y'] * 10 + ['X'] * 10 + ['Y'] * 10
})

# 执行双因素ANOVA
anova_result = anova(data=data, dv='Values', between='Group', detailed=True)
print(anova_result)

这个示例展示了如何使用Pingouin执行双因素方差分析(ANOVA)。创建一个包含两个因素的示例数据集,并使用anova()函数执行双因素ANOVA。指定数据、因变量、分组变量以及detailed=True以获取更详细的分析结果。

配对样本t-检验

from pingouin import ttest

# 创建示例数据集
data = pd.DataFrame({
    'Before': [5, 7, 3, 6, 2],
    'After': [8, 9, 6, 10, 5]
})

# 执行配对样本t-检验
paired_ttest_result = ttest(data=data, dv='Before', within='After', paired=True)
print(paired_ttest_result)

以上是如何使用Pingouin执行配对样本t-检验的示例。创建包含两列(前后两次观测)的示例数据集,并使用ttest()函数进行配对样本t-检验,指定数据、因变量和配对变量,并打印结果。

线性回归

from pingouin import linear_regression

# 创建示例数据集
data = pd.DataFrame({
    'X': range(20),
    'Y': range(20) + [5, 9, 3, 6, 8, 4, 7, 2, 1, 0]
})

# 执行线性回归
regression_result = linear_regression(data=data, x='X', y='Y')
print(regression_result)

上述代码展示了如何使用Pingouin进行线性回归。创建包含两个变量的示例数据集,并使用linear_regression()函数执行线性回归分析,计算回归系数、显著性等,并打印结果。

多因素方差分析(ANOVA)

from pingouin import anova

# 创建包含多个因素的示例数据集
data = pd.DataFrame({
    'Group': ['A'] * 20 + ['B'] * 20,
    'Values': list(range(20)) + list(range(10, 30)),
    'Category': ['X'] * 10 + ['Y'] * 10 + ['X'] * 10 + ['Y'] * 10,
    'Color': ['Red'] * 20 + ['Blue'] * 20
})

# 执行多因素ANOVA
multifactor_anova_result = anova(data=data, dv='Values', between=['Group', 'Color'], detailed=True)
print(multifactor_anova_result)

这个示例展示了如何使用Pingouin进行多因素方差分析(ANOVA)。创建一个包含多个因素的示例数据集,并使用anova()函数执行多因素ANOVA。在此例中,指定了数据、因变量、多个分组变量以及detailed=True以获取更详细的分析结果。

Pingouin库还有更多功能,如非参数检验、协方差分析等。这些功能为用户提供了丰富的统计分析工具,有助于深入了解数据和进行科学实验分析。


Python学习路线

在这里插入图片描述

更多资料获取

📚 个人网站:ipengtao.com

如果还想要领取更多更丰富的资料,可以点击文章下方名片,回复【优质资料】,即可获取 全方位学习资料包。

在这里插入图片描述
点击文章下方链接卡片,回复【优质资料】,可直接领取资料大礼包。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1287288.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

全网最新最全面的Appium自动化:Appium常用操作之点击滑动类操作

点击&滑动类操作 在进行app自动化的时候,经常会进行点击或滑动的操作,比如点击坐标,左右滑动,上下滑动等,Appium相应提供了解决方案。 坐标的开启步骤: 开发者选项——指针位置开启 坐标展示: 在flick和swipe中都提到了坐标…

C/C++---------------LeetCode第118. 杨辉三角

杨辉三角 题目及要求动态规划在mian内使用 题目及要求 给定一个非负整数 numRows&#xff0c;生成「杨辉三角」的前 numRows 行。 示例 1: 输入: numRows 5 输出: [[1],[1,1],[1,2,1],[1,3,3,1],[1,4,6,4,1]] 示例 2: 输入: numRows 1 输出: [[1]] 提示: 1 < numRow…

算法通关村第二关—链表反转的拓展问题(白银)

链表反转的拓展问题 一、指定区间反转 LeetCode92&#xff1a;给你单链表的头指针head和两个整数left和right,其中left<right。请你反转从位置left到位置right的链表节点&#xff0c;返回反转后的链表。 1.1 头插法 反转的整体思想是&#xff0c;在需要反转的区间里&…

Linux 调试器 --- g d b 使用

目录 一&#xff1a;gdb简介 二&#xff1a;示例代码 三&#xff1a;使用 1.启动gdb 2.各种指令 <1>: 查看源代码 <2>:设置断点 <3>:查看断点信息 <4>:删除断点 <5>: run <6>:逐过程调试 <7>:逐语句调试 <8>:查…

AntV和AntD之间的区别与联系

前言&#xff1a;最近在调研前端的一些框架&#xff0c;技术栈主要是用react&#xff0c;所以找到了2个十分相似解决方案&#xff0c;拿来对比一下&#xff08;antd和antv都是基于react&#xff09; antd对比antv antd antv 解决方案企业级 UI 设计语言数据可视化解决方案提供…

Innodb数据结构空间占用

了解数据存储空间占用&#xff0c;可以更方便我们再企业中对于数据库相关优化做评估。 一、查看当前数据表空间占用信息 首先这里准备一张数据库表约2.3w数据量&#xff1a; CREATE TABLE project (tenantsid bigint(20) NOT NULL DEFAULT 0 COMMENT 租户ID,project_id bigi…

双击热备方案实现(全)

双击热备是应用与服务器的一种解决方案&#xff0c;其构造思想是主机和从机通过TCP/IP网络连接&#xff0c;正常情况下主机处于工作状态&#xff0c;从机处于监视状态&#xff0c;一旦从机发现主机异常&#xff0c;从机将会在很短的时间内代替主机。完全实现主机的功能。 要想实…

odoo15关于tree视图添加按钮说明

1、odoo15的tree已经可以像form一样直接添加header标签 2、选取具体数据后&#xff0c;按钮出现&#xff0c;只需要在按钮中添加具体功能即可&#xff0c;下面是一个继承 3、效果&#xff1a;

JVM之四种引用类型(五)

JVM 系列吊打面试官&#xff1a;说一下 Java 的四种引用类型 四种引种类型 1.强引用 在 Java 中最常见的就是强引用&#xff0c;把一个对象赋给一个引用变量&#xff0c;这个引用变量就是一个强引用。当一个对象被强引用变量引用时&#xff0c;它处于可达状态&#xff0c;它是…

如何通过添加香港高防IP来防御攻击?

​  针对外贸建站&#xff0c;租用香港服务器&#xff0c;除了站长们较为关注的价格外&#xff0c;安全性也是至关重要的。香港服务器在使用中可能会遭受到常见的 DDoS 网络攻击&#xff0c;而在 DDoS 防护这一块&#xff0c;您可以使用香港 DDoS 高防 IP 和香港高防服务器来…

基于51单片机多功能时钟闹钟系统

**单片机设计介绍&#xff0c;基于51单片机多功能时钟闹钟系统 文章目录 一 概要二、功能设计设计思路 三、 软件设计原理图 五、 程序六、 文章目录 一 概要 基于51单片机的多功能时钟闹钟系统是一种基于单片机的电子设备&#xff0c;能够显示时间、设置闹钟、进行计时以及提…

解决方案:Mac 安装 pip

python3 --version 通过以下命令来下载pip&#xff1a; curl https://bootstrap.pypa.io/get-pip.py -o get-pip.py curl命令允许您指定一个直接下载链接。使用-o选项来设置下载文件的名称。 通过运行以下命令安装下载的包&#xff1a; python3 get-pip.py

POJ 3233 Matrix Power Series 动态规划(矩阵的幂)

一、题目大意 给出一个矩阵A&#xff0c; 输出矩阵B的每一项对M取余数的值。 二、解题思路 以二维矩阵为例&#xff0c;首先计算K2的情况&#xff0c;我们设结果矩阵为B 有如下表达式 那么不难看出&#xff0c;需要的矩阵其实就是以下的两个矩阵相乘后的左上角的N*N个 然后…

Linux中的UDEV机制与守护进程

Linux中的UDEV守护进程 udev简介守护进程守护进程概念守护进程程序设计守护进程的应用守护进程和后台进程的区别 UDEV的配置文件自动挂载U盘 udev简介 udev是一个设备管理工具&#xff0c;udev以守护进程的形式运行&#xff0c;通过侦听内核发出来的uevent来管理/dev目录下的设…

3.4 路由器的DHCP配置

实验3.4 路由器的DHCP配置 一、任务描述二、任务分析三、具体要求四、实验拓扑五、任务实施&#xff08;一&#xff09;配置基于接口地址池的DHCP1.交换机的基本配置2.路由器的基本配置3.开启路由器的DHCP服务器功能4.配置路由器接口的DHCP功能5.设置计算机使用DHCP方式获取IP地…

前端又出新轮子Nue.js,但还是低代码更香!

前言 别TM卷了&#xff01;&#xff01;&#xff01; 自从前后端分离以来&#xff0c;前端前端的车轮滚滚向前&#xff0c;轮子造的越来越圆。每个人都在适应这个轮子的节奏&#xff0c;稍微不注意就会被甩出车轮之外。 调侃归调侃&#xff0c;既然口子已经开了&#xff0c;…

Java操作Excel之 POI介绍和入门

POI是Apache 提供的一个开源的Java API&#xff0c;用于操作Microsoft文档格式&#xff0c;如Excel、Word和PowerPoint等。POI是Java中处理Microsoft文档最受欢迎的库。 截至2023/12&#xff0c; 最新版本时 POI 5.2.5。 JDK版本兼容 POI版本JDK版本4.0及之上版本> 1.83.…

游戏测试 vs 软件测试:你知道它们的真正区别吗?

游戏测试和软件测试有什么区别&#xff1f;10大测试点对比&#xff01; 针对手游而言&#xff0c;游戏测试的本质是APP&#xff0c;所以不少手游的测试方式与APP测试异曲同工&#xff0c;然而也有所不同。APP更多的是具有一种工具&#xff0c;一款APP好不好用不重要&#xff0…

【译】DispatcherServlet

1.1. DispatcherServlet 见 Reactive 技术栈中的等效内容 Spring MVC和其他许多Web框架一样&#xff0c;是围绕前端控制器模式设计的&#xff0c;其中一个中央 Servlet&#xff0c;即 DispatcherServlet&#xff0c;为请求处理提供了一个共享算法&#xff0c;而实际工作则由可…

Unity 网格布局控件-Grid Layout Group

Unity 网格布局控件-Grid Layout Group是Unity中的UGUI控件&#xff0c;用于在 UI 中创建网格布局&#xff0c; 它的作用是&#xff1a;自动将子对象排列成网格&#xff0c;即我们可以通过该组件对子对象按行和列的形式排列&#xff0c;根据指定的约束条件自动调整它们的大小和…