pandas汇总和描述性统计

news2025/1/18 7:25:45

本文介绍pandas中汇总和描述性统计中的基本内容,仅供参考。

目录

1描述和汇总统计

1.1sum方法

1.2idxmin和idxmax方法

1.3describe方法

1.4描述和汇总统计的常用方法

2相关系数和协方差

3唯一值、值计数以及成员资格

3.1唯一值

3.2值计数

3.3成员资格

1描述和汇总统计

1.1sum方法

用DataFrame的sum方法将会返回一个含有列小计的Series:

  • NA值会自动被排除,除非整个切片(这里指的是行或列)都是N

函数格式:

df.sum( axis=None, skipna=None, level=None, numeric_only=None, min_count=0, **kwargs, )

参数说明:

axis:约简的轴。DataFrame的行用0,列用1

skipna:排除缺失值,默认值为True

level:如果轴是层次化索引的(即Multiindex),则根据level分组约简

案例:

from pandas import Series, DataFrame 
import pandas as pd
import numpy as np


df = DataFrame([[1.4, np.nan], [7.1, -4.5],
    [np.nan, np.nan], [0.75,-1.3]],
    index=['a','b','c','d'],
    columns=[ 'one', 'two'])


df.sum()


#传入axis=1将会按行进行求和运算:
df.sum(axis=1)


df.mean(axis=1, skipna=False)

 

1.2idxmin和idxmax方法

idxmin和idxmax返回的是间接统计(达到最小值或最大值的索引)

案例:

df.idxmax()


df.cumsum()    # 累计型的计算

 

1.3describe方法

用于一次性产生多个汇总统计

案例:

df1 = pd.DataFrame({'key':list('abcdfeg'),
'data1':range(7)})


df1['data1'].describe()

对于非数值型数据,describe会产生另外一种汇总统计

案例:

obj = Series(['a','a','b','c'] * 4)


obj.describe()


obj.describe()['count']

 

1.4描述和汇总统计的常用方法

2相关系数和协方差

Series的corr方法用于计算两个Series中重叠的、非NA的、按索引对齐的值的相关系数

 

 与此类似,cov用于计算协方差。

DataFrame的corr和cov方法将以DataFrame的形式返回完整的相关系数或协方差矩阵:

利用DataFrame的corrwith方法,可以计算其列或行跟另一个Series或DataFrame之间的相关系数。传入一个Series将会返回一个相关系数值Series (针对各列进行计算):

3唯一值、值计数以及成员资格

3.1唯一值

函数是unique,它可以得到Series中的唯一值数组:

 返回的唯一值是未排序的,如果需要的话,可以对结果再次进行排序

3.2值计数

value_counts用于计算一个Series中各值出现的频率:

结果Series是按值频率降序排列的(值作为行索引)。

value_counts还是一个顶级pandas方法,可用于任何数组或序列:

 

3.3成员资格

isin,它用于判断矢量化集合的成员资格,可用于选取 Series中或DataFrame列中数据的子集:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/435173.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【区块链】走进web3的世界-获取Token价格

1、通过预言机获取Token价格(需要部署合约) 在以太坊区块链上,由于智能合约本身无法获取外部数据,因此需要使用预言机 (Oracle) 来获取外部数据。 以下是一个获取代币价格的示例: 选择预言机:首先需要选…

ThreadLocal小记

1、ThreadLocal介绍 1.1、官方介绍 /*** This class provides thread-local variables. These variables differ from* their normal counterparts in that each thread that accesses one (via its* {code get} or {code set} method) has its own, independently initiali…

PPOCR - 命令行训练模型基本流程和常用命令+visualdl可视化

前言 本文记录实践中用paddleocr训练自己的模型的基本步骤和常用命令,以detection为例 更详细内容请参考官方文档https://github.com/PaddlePaddle/PaddleOCR/tree/release/2.6/doc/doc_ch 〇、环境准备 0.1 paddlepaddle环境安装 paddle环境安装链接 根据自己的…

H.264 编码中, I 帧、B 帧、P 帧、IDR 帧的区别

在H.264协议里定义了三种帧,完整编码的帧叫 I 帧,参考之前的 I 帧生成的只包含差异部分编码的帧叫 P 帧,还有一种参考前后的帧编码的帧叫 B 帧。 H.264采用的核心算法是帧内压缩和帧间压缩,帧内压缩是生成 I 帧的算法&#xff0c…

【镜像取证篇】DD和E01镜像格式区别(简)

【镜像取证篇】DD和E01镜像格式区别(简) ​ 简单总结下—【蘇小沐】 文章目录 【镜像取证篇】DD和E01镜像格式区别(简)1、实验环境 (一)DD镜像-原始镜像(和源盘大小一致)&#xff0…

C#基础学习--事件

目录 发布者和订阅者 源代码组件概览 声明事件 事件是成员 订阅事件 触发事件 标准事件的用法 通过扩展EventArgs来传递数据 泛型委托 移除事件处理程序 - 事件访问器 发布者和订阅者 发布者/订阅者模式中,发布者类 定义了一系列程序的其他部分可能感兴趣的事件…

第12讲:ElementUI+Vue路由综合案例

本博文主要呈现一个NPM脚手架Vue路由ElementUI的综合案例,完成本案例需要有一定的Vue基础,请参考以下文章完成项目的构建 第08讲:使用脚手架创建vue项目 第09讲:路由开发 第10讲:vue脚手架集成axios 第11讲&#xff1a…

2023年mahorcupC题电商物流网络包裹应急调运与结构思路分析

C 题 电商物流网络包裹应急调运与结构优化问题 电商物流网络由物流场地(接货仓、分拣中心、营业部等)和物流场 地之间的运输线路组成, 如图 1 所示。受节假日和“双十一” 、“618”等促销 活动的影响,电商用户的下单量会发生显著波动,而疫情…

软件测试真的只能干到35岁吗?难道测试岗位真的只是青春饭吗?

一:前言:人生的十字路口静坐反思 入软件测试这一行至今已经10年多,承蒙领导们的照顾与重用,同事的支持与信任,我的职业发展算是相对较好,从入行到各类测试技术岗位,再到测试总监,再…

释放数据价值这道难题,数据科学基础平台有解

去年底,《中共中央、国务院关于构建数据基础制度更好发挥数据要素作用的意见》(以下简称:" 数据二十条 ")正式颁布,标志着数据基础制度的建设步入快车道,数据要素化有望全面提速。 " 数据二…

通过遍历结果构造二叉树

⭐️前言⭐️ 本篇文章主要总结通过前序遍历、中序遍历、后序遍历中的两个遍历结果,来构造二叉树的过程,通过本篇文章的总结,可以解决一下问题。 LeetCode难度654. 最大二叉树🟠105. 从前序与中序遍历序列构造二叉树&#x1f7e…

编程辅助插件BitoAI使用指南(以VSCode开发环境为例安装并使用BitoAI插件从而提高生产效率)

2023年是AI爆发元年,已经被各种AI工具、新闻轰炸了几个月,只有一种感觉:时间不够用! 本文介绍编程辅助神器:Bito AI。 本插件使用与ChatGPT相同的模型!目前免费,且拥有强大的辅助能力&#xff0…

高压放大器应用之无损检测

在高压放大器的应用中,很多电子工程师经常会进行无损检测实验,那么无损检测是什么,无损检测的知识又有哪些呢,就让安泰电子带大家来看看。 无损检测是什么: 无损检测是指不损害物品的情况下对产品进行检测的方法&#…

FFMPEG源码分析一 av_register_all()

我们在使用FFMPEG库时,第一个调用的就是av_register_all(),这个函数到底做了什么,有什么用,这里做个简单分析。 本文基于雷霄骅博客学习而来。详情请移步FFmpeg源代码结构图 - 编码_ffmpeg源码结构_雷霄骅的博客-CSDN博客 解析和…

Vsync信号和SurfaceFlinger刷新机制;打造智能车厢的关键技术

概述 车载智能座舱系统在现代汽车中已经越来越常见,它可以提供各种功能,例如音乐、导航和驾驶辅助等。要实现这些功能,需要底层硬件和系统软件的支持。其中,Vsync信号和SurfaceFlinger刷新机制是车载智能座舱系统中的两个关键技术…

无人驾驶——ros_canopen安装

上篇文章提到过,对于CAN测试,不能完全依靠CAN卡对应的软件,指导老师推荐了ros_canopen、socketcan_interface方法。记录一下使用该方法的过程。 安装ros_canopen,对应ros版本git clone下载资源并安装。 https://github.com/ros-industrial…

camunda如何启动一个流程

在 Camunda 中启动一个流程需要使用 Camunda 提供的 API 或者用户界面进行操作。以下是两种常用的启动流程的方式: 1、通过 Camunda 任务列表启动流程:在 Camunda 任务列表中,可以看到已经部署的流程,并可以点击“Start”按钮&am…

【Linux】Mysql事务

一、什么是事务 Mysql 数据库中不是所有的存储引擎都实现了事务处理。 支持事务的存储引擎有: InnoDBNDB Cluster 。不支持事务的存储引擎代表有: MyISAM 事务简单来说:一个 Session 中所进行所有的操作,要么同时成功&#xff0c…

CMU15445 - Project 0. C++ Primer(在写)

文章目录 系列笔记作业链接TASK 1GetPutRemove Task 2 系列笔记 环境配置 Project 0. C Primer (ing) 作业链接 作业链接(2020,废) 作业链接 p0就是一个C水平测试,很简单 2023的明显难不少。 TASK 1 先简单说一下看到这个数据…

linux 目录常用操作

1.linux复制粘贴命令 CtrlShiftC 复制 CtrlShiftV 粘贴 2.中断执行 CtrlC 键“保留”用于停止命令 3.终端清屏 clear 4.显示当前路径 pwd 5.进入目录 cd 目录名称 返回上级目录 cd .. 6.查看当前目录 ls查看详细信息 ls -l 7.创建目录(可以理解为文件夹&…