Python中groupby函数详解（非常容易懂）

news2026/2/12 15:18:42

目录：Python中的groupby函数

一、groupby 能做什么？
二、单类分组
- 2.1 创建数据集
三、多类分组

一、groupby 能做什么？

groupby函数主要的作用是进行数据的分组以及分组后地组内运算！

于数据的分组和分组运算主要是指groupby函数的应用，具体函数的规则如下：

df[](指输出数据的结果属性名称).groupby([df[属性],df[属性])(指分类的属性，数据的限定定语，可以有多个).mean()(对于数据的计算方式——函数名称)

举例如下：

print(df["评分"].groupby([df["地区"],df["类型"]]).mean())

上面语句的功能是输出表格所有数据中不同地区不同类型的评分数据平均值。

二、单类分组

2.1 创建数据集

lst1 = [['小红', '女', 1, 160], ['大红', '女', 2, 161], ['小明', '男', 1, 180], ['大明', '男', 1, 180], ['小亮', '男', 2, 170]]
lst2 = [['姓名', '性别', '班级', '身高']]
data = pd.DataFrame(lst1, columns = lst2)
data

在这里插入图片描述

data.groupby("性别")

结果为：

<pandas.core.groupby.generic.DataFrameGroupBy object at 0x0000018CD0F0AB90>

首先，我们有一个变量data，数据类型是DataFrame

想要按照【性别】进行分组

得到的结果是一个groupby对象，还没有进行任何的运算。

我们可以描述组内数据的基本统计量：

data.groupby('性别').describe()

在这里插入图片描述

只有数字类型的列数据才会计算统计；

示例里面数字类型的数据有两列【班级】和【身高】；

但是，我们并不需要统计班级的均值等信息，只需要【身高】，所以做一下小的改动：

data.groupby('性别')['身高'].describe()

在这里插入图片描述

三、多类分组

data.groupby(['班级', '性别'])

在这里插入图片描述

data.groupby(['班级', '性别']).mean()

在这里插入图片描述
单独用groupby，我们得到的还是一个 Groupby对象。

我们还可以一次运用多个函数计算:

import numpy as np
data.groupby( ["班级","性别"]).agg([np.sum, np.mean, np.std])

在这里插入图片描述

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/101919.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

Python中groupby函数详解（非常容易懂）

目录：Python中的groupby函数

一、groupby 能做什么？

二、单类分组

2.1 创建数据集

三、多类分组

相关文章

网络安全等级保护十问十答

[附源码]计算机毕业设计Node.js宠物商店网站（程序+LW）

Opencv(C++)笔记--Sobel算子

jsp+ssm计算机毕业设计高校班主任班级管理系统【附源码】

跨模态检索的简单实现（pytorch）

SCN时间序列预测模型详解（Matlab代码实现）

数据结构链式栈

JdbcTemplate

100份PDF合并还不到3分钟，这2个方法非常简单，请低调使用

Feign的另一种玩法-动态Feign

[附源码]计算机毕业设计Node.js畅玩电竞网咖购物点餐网站（程序+LW）

R语言线性混合效应模型实战案例

web大学生网页作业成品蛋糕店美食餐饮网站设计与实现(HTML+CSS+JavaScript)

代码随想录训练营第54天|LeetCode 392.判断子序列、115.不同的子序列

内点法求最优潮流和微电网调度（风、光、蓄电池、燃油机）（Matlab实现）

JSON的定义、基本使用、以及和对象之间的相互转换

【算法】可解释机器学习-CAM / Grad_CAM(Datawhale)

jsp+ssm计算机毕业设计高铁售票管理系统【附源码】

stack和queue

设计模式之命令模式