在Pandas
模块当中,对于表格数据的分组操作(groupby
)和透视表(pivot_table
)的制作一直都是比较常见的,今天小编为大家分享一个数据分析的利器,能够自动为我们完成上述提到的一系列操作,并且带有GUI
界面,所以使用起来非常的方便。
PivotTableJS
看名字我们就能知道,该模块是专门用来生成透视表(pivot_table
),而且是用JavaScript
代码来构建的,由于其有GUI
界面,所以我们在进行数据分析与可视化操作的时候并不需要写多少代码。
当然我们先用pip
命令来安装该模块,代码如下
pip install PivotTableJS
加载数据集
那么首先,我们先来加载数据集,这里导入Pandas
模块
import pandas as pd
df = pd.read_csv("employee_dataset.csv")
df.head()
output
牛刀小试
这里我们尝试来调用pivottablejs
模块当中的pivot_ui
方法,只需两行代码
from pivottablejs import pivot_ui
pivot_ui(df)
output
这里可能需要等待1-2分钟左右的时间来供其加载,随后我们就能看到如上图所示的窗口,窗口中包括了表格当中的每一列的字段、可视化图表的各种形式等等
同时我们也可以拖拽指定的列到空白的窗口中,对其进行分组统计以及透视表的制作,如下图所示
而要是我们想要进行可视化操作,只需要在下拉框中选中,例如我们想要绘制的是直方图,
分组统计
接下来我们进行分组(groupby
)操作,例如我们想要查看一下员工状态(Employee_Status)的分组统计,只需要将该列拖拽至空白的区域即可
我们可以看到员工分为是全职员工以及实习生,分别是有791位和209位,当然除了计数(count
)之外,我们还能够计算平均值、中位数、最大/最小值等一系列统计方法,例如我们想要计算一下全职员工和实习生的平均工资,就可以这么来操作
我们还可以更进一步,将上面的结果进行可视化展示,如下所示
透视表
对于透视表而言,pivottablejs
模块实现起来也格外的简单,我们只需要在上述操作的基础之上,将列拖拽到右边空白的长方形区域当中,例如我们想要看一下分布在不同城市当中不同职位员工的分布,就可以这么来做
当然该模块给我们带来的便利和自身所具备的功能远不止此,大家可以安装一下该模块,然后在空余的时间中自行探索。
当然我们看来该模块还存在着一个小小的bug,大家可以尝试用其他版本来试一下,小编在这里用的是0.9.0
NO.1
往期推荐
Historical articles
12000字!实战案例!Python+SQL京东用户行为分析
案例实操 | 利用Lambda函数来进行特征工程,超方便的!!
Python数据清洗 & 预处理入门完整指南
案例实操|手把手教你搭建 RFM 客户价值分析模型
分享、收藏、点赞、在看安排一下?