介绍一个助你事半功倍的数据挖掘神器!!

news2024/12/24 12:49:32

Pandas模块当中,对于表格数据的分组操作(groupby)和透视表(pivot_table)的制作一直都是比较常见的,今天小编为大家分享一个数据分析的利器,能够自动为我们完成上述提到的一系列操作,并且带有GUI界面,所以使用起来非常的方便。

PivotTableJS

看名字我们就能知道,该模块是专门用来生成透视表(pivot_table),而且是用JavaScript代码来构建的,由于其有GUI界面,所以我们在进行数据分析与可视化操作的时候并不需要写多少代码。

当然我们先用pip命令来安装该模块,代码如下

pip install PivotTableJS

加载数据集

那么首先,我们先来加载数据集,这里导入Pandas模块

import pandas as pd
df = pd.read_csv("employee_dataset.csv")

df.head()

output

c8037ca2bbd1d6fe9c9a2f9004c82791.png

牛刀小试

这里我们尝试来调用pivottablejs模块当中的pivot_ui方法,只需两行代码

from pivottablejs import pivot_ui

pivot_ui(df)

output

f871c5eeb445834dbbdea89462c0d2ca.png

这里可能需要等待1-2分钟左右的时间来供其加载,随后我们就能看到如上图所示的窗口,窗口中包括了表格当中的每一列的字段、可视化图表的各种形式等等

d90f7bfbd07cc74eda173aeae3b0d8f8.png

同时我们也可以拖拽指定的列到空白的窗口中,对其进行分组统计以及透视表的制作,如下图所示

d674661be935c29537da377854103a15.gif

而要是我们想要进行可视化操作,只需要在下拉框中选中,例如我们想要绘制的是直方图,

9861fa7cd410e85d01d69ea69d9822f6.gif

分组统计

接下来我们进行分组(groupby)操作,例如我们想要查看一下员工状态(Employee_Status)的分组统计,只需要将该列拖拽至空白的区域即可

b9d94baa45564aa54cdc0548a68a7393.png

我们可以看到员工分为是全职员工以及实习生,分别是有791位和209位,当然除了计数(count)之外,我们还能够计算平均值、中位数、最大/最小值等一系列统计方法,例如我们想要计算一下全职员工和实习生的平均工资,就可以这么来操作

8a5d4a41d4990d2a608ba8fd03687746.gif

我们还可以更进一步,将上面的结果进行可视化展示,如下所示

2faa3f3871ef9268f9f2d1a1b7d8070d.gif

透视表

对于透视表而言,pivottablejs模块实现起来也格外的简单,我们只需要在上述操作的基础之上,将列拖拽到右边空白的长方形区域当中,例如我们想要看一下分布在不同城市当中不同职位员工的分布,就可以这么来做

8832dd21f752e85fbba79a8c56d7ebfa.gif

当然该模块给我们带来的便利和自身所具备的功能远不止此,大家可以安装一下该模块,然后在空余的时间中自行探索。

当然我们看来该模块还存在着一个小小的bug,大家可以尝试用其他版本来试一下,小编在这里用的是0.9.0

NO.1

往期推荐

Historical articles

12000字!实战案例!Python+SQL京东用户行为分析

案例实操 | 利用Lambda函数来进行特征工程,超方便的!!

Python数据清洗 & 预处理入门完整指南

案例实操|手把手教你搭建 RFM 客户价值分析模型

分享、收藏、点赞、在看安排一下?

d9885d04bf96118778edf442bfcabda8.gif

a851be92914aa9a8fac0d55909def37c.gif

c73c5529338e871dca6ed0cfa397332a.gif

73f005adc5dd66ee3704949d998bbbc0.gif

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/102598.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

arcgis读取NetCDF格式的数据(c#读取数据)

项目里面要用到降雨的数据,正好是.NC格式的,以前也没用过,正好记录下,大家也可以参考下,首先是arcgis是如何处理NC数据的,在arcgis软件里面有个多维工具箱,我用的是汉化版本的,英文版…

[附源码]计算机毕业设计Python的剧本杀管理系统(程序+源码+LW文档)

该项目含有源码、文档、程序、数据库、配套开发软件、软件安装教程 项目运行 环境配置: Pychram社区版 python3.7.7 Mysql5.7 HBuilderXlist pipNavicat11Djangonodejs。 项目技术: django python Vue 等等组成,B/S模式 pychram管理等…

Verilog 简易单周期CPU

目录 本实验包含: 简易结构图: 各部件代码或实现: 控制器: 寄存器堆: ALU: 数据存储器: 指令存储器: CPU: tp(仿真文件): 仿真…

如何去掉idea的诸多警告

File->setting->Editor->inspections 选择漏斗,选中warning,筛选出所有警告级别,然后去掉勾选,然后重启idea即可

重构物理Entity架构,支持更多的形状

上一节实战如何编译BEPUphysicsint源码到自己的项目, 如何整合物理引擎与Unity图形渲染。本节来从新调整设计,让物理的Entity基本操作与物理的形状分离,支持更多的物理形状,支持物理entity与Unity物体位移与旋转同步。主要分成以下3个部分: 1: 设计PhyBaseEntity,让…

学到一招!PyCharm连接MySQL竟如此简单!

在 PyCharm 中是可以通过内置的工具来连接、操作数据库的,并且对于市面上大多数主流数据库都是支持的。 连接 MySQL 首先打开 PyCharm ,点击菜单栏的 View --> Tool Windows --> Database 或者直接点击 PyCharm 右侧的 Database 然后就会在 PyCh…

【QT开发笔记-基础篇】| 第五章 绘图QPainter | 5.6 矩形、圆角矩形

本节对应的视频讲解:B_站_视_频 https://www.bilibili.com/video/BV1mg411J7u5 本节讲解如何绘制矩形、圆角矩形 1. 相关的 API 直接查看官方的帮助文档,可以看到有多个重载的方法用于绘制矩形、圆角矩形 1.1 矩形 // 带 F 表示参数为浮点数&#x…

【电商】电商系统---合同管理

说一下合同管理部分,希望对大家有帮助,如果大家觉得简单可以直接略过,谢谢! 合同分类 合同主要分为采购类合同、销售类合同、其他合同。 采购合同和销售合同分别与采购订单和销售订单建立对应关系,通过采购订单和销售…

ChatGDP:人类未来世界的主宰

先简单介绍一下今天的主角——ChatGPT。 ChatGPT是一款由OpenAI开发的聊天机器人,它具有出色的自然语言处理能力,能够与人类进行真实的对话。它的核心技术是GPT-3语言模型,能够自动学习语言特征,并进行语义理解、文本生成等任务。…

HCL与Pipe、Autoit和MobaXterm的组合使用

我们平时做实验一般会用到真机或者是模拟器,因为我主要接触的都是一些H3C的产品和技术,所以模拟器用HCL会多一些。为了呈现出相对好一些的视觉效果,我一般会使用MobaXterm工具进行命令操作,所以大家看到的回显一般是这样的&#x…

哈工大视听觉信号处理——听觉部分报告——一种智能家居命令词识别系统的设计

题 目 听觉部分 专 业 软件工程 学   号 120L0219XX 班   级 2037101 姓 名 李启明 报 告 日 期 2022.12.20 一、基频 (一&#xff…

肝了一周总结的SpringBoot常用注解大全,一目了然~

平时使用SpringBoot开发项目,少不了要使用到它的注解。这些注解让我们摆脱了繁琐的传统Spring XML配置,让我们开发项目更加高效,今天我们就来聊聊SpringBoot中常用的注解! SpringBoot实战电商项目mall(50kstar&#xf…

《c专家编程》读书笔记

《c专家编程》第一章 C:穿越时空的迷雾第二章 这不是Bug,而是语言特性gets实验第三章 分析C语言的声明const实验第四章 令人震惊的事实:数组和指针并不相同指针与数组实验第五章 对链接的思考简单静态库动态库实验第六章 运动的诗章&#xff…

python-(6-5-3)爬虫---修改代码

文章目录一 事件背景二 系统给的代码三 改进措施四 改进后的代码一 事件背景 本篇主要是生活分享。 公司研究了一个比较好玩的人工智能狗,我就想偷懒让它帮我写个代码,得到的漂亮小姐姐的照片,然后它还真的给我把代码弄出来了。 二 系统给的…

​九州一轨通过注册:计划募资6.57亿 京投公司为大股东

雷递网 雷建平 12月19日北京九州一轨环境科技股份有限公司(简称:“九州一轨”)日前通过注册,准备在科创板上市。九州一轨计划募资6.57亿元,其中,2.79亿元用于噪声与振动综合控制产研基地建设项目,1.43亿元用…

[附源码]计算机毕业设计Python飞越青少儿兴趣培训机构管理系统(程序+源码+LW文档)

该项目含有源码、文档、程序、数据库、配套开发软件、软件安装教程 项目运行 环境配置: Pychram社区版 python3.7.7 Mysql5.7 HBuilderXlist pipNavicat11Djangonodejs。 项目技术: django python Vue 等等组成,B/S模式 pychram管理等等…

我的一周年创作纪念日

机缘 第一次写文章的时候,CSDN还是我平时课程设计的救星;第一次写文章的时候,还不知道有什么拿得出手、可以和大家分享的;第一次写文章的时候,幻想着自己一觉醒来就坐拥10w粉丝,哈哈哈。感谢自己曾经冒出的…

【实践】推荐、搜索、广告多业务多场景统一预估引擎实践与思考

省时查报告-专业、及时、全面的行研报告库省时查方案-专业、及时、全面的营销策划方案库【免费下载】2022年11月份热门报告盘点《底层逻辑》高清配图‍基于深度学习的个性化推荐系统实时化改造与升级.pdf推荐技术在vivo互联网商业化业务中的实践.pdf推荐系统基本问题及系统优化…

元认知神经网络与在线序贯学习(Matlab代码实现)

目录 💥1 概述 📚2 运行结果 🎉3 参考文献 👨‍💻4 Matlab代码 💥1 概述 文章包含用于实现自适应识别和控制的在线顺序学习算法、元认知神经网络和前馈神经网络的代码。这些方法也用于解决分类和时间序…

[附源码]计算机毕业设计Node.js仓库管理系统(程序+LW)

项目运行 环境配置: Node.js最新版 Vscode Mysql5.7 HBuilderXNavicat11Vue。 项目技术: Express框架 Node.js Vue 等等组成,B/S模式 Vscode管理前后端分离等等。 环境需要 1.运行环境:最好是Nodejs最新版,我…