数据分析案例-某公司员工数据信息可视化(文末送书)

news2024/9/20 18:40:13

 

🤵‍♂️ 个人主页:@艾派森的个人主页

✍🏻作者简介:Python学习者
🐋 希望大家多多支持,我们一起进步!😄
如果文章对你有帮助的话,
欢迎评论 💬点赞👍🏻 收藏 📂加关注+


目录

1.项目背景

2.数据集介绍

3.技术工具

4.导入数据

5.数据可视化

6.总结

文末推荐与福利


1.项目背景

        在当今数字化时代,企业数据的收集和分析已经成为企业成功的关键因素之一。员工数据作为企业数据的重要组成部分,对于企业的人力资源管理、战略决策等方面都具有重要的意义。然而,如何有效地整合、分析和利用员工数据,一直是企业面临的挑战。

        员工数据包含了员工的基本信息、工作表现、职业发展等方面,这些数据可以揭示员工的特点、行为和趋势。通过对员工数据的分析和挖掘,企业可以更好地了解员工的需求和期望,优化招聘和培训计划,提高员工的工作满意度和忠诚度。此外,员工数据还可以帮助企业识别潜在的劳动力风险和机会,为企业的战略发展提供数据支持。

        然而,目前很多企业对于员工数据的利用还停留在传统的表格和报表形式,无法直观地呈现数据的特点和趋势。同时,由于数据来源的多样性,数据的准确性和完整性也难以保证。因此,需要一种更加有效的方法来整合、分析和利用员工数据。

        数据可视化是一种将数据以图形、图像等形式呈现出来的方法,可以直观地展示数据的特点和趋势。通过数据可视化,企业可以更加清晰地了解员工情况,为人力资源决策提供有力的支持。同时,数据可视化还可以提高数据的透明度和可信度,加强管理层与员工之间的沟通和信任。

        因此,本次实验旨在通过可视化工具和技术,分析和呈现公司员工数据信息。这种数据可视化对于公司管理和决策制定非常重要,可以帮助领导层更好地了解员工情况,优化流程,提高效率,和制定人力资源策略。

2.数据集介绍

        该数据集来源于Kaggle,原始数据集中共有4653条,9个特征变量,各变量解释含义如下:

Education: 员工的教育资格,包括学位、机构和研究领域。

Joining Year: 每位员工加入公司的年份,表明他们的服务年限。

City: 每个员工所在或工作的地点或城市。

Payment Tier: 将员工分为不同的薪资等级。

Age: 每个员工的年龄,提供人口统计洞察。

Gender: 员工的性别认同,促进多样性分析。

Ever Benched: 表示员工是否曾经暂时没有分配过工作。

Experience in Current Domain: 员工在当前领域的经验年数。

Leave or Not: 目标栏。

3.技术工具

Python版本:3.9

代码编辑器:jupyter notebook

4.导入数据

首先导入数据可视化的第三方库,并加载数据集

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import plotly.express as px
import warnings
warnings.filterwarnings('ignore')

df = pd.read_csv("Employee.csv")
df.head()

查看数据大小

 查看数据基本信息

查看数据描述性统计

删除缺失值和重复值

5.数据可视化

# 员工教育分析
plt.figure(figsize=(10, 6))
sns.countplot(data=df, x='Education', palette='Set2')
plt.title('Education of Employees')
plt.show()

1971名员工拥有学士学位,说明大多数员工拥有学士学位。拥有硕士学位的员工637人,156名拥有博士学位的员工。

# 入职年限分布
sns.histplot(data=df, x='JoiningYear', bins=20, kde=True, color='skyblue')
plt.title('Distribution of Joining Years')
plt.show()

2017年是加入该公司的员工人数最多的一年,有662名新员工。紧随其后的是,2015年,有464名新员工加入公司。2013年,共有396名员工加入公司。新员工人数最少的一年是2018年,只有239名员工加入该公司。

# 员工城市分布
city_cnts = df['City'].value_counts()
px.pie(city_cnts, names=city_cnts.index, values=city_cnts.values, 
       title='Employees Distribution by City', color_discrete_sequence=px.colors.sequential.Sunset, 
       hole = 0.5)

大多数员工(42.4%)来自班加罗尔,其次是29%来自浦那,28.7%来自新德里

# 员工年龄分布
plt.figure(figsize=(10, 6))
sns.histplot(data=df, x='Age', bins=20, kde=True, color='coral')
plt.title('Employee Ages Distribution')
plt.show()

数据集中员工的最低年龄为22岁。25%的员工年龄在27岁以下或等于27岁。50%的员工年龄在30岁以下或等于30岁。75%的员工年龄在35岁以下或等于35岁。数据集中记录的员工最大年龄为41岁。

# 性别分布
sns.countplot(data=df, x='Gender', palette='muted')
plt.title('Gender Distribution')
plt.show()

组织中男性员工比女性员工多。

# 当前领域的经验分布
plt.figure(figsize=(10, 6))
sns.histplot(data=df, x='ExperienceInCurrentDomain', bins=20, kde=True, color='limegreen')
plt.title('Distribution of Experience in Current Domain')
plt.show()

大多数员工有2年工作经验(681名员工),其次是5年工作经验(470名员工)。随着工作年限的增加,员工人数逐渐减少。只有少数员工在当前领域拥有6年(8名员工)或7年(9名员工)的经验。

# 员工休假或未休假人数
sns.countplot(data=df, x='LeaveOrNot', palette='dark')
plt.title('Count of Employees Leave or Not')
plt.show()

大多数员工都没有休假。

# 支付等级分布
paymentTier_cnts = df['PaymentTier'].value_counts()
px.pie(city_cnts, names=paymentTier_cnts.index, values=paymentTier_cnts.values,
        title='Payment Tier Distribution', color_discrete_sequence=px.colors.sequential.Jet, 
        hole = 0.5)

大多数员工(71.5%)处于第三支付层。20.6%的员工处于第二支付层,只有7.89%的员工处于第一支付层。

# 按性别划分的年龄分布
px.box(df, x='Gender', y='Age', color='Gender', title='Age Distribution by Gender' , 
       color_discrete_sequence=px.colors.sequential.deep_r)

大多数男女员工的年龄在27到35岁之间。

# 按支付级别划分的当前领域经验
px.violin(df, x='PaymentTier', y='ExperienceInCurrentDomain', 
                title='Experience in Current Domain by Payment Tier', color = 'PaymentTier', 
                color_discrete_sequence=px.colors.sequential.RdBu_r )

第一个支付级别的大多数员工的工作经验在1年到4年之间。第二支付等级的大多数员工的工作经验在2年到4年之间。大多数第三支付等级的员工的工作经验在1年到4年之间。

# 城市性别分布
plt.figure(figsize=(12, 6))
sns.countplot(data=df, x='City', hue='Gender', palette='Set3')
plt.title('Gender Distribution by City')
plt.show()

班加罗尔和浦那的男性雇员更多。新德里有更多的女性雇员。

# 按性别划分的付款等级和年龄
px.box(df, x='PaymentTier', y='Age', color='Gender', title='Box Plot: Payment Tier and Age by Gender' , 
       color_discrete_sequence=px.colors.sequential.RdBu)

在第一支付层,大多数男性员工的年龄在26 - 35岁之间,大多数女性员工的年龄在26 - 32岁之间。在第二支付层,大多数男性员工的年龄在26 - 34岁之间,大多数女性员工的年龄在27 - 35岁之间。在第三支付层,大多数男性员工的年龄在28 - 35岁之间,大多数女性员工的年龄在27 - 35岁之间。

6.总结

通过上面的可视化分析,我们得出了以下结论:

  • 大多数员工拥有学士学位。
  • 2017年和2015年是新员工数量最多的一年。
  • 班加罗尔的员工集中度最高,其次是浦那和新德里。
  • 员工的年龄范围相对较窄,大多数在27至35岁之间。
  • 男性员工比女性员工多。
  • 87%的部署率是积极的,但应该采取相应的策略来减少不部署。
  • 大多数员工都有2年的工作经验。
  • 员工的稳定性很明显,大多数人都没有休假
  • 大多数员工都在第三支付层。
  • 班加罗尔和浦那的男性员工更多,而新德里的女性员工更多。
  • 拥有硕士和博士学位的员工的存在表明了教育的多样性。

通过本次实验,公司管理层获得了更清晰的员工数据信息,可以更好地制定战略决策,提高公司的绩效和竞争力。数据可视化是一个强大的工具,可以帮助公司更好地了解自身情况,优化资源分配,提高效率。

文末推荐与福利

《小团队管理:如何轻松带出1+1大于2的团队》免费包邮送出3本!

内容简介:   

        《小团队管理:如何轻松带出1 1>2的团队》从小团队管理的基本特征开始介绍,围绕小团队管理者在工作中实际遇到的管理事件,针对形形色色的小团队管理问题,逐条展开方法论述和实操讲解,旨在帮助读者轻松应对管理难题。
        本书分为3篇,共12章。第1篇为基础篇,主要概述小团队管理的基本内容;第2篇为新手篇,主要讲解小团队管理的基础知识和实操案例,内容包括小团队的认知管理、目标管理、分工管理、沟通管理、绩效管理、阶梯管理、新人管理、离职管理、文化管理等;第3篇为进阶篇,主要针对空降管理者和创业管理者所面临的挑战,提出可落地执行的实用建议。 

编辑推荐:

更懂人、会用人、能管人、高效激励人、擅长培养人,实现从自己强到团队强的完美转型!
①全面:认知 目标 分工 沟通 绩效 阶梯 新人 离职 文化
②易懂:50 个核心公式,用简单的方式解释复杂的管理知识
③实用:50 个实用图表,随学随用,可直接落地
④案例:50 个场景案例详解,大幅提升管理能力

  • 抽奖方式:评论区随机抽取3位小伙伴免费送出!
  • 参与方式:关注博主、点赞、收藏、评论区评论“人生苦短,拒绝内卷!”(切记要点赞+收藏,否则抽奖无效,每个人最多评论三次!
  • 活动截止时间:2023-10-29 20:00:00
  • 当当网购买链接:http://product.dangdang.com/29511382.html
  • 京东购买链接:https://item.jd.com/13628437.html

 名单公布时间:2023-10-29 21:00:00 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1135693.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

打印机连接网络后怎么安装驱动?

打印机在我们办公和生活中算是比较常见的设备,特别是在上班时需要时常打印各种文件,但是有时电脑上的打印机也会有无法打印的问题,或者新买的打印机需要先安装驱动才能正常打印的。 那么这个时候我们需要先检查电脑上的打印机是否有安装驱动&…

uniapp开发h5 监听用户物理返回键 类似拼多多返回后弹窗

uniapp有个onBackPress生命周期 但是h5中只能监听到navbarr左边的返回按钮以及uni.navigateBack() 方法 h5既然监听不到物理返回键,那么用户点击了物理返回键自然会路由返回上一页,那么我们监听路由,由于路由是uni自己封装的,我测…

3D模型格式转换工具HOOPS Exchange:支持国际标准STEP格式!

HOOPS Exchange SDK是一组C软件库,使开发团队能够快速将可靠的2D和3D CAD导入和导出添加到其应用程序中,访问广泛的数据,包括边界表示 (B-REP)、产品制造信息 (PMI)、模型树、视图、持久 ID、样式、构造几何、可视化等,无需依赖任…

易点易动:引入二维码和移动技术,助力企业高效进行固定资产盘点

固定资产是企业重要的财务资源,而高效准确地进行海量固定资产盘点一直是企业管理的挑战。为了解决这一问题,易点易动固定资产管理系统引入了先进的二维码和移动技术。本文将详细介绍易点易动固定资产管理系统的二维码和移动技术,展示如何借助…

深度学习入门:一篇概述深度学习的文章

文章目录 🌟 特征工程:推荐系统有哪些可供利用的特征?🍊 1. 用户特征🍊 2. 商品特征🍊 3. 上下文特征🍊 4. 社交特征🍊 5. 行为特征 🌟 特征处理:如何利用Spa…

【C++】list的介绍及使用 | 模拟实现list(万字详解)

目录 一、list的介绍及使用 什么是list? list的基本操作 增删查改 获取list元素 不常见操作的使用说明 ​编辑 接合splice ​编辑 移除remove 去重unique 二、模拟实现list 大框架 构造函数 尾插push_back 迭代器__list_iterator list的迭代器要如何…

Java八股文 ---Java并发篇

线程安全 线程安全就是多个线程去执行某类,这个类始终能表现出正确的行为,那么这个类就是线程安全的 我们判断是否要处理线程安全问题,就看有没有多个线程同时访问一个共享变量 能不能保证操作的原子性,考虑atomic包下的类够不够我…

DASCTF X CBCTF 2023

一、justpaint 1.先是压缩包密码爆破,密码为11452,然后开始代码审计,发现是一个线性的神经网络。 源代码如下: import torch import torch.nn as nn import numpy as np import matplotlib.pyplot as plt from PIL import Ima…

JVM重点

文章目录 0. 运行流程1. 内存区域划分1.1 堆1.2 Java 虚拟机栈1.3 程序计数器1.4 方法区 2. 类加载机制类加载过程2.1 加载2.2 验证2.3 准备2.4 解析2.5 初始化双亲委派模型 3. 垃圾回收机制3.1 垃圾判断算法3.1.1 引用计数算法3.1.2 可达性分析算法 3.2 垃圾回收算法3.2.1 标记…

01 # 手写 new 的原理

new 做了什么? 在构造器内部创建一个新的对象这个对象内部的隐式原型指向该构造函数的显式原型让构造器中的 this 指向这个对象执行构造器中的代码如果构造器中没有返回对象,则返回上面的创建出来的对象 手写 new 的过程 new 是一个运算符,只能通过函…

Redis Cluster高可用集群原理

目录 一、Redis Cluster和哨兵对比二、槽位定位算法三、集群节点间的通信机制四、集群选举原理五、网络抖动六、Redis集群为什么至少需要三个master节点,并且推荐节点数为奇数?七、集群没有过半机制会出现脑裂数据丢失问题八、跳转重定位九、集群对批量操…

封神工具:腾讯云服务器价格计算器,精准报价一键计算!

腾讯云服务器价格计算器可以一键计算出云服务器的精准报价,包括CVM实例规格价格、CPU内存费用、公网带宽收费、存储系统盘和数据盘详细费用,腾讯云百科txybk.com分享腾讯云价格计算器链接入口、使用方法说明: 腾讯云服务器价格计算器 打开腾…

行业追踪,2023-10-25

自动复盘 2023-10-25 凡所有相,皆是虚妄。若见诸相非相,即见如来。 k 线图是最好的老师,每天持续发布板块的rps排名,追踪板块,板块来开仓,板块去清仓,丢弃自以为是的想法,板块去留让…

[奇奇怪怪符号]输入法手动输入希腊字母

日常写材料总要输入一些奇奇怪怪符号,虽然知道有一张表,可以在上面选,但是在文本编辑器上找到并打开也不是一件容易的事情,(功能多的编辑器就很臃肿,令人眼花缭乱的标签) 很想要简洁的编辑器&a…

文件加密软件(2023十大文件加密软件排行榜)

文件加密软件已成为企业和个人保护文件安全的重要工具。本文将介绍2023年十大文件加密软件的排行榜,以帮助大家了解和选择适合自己的文件加密软件。 本文是根据软件的功能性、安全性、易用性和创新性等多方面指标进行评选,以体现各大文件加密软件的实力和…

C++多态的认识与理解

多态的概念 通俗来说,多态就是多种形态。具体点就是去完成某个行为,当不同的对象去完成时会产生出不同的状态。 比方说买高铁票时,如果你是学生的话,买票就有优惠。如果你是军人的话,就可以优先买票。普通人的话&…

聚观早报 |2024年春节连休8天;RTE2023开幕

【聚观365】10月26日消息 2024年春节连休8天 RTE2023开幕 一加12首发“东方屏” 微软公布2024财年第一财季财报 Alphabet Q3业绩好于预期 2024年春节连休8天 国务院办公厅发布关于2024年部分节假日安排的通知。2024年春节,2月10日至17日放假调休,共…

Linux ———— 用户-组

Linux是一个多用户多任务的操作系统。 用户(user): 在Linux系统中,用户是一个拥有独立空间、权限和身份的实体。每个用户都有一个唯一的用户名和用户ID。用户可以登录到系统、读取、写入、执行文件,并按照预设的权限进…

Pytorch使用torch.utils.data.random_split拆分数据集,拆分后的数据集状况

对于这个API,我最开始的预想是从 猫1猫2猫3猫4狗1狗2狗3狗4 中分割出 猫1猫2狗4狗1 和 猫4猫3狗2狗3 ,但是打印结果和我预想的不一样 数据集文件的存放路径如下图 测试代码如下 import torch import torchvisiontransform torchvision.transforms.Compose([torchvision.tran…

算法通关村-黄金挑战K个一组反转

大家好我是苏麟 , 今天带来K个一组反转 , K个一组反转 可以说是链表中最难的一个问题了,每k 个节点一组进行翻转,请你返回翻转后的链表。k 是一个正整数,它的值小于或等于链表的长度。如果节点总数不是 k 的整数倍,那么请将最后…