数据分析案例-2024年裁员数据集可视化分析

news2024/9/20 8:06:53

 

🤵‍♂️ 个人主页:@艾派森的个人主页

✍🏻作者简介:Python学习者
🐋 希望大家多多支持,我们一起进步!😄
如果文章对你有帮助的话,
欢迎评论 💬点赞👍🏻 收藏 📂加关注+


目录

1.项目背景

2.数据集介绍

3.技术工具

4.导入数据

5.数据可视化

小结

源代码


1.项目背景

        随着全球经济的不断变化和科技的快速发展,各行各业都面临着前所未有的挑战和机遇。在这个背景下,裁员作为一种企业调整和优化人力资源配置的常见手段,其背后的数据和趋势显得尤为重要。通过对裁员数据集进行深入的分析和可视化展示,我们可以更好地理解这一现象的内在规律和影响因素,为企业决策和政策制定提供有力的数据支持。

        首先,从全球宏观经济的角度来看,近年来全球经济形势复杂多变,受到多种因素的影响,如贸易保护主义的抬头、地缘政治的紧张局势、新冠疫情的全球大流行等。这些因素不仅对企业经营产生了巨大的冲击,也加剧了劳动力市场的波动和不确定性。因此,裁员作为企业在这种环境下的一种应对策略,其数据和趋势能够反映出全球经济形势的变化和企业经营的困境。

        其次,从行业发展的角度来看,不同行业在面临市场变化和竞争压力时,其裁员情况也存在显著的差异。例如,一些传统行业由于产能过剩、技术创新不足等原因,可能面临较大的裁员压力;而一些新兴行业则由于市场需求旺盛、技术发展迅速等原因,呈现出较好的发展态势。通过对不同行业的裁员数据进行分析和比较,我们可以更深入地了解各行业的发展状况和趋势,为企业制定发展战略提供参考。

        此外,从人力资源管理的角度来看,裁员不仅关系到企业的经济效益和竞争力,也关系到员工的切身利益和发展前景。因此,在裁员过程中,企业需要充分考虑员工的权益和利益,采取合理的补偿和安置措施,以减少裁员对员工的负面影响。通过对裁员数据集的分析和可视化展示,我们可以更直观地了解裁员对员工的影响和企业的应对策略,为制定更加人性化、合理的裁员政策提供参考。

2.数据集介绍

本实验数据集来源于Kaggle,原始数据集为2020-2024年裁员数据,共有3577条,12个变量,该数据集提供了不同公司的裁员信息。它包括以下几栏:

Company:裁员发生的公司名称。

Location_HQ:公司总部位置。

Industry:公司所属的行业或部门。

Laid_Off_Count:公司解雇的员工数量。

Percentage:公司员工被解雇的百分比。

Date:裁员发生的日期。

Source:信息来源网址。

Funds_Raised:公司募集资金的信息。

Stage:公司发展或成长的阶段。

Date_Added:数据库中添加的日期

Country:公司所在的国家。

List_of_Employees_Laid_Off:链接到谷歌文档的员工名单

该数据集专门用于跟踪和分析不同公司的裁员情况,为不同行业和地理位置的裁员提供见解。

3.技术工具

Python版本:3.9

代码编辑器:jupyter notebook

4.导入数据

导入数据分析第三方库并加载数据集

查看数据大小

查看数据基本信息

查看数值型变量的描述性统计

查看非数值型变量的描述性统计

统计数据集缺失值情况 

从结果看出,有三个变量存在缺失值,且缺失值较多,故我们采用0进行填充

统计重复值情况

可以发现原始数据集不存在重复值

将日期列转换为日期时间,并从中制作年和月列,便于后面的可视化分析

5.数据可视化

裁员最多的是上市后的公司,裁员比例最高的是b轮融资公司,相比之下,很多人都在上市后的公司工作。

对员工来说,2023年是最糟糕的一年,2021年的裁员减少了很多,我们必须检查一下

大多数裁员发生在1月份,裁员随时都可能发生。但就裁员最常发生的时间而言,1月和12月是众所周知的裁员高峰期。雇主们在每年的这个时候都在审查他们的预算。

如果我们忽略2023年,由于大规模的经济衰退和公司在1月份解雇了大量员工,我们看到裁员通常发生在11月份。

美国的情况非常令人担忧,从柱状图中可以看出,美国的数据远远超过其他国家的数据,这对比较产生了明显的影响。

小结

1.零售业裁员最多,而旅游业裁员最少。

2.如图所示,在2022年,裁员人数达到了一个显著的峰值,这一趋势在2023年继续增加。

3.今年1月,裁员人数达到了历史最高水平,这与公司在这一时期进行财政年度结束和结算的惯例相符。

4.受新冠疫情影响,今年第二季度的裁员人数创下了历史最高纪录。

5.美利坚合众国报告的裁员人数最多,超过20万人,而印度的裁员人数第二多,不到5万人。

6.旧金山湾区的公司裁员数量最多。

7.大多数裁员(约24,000人)发生在白领岗位,尤其是在金融或金融科技公司。

8.与白领工作相比,蓝领工作,特别是运输部门的蓝领工作受到裁员的严重影响,裁员人数约为3.2万人。

10.科技巨头优步在2020年至2023年期间经历了多次裁员,总计裁员7000多人,在此期间裁员四次。

11.在首次公开募股之后,大多数美国公司都经历了裁员,尤其是在COVID-19大流行之后。值得注意的是,谷歌和微软都报告了类似程度的裁员。

源代码

import seaborn as sns
import matplotlib.pyplot as plt
import pandas as pd
import numpy as np
import warnings
warnings.filterwarnings('ignore')
sns.set_style("darkgrid")

df = pd.read_csv('layoffs_data.csv')
df.head()
df.shape
df.info()
df.describe()
df.describe(include='O').T
df.isnull().sum()
df['Laid_Off_Count'] = df['Laid_Off_Count'].replace(np.NaN, 0)
df['Percentage'] = df['Percentage'].replace(np.NaN, 0)
df['Funds_Raised'] = df['Funds_Raised'].replace(np.NaN, 0)
df.isnull().sum()
df.duplicated().sum()
# 将日期列转换为日期时间,并从中制作年和月列
import datetime as dt
df['Date'] = pd.to_datetime(df['Date'])
df['Year'] = df['Date'].dt.year
df['Month'] = df['Date'].dt.month_name()
df['Quarter'] = df['Date'].dt.to_period('Q')
# 行业分析
fig, ax = plt.subplots(1, 2,figsize=(15,8))
ax[0] = sns.barplot(data=df.groupby('Industry')['Laid_Off_Count'].sum().sort_values(ascending=False).reset_index(), 
            y='Industry', x='Laid_Off_Count',  edgecolor='black', palette='Set3', ax=ax[0])
ax[0].set(title='Laid Off Count by Industry', xlabel='Laid Off Count')
ax[1] = sns.barplot(data=df.groupby('Industry')['Percentage'].sum().sort_values(ascending=False).reset_index(), 
            y='Industry', x='Percentage', edgecolor='black', palette='muted', ax=ax[1])
ax[1].set(title='Percent Laid Off by Industry', xlabel='Percent Laid Off')
plt.tight_layout()
fig.show()
# 阶段分析
fig, ax = plt.subplots(1, 2,figsize=(12,5))
ax[0] = sns.barplot(data=df.groupby('Stage')['Laid_Off_Count'].sum().sort_values(ascending=False).reset_index(), 
            y='Stage', x='Laid_Off_Count',  edgecolor='black', palette='Set2', ax=ax[0])
ax[0].set(title='Laid Off Count by Company Stage', xlabel='Laid Off Count')
ax[1] = sns.barplot(data=df.groupby('Stage')['Percentage'].sum().sort_values(ascending=False).reset_index(), 
            y='Stage', x='Percentage',  edgecolor='black', palette='Set3', ax=ax[1])
ax[1].set(title='Percent Laid Off by Company Stage', xlabel='Percent Laid Off')
plt.tight_layout()
fig.show()
结论
裁员最多的是上市后的公司
裁员比例最高的是b轮融资公司
相比之下,很多人都在上市后的公司工作
# 年度分析
fig, ax = plt.subplots(1,2, sharey=True, figsize=(8,5))
ax[0] = sns.lineplot(data=df.groupby('Year')['Laid_Off_Count'].sum().reset_index(), x='Year', y='Laid_Off_Count', 
                   marker='o', ax=ax[0])
ax[0].set(title='Laid Off Count by Year', ylabel='Laid Off Count')
ax[1] = sns.barplot(data=df.groupby('Year')['Laid_Off_Count'].sum().reset_index(), x='Year', y='Laid_Off_Count', 
                   ax=ax[1], palette='Set3', linewidth=1,edgecolor='black')
ax[1].set(title='Laid Off Count by Year', ylabel='Laid Off Count')
fig.show()
结论
对员工来说,2023年是最糟糕的一年
2021年的裁员减少了很多,我们必须检查一下
# 月分析
fig, ax = plt.subplots(2,1, sharex=True, figsize=(8,5))
ax[0] = sns.lineplot(data=df.groupby('Month')['Laid_Off_Count'].sum().reset_index(), x='Month', y='Laid_Off_Count', 
                   marker='o', ax=ax[0], color='#329da8')
ax[0].set(title='Laid Off Count by Month', ylabel='Laid Off Count')
ax[1] = sns.barplot(data=df.groupby('Month')['Laid_Off_Count'].sum().reset_index(), x='Month', y='Laid_Off_Count', 
                   ax=ax[1], palette='pastel', linewidth=1,edgecolor='black')
ax[1].set(ylabel='Laid Off Count')
plt.tight_layout()
plt.xticks(rotation=45)
fig.show()
结论
大多数裁员发生在1月份
在谷歌上快速搜索,这是我发现的:
裁员随时都可能发生。但就裁员最常发生的时间而言,1月和12月是众所周知的裁员高峰期。雇主们在每年的这个时候都在审查他们的预算。
fig, ax = plt.subplots(2,1, sharex=True, figsize=(8,5))
ax[0] = sns.lineplot(data=df.query("Year != 2023").groupby('Month')['Laid_Off_Count'].sum().reset_index(), x='Month', y='Laid_Off_Count', 
                   marker='o', ax=ax[0], color='#ab29cc')
ax[0].set(title='Laid Off Count by Month (Excluding 2023)', ylabel='Laid Off Count')
ax[1] = sns.barplot(data=df.query("Year != 2023").groupby('Month')['Laid_Off_Count'].sum().reset_index(), x='Month', y='Laid_Off_Count', 
                   ax=ax[1], palette='bright' , linewidth=1,edgecolor='black')
ax[1].set(ylabel='Laid Off Count')
plt.tight_layout()
plt.xticks(rotation=45)
fig.show()
如果我们忽略2023年,由于大规模的经济衰退和公司在1月份解雇了大量员工,我们看到裁员通常发生在11月份。
# 季度分析
fig, ax = plt.subplots(figsize=(10,4))
ax = sns.barplot(data=df.sort_values(by='Quarter'), x='Quarter', y='Laid_Off_Count'
                 ,linewidth=1,edgecolor='black',  palette='pastel')
ax.set(title='Layoffs per quarter', ylabel='Laid Off Count')
plt.xticks(rotation=30)
plt.show()
# 国家分析
fig, ax = plt.subplots(2,1,figsize=(10,5), sharex=True)
ax[0] = sns.barplot(data=df.groupby('Country')['Laid_Off_Count'].sum().sort_values(ascending=False).reset_index().head(10),
             x='Country', y='Laid_Off_Count', linewidth=1,edgecolor='black', palette='deep', ax=ax[0])
ax[0].set(title='Layoffs by country (top 10)', ylabel='Lay Off Count')
ax[1] = sns.barplot(data=df.groupby('Country')['Laid_Off_Count'].sum().sort_values(ascending=False).reset_index().head(10),
             x='Country', y='Laid_Off_Count', linewidth=1,edgecolor='black', palette='muted', ax=ax[1])
ax[1].set(title='Layoffs by country (top 10) - Log Scale', ylabel='Lay Off Count')
ax[1].set_yscale('log')
plt.tight_layout()
plt.xticks(rotation=30)
plt.show()
结论
美国的情况非常令人担忧,从柱状图中可以看出,美国的数据远远超过其他国家的数据,这对比较产生了明显的影响。
# 公司分析
fig, ax = plt.subplots(figsize=(12,4))
ax = sns.barplot(data= df.groupby('Company')['Laid_Off_Count'].sum().sort_values(ascending=False).reset_index().head(10), 
                 x='Laid_Off_Count', y='Company'
                ,linewidth=1,edgecolor='black',  palette='Set2', ax=ax)
ax.set(title='Layoffs by company (top 10)', xlabel='Lay Off Count')
plt.show()
# 总部分析
fig, ax = plt.subplots(figsize=(12,4))
ax = sns.barplot(data= df.groupby('Location_HQ')['Laid_Off_Count'].sum().sort_values(ascending=False).reset_index().head(10), 
                 x='Laid_Off_Count', y='Location_HQ'
                ,linewidth=1,edgecolor='black',  palette='pastel', ax=ax)
ax.set(title='Layoffs by HQ (top 10)', xlabel='Lay Off Count')
plt.show()
# 年、月分析
fig, ax = plt.subplots(figsize=(12,6))
ax = sns.barplot(data=df, x='Year', y='Laid_Off_Count', hue='Month',estimator=sum, edgecolor='black', ax = ax, palette='pastel')
ax.set(title='Layoffs by Year and Month', ylabel='Laid Off Count')
plt.show()
import plotly.express as px
world = df.groupby("Country")["Laid_Off_Count"].sum().reset_index()
figure = px.choropleth(world,locations="Country",
                       locationmode = "country names", color="Laid_Off_Count",
                       hover_name="Country",range_color=[1,10000],
                       color_continuous_scale="reds",
                       title="Countries having LayOffs")
figure.show()
# 十大科技巨头裁员
import squarify 
sorted_df = df.sort_values('Laid_Off_Count', ascending=False).head(10)
Companies = sorted_df["Company"].tolist()
Laid_off_count = sorted_df['Laid_Off_Count'].tolist()
colors = ['#FF5733', '#FF8C00', '#FFB300', '#F4D03F', '#85C1E9', '#3498DB', '#8E44AD', '#DC7633', '#27AE60', '#34495E']
sizes = [count / sum(Laid_off_count) for count in Laid_off_count]
labels = [f'{company}\n{laid_off_count}' for company, laid_off_count in zip(Companies, Laid_off_count)]
plt.figure(figsize=(10, 8))
squarify.plot(sizes=sizes,label = labels, color=colors)
plt.title('Top 10 Companies Laid Off')
plt.axis('off')
plt.show()

资料获取,更多粉丝福利,关注下方公众号获取

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2073405.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

XFTP软件的使用 ---- 远程上传、下载文件

本文假设你的电脑里面已经有XFTP软件。 一、简介 是一个基于 windows 平台的功能强大的SFTP、FTP文件传输软件。通过Xftp软件,windows 用户能安全地在UNIX/Linux 和 Windows PC 之间传输文件。 二、 使用方法【步骤】 打开软件,得到如下图界面。 首先我…

STL--unordered_set和unordered_map的模拟实现

1.unordered系列关联式容器 在C98中,STL提供了底层为红黑树结构的一系列关联式容器,在查询时效率可达到,即最差情况下需要比较红黑树的高度次,当树中的节点非常多时,查询效率也不理想。最好的查询是,进行很…

如何使用ssm实现基于java斗车交易系统设计与实现+vue

TOC ssm082基于java斗车交易系统设计与实现vue 系统概述 1.1 概述 随着社会的快速发展,计算机的影响是全面且深入的。人们的生活水平不断提高,日常生活中人们对斗车交易方面的要求也在不断提高,需要咨询的人数更是不断增加,使得…

OpenCV 图像处理基础算法介绍c++

VS2022配置OpenCV环境 关于OpenCV在VS2022上配置的教程可以参考:VS2022 配置OpenCV开发环境详细教程 图像处理 图像处理是一个广泛的领域,它涉及到对图像数据进行分析、修改和改进的各种技术。以下是一些基本的图像处理操作,这些操作通常可…

模型 蒂蒙斯创业过程

系列文章 分享 模型,了解更多👉 模型_思维模型目录。机会、团队、资源:创业成功的三角。 1 蒂蒙斯创业过程的应用 1.1 京东:蒂蒙斯模型下创业成功的典范 京东是中国知名的电子商务平台,其早期发展阶段充分体现了蒂蒙…

接口基础知识12:cookie、session和token

​课程大纲 ‌Cookie、Session和Token是Web应用中常用的身份验证和会话管理机制,各有特点,适用于不同的应用场景。 一、Cookie 1.1 什么是Cookie Cookie是存储在客户端浏览器中的小段数据,通常用于存储用户偏好设置或用于跟踪用户活动。 C…

51单片机——数码管控制

1、数码管介绍 LED数码管:数码管是一种简单、廉价的显示器,是由多个发光二极管封装在一起组成“8”字型的器件。 2、数码管驱动方式 单片机直接扫描:硬件设备简单,但会耗费大量的单片机CPU时间 专用驱动芯片:内部自…

8月24日笔记

ew的使用 EW(EarthWorm)是一套基于C语言开发的轻量级且功能强大的网络穿透工具,它支持Socks5代理、端口转发及端口映射等功能,能够在复杂的网络环境中实现高效稳定的网络穿透。这款全平台适用的工具(包括Windows、Lin…

proc文件的写操作机制

“一切皆是文件”。 Linux的基本哲学之一。它是指linux系统中的所有一切都可以通过文件的方式访问、管理,即便不是文件,也以文件的形式来管理。例如硬件设备、进程、套接字等都抽象成文件,使用统一的用户接口,虽然文件类型各不相同…

ComfyUI IPAdapter plus的模型应该怎么装-免费版-2024.8.25

🎆背景 ipadapter相关的节点大家应该都不陌生,具体是做什么的就不详细介绍了,但是还是有很多新入门的朋友不太了解这个节点相关的这一堆模型到底应该怎么安装。这里就借着官方节点的介绍来大概讲下这个话题。 涉及到的节点源地址&#xff1…

大数据技术之Zookeeper安装 (2)

目录 下载地址 本地模式安装 1)安装前准备 2)配置修改 3)操作 Zookeeper 配置参数解读 Zookeeper 集群操作 集群规划 解压安装 配置服务器编号 配置 zoo.cfg 文件 集群操作 Zookeeper 集群启动停止脚本 创建脚本 增加脚本执行权限 …

宠物毛发会携带病菌源吗?宠物店空气净化器使体验分享

近期,我接诊了一位肺结节患者,他的第一反应便是联想到家中的猫咪。这种担忧并非毫无根据,过敏体质的人群,无论是对毛发还是排泄物敏感,养宠物都会增加患结节的风险。即便不存在过敏问题,宠物毛发作为病菌的…

Transforms的学习以及地址问题

一、地址问题 在学习Dataset类的实战与Tensboard的学习中,有出现一些地址的问题: 1、相对地址 相对地址的使用: 使用于在从端口中,打开TensorBoard的页面。使用的就是相对地址;例如: tensorboard --log…

MySQL创建与删除表

一、创建表 1.1 使用DDL语句创建表 CREATE TABLE 表名(列名 类型,列名 类型......); character set:如不指定则为所在数据库字符集collate:如不指定则为所在数据库校对规则 查看表 show tables; 1.2 使用Navicat创建表 二、删除表 2.1 使用DDL语句删除…

chapter08-面向对象编程(继承)day08

目录 287-继承原理图 288-继承快速入门 289-继承使用细节1 290-继承使用细节2 291-继承使用细节3 292-继承使用细节4 293-继承使用细节5 294-继承本质详解(重要) 287-继承原理图 288-继承快速入门 289-继承使用细节1 子类继承了所有的属性和方法…

特拉维斯凯尔西花了5位数给女友泰勒斯威夫特买了一份令人惊讶的贺礼

说实话,我们已经记不清特拉维斯凯尔西今年为泰勒斯威夫特花了多少钱了。据报道,他花了近 10 万美元购买意大利服装和甜食,现在,据报道,他为斯威夫特购买鲜花花费了五位数。 消息人士告诉媒体,凯尔西从 Mil…

超分之最近邻插值、线性插值、双线性插值、双三次插值原理

文章目录 插值与图像插值不同的插值方法最近邻域插值(Nearest Neighbor Interpolation) 线性插值 (Linear Interpolation)双线性插值 (Bilinear Interpolation) 双三次插值 (Bicubic Interpolation) 插值与图像插值 插值:利用已知数据去预测…

Redis面试都卷到C语言去了。。。

Redis 面试都卷到 C 去了。有个小伙伴在前两天找松哥模面的时候如是说到。 是啊,没办法,自从 Java 八股文这个概念被提出来并且逐步在 Java 程序员中强化之后,现在各种各样的八股文手册,有免费的有付费的,琳琅满目。 …

实验11 编写子程序《汇编语言》- 王爽

1. 需求 编写一个子程序,将包含任意字符,以 0 结尾的字符串中的小写字母转变成大写字母,描述如下。 名称:letterc 功能:将以 0 结尾的字符串中的小写字母转变成大写字母 参数:ds:di 指向字符串首地址 …

快速排序模版

1.霍尔法 #include <iostream> using namespace std; int partition(int *arr,int left,int right){int pivotIndexleft;while(left<right){while(left<right && arr[right]>arr[pivotIndex]){right--;}while(left<right && arr[left]<a…