数据分析案例-数据分析师岗位招聘信息可视化

news2025/2/21 20:04:32

 

🤵‍♂️ 个人主页:@艾派森的个人主页

✍🏻作者简介:Python学习者
🐋 希望大家多多支持,我们一起进步!😄
如果文章对你有帮助的话,
欢迎评论 💬点赞👍🏻 收藏 📂加关注+


目录

​编辑

1.数据集介绍

2.实验工具

3.实验过程

3.1加载数据

3.2数据预处理

3.3数据可视化 

3.3.1工作经验要求

3.3.2学历要求

3.3.3公司规模

3.3.4不同城市的岗位数量

3.3.5岗位需求量最高的前十名公司

3.3.6平均薪资的分布情况

3.3.7校招和社招的占比

3.3.8不同工作年龄的平均薪资差异

3.3.9不同城市的平均薪资

3.3.10公司福利词云图

3.3.11分析哪种行业最火

3.3.12数据分析岗位需要的技能

4.总结


1.数据集介绍

本次实验数据集来源于xx招聘网中关于数据分析师相关岗位的招聘信息,共计1600条数据,每条招聘信息包括岗位名称、公司、薪资、城市、工作类型、学历要求、工作经验要求等共51个字段。

2.实验工具

python3.10

jupyter notebook

3.实验过程

3.1加载数据

首先导入本次实验用到的第三方库并读取数据

 查看数据大小

查看数据基本信息

3.2数据预处理

筛选出有价值可分析的变量

 统计缺失值情况

删除缺失值

检测数据是存在重复值,若存在则删除

 处理薪资范围,转化为平均薪资

3.3数据可视化 

3.3.1工作经验要求

# 工作经验要求
df1 = df['workYear'].value_counts()
a1 = Pie(init_opts=opts.InitOpts(theme = ThemeType.DARK))
a1.add(series_name='工作经验要求',
        data_pair=[list(z) for z in zip(df1.index.to_list(),df1.values.tolist())],
        radius='70%',
        )
a1.set_global_opts(title_opts=opts.TitleOpts(title="工作经验要求占比",
                    pos_left='center',
                    pos_top=30))
a1.set_series_opts(tooltip_opts=opts.TooltipOpts(trigger='item',formatter='{a} <br/>{b}:{c} ({d}%)'))
a1.render_notebook()

 可看出绝大部分都是要求5年以内,不限的很少。

3.3.2学历要求

# 学历要求
df2 = df['education'].value_counts()
a2 = Pie(init_opts=opts.InitOpts(theme = ThemeType.CHALK))
a2.add(series_name='学历要求',
        data_pair=[list(z) for z in zip(df2.index.to_list(),df2.values.tolist())],
        radius='70%',
        )
a2.set_global_opts(title_opts=opts.TitleOpts(title="学历要求占比",
                    pos_left='center',
                    pos_top=30))
a2.set_series_opts(tooltip_opts=opts.TooltipOpts(trigger='item',formatter='{a} <br/>{b}:{c} ({d}%)'))
a2.render_notebook()

 学历方面绝大部分都是本科以上即可。

3.3.3公司规模

# 公司规模
df3 = df['companySize'].value_counts()
a3 = Pie(init_opts=opts.InitOpts(theme = ThemeType.ESSOS))
a3.add(series_name='公司规模',
        data_pair=[list(z) for z in zip(df3.index.to_list(),df3.values.tolist())],
        radius='70%',
        )
a3.set_global_opts(title_opts=opts.TitleOpts(title="公司规模占比",
                    pos_left='center',
                    pos_top=30))
a3.set_series_opts(tooltip_opts=opts.TooltipOpts(trigger='item',formatter='{a} <br/>{b}:{c} ({d}%)'))
a3.render_notebook()

 公司人数规模方面主要集中在500人以上,以中大厂为集中。

3.3.4不同城市的岗位数量

# 分析不同城市的岗位数量
df['city'].value_counts()[::-1].plot(kind='barh')
plt.xlabel('数量')
plt.ylabel('城市')
plt.title('不同城市的岗位数量')
plt.show()

 可以看出数据分析相关岗位数量最多的是北上深广等沿海城市。

3.3.5岗位需求量最高的前十名公司

# 分析岗位需求量最高的前十名公司
df['companyShortName'].value_counts().head(10)[::-1].plot(kind='barh')
plt.xlabel('数量')
plt.title('岗位需求量最高的前十名公司')
plt.show()

岗位需求量最多是腾讯、拼多多等互联网企业。 

3.3.6平均薪资的分布情况

# 分析平均薪资的分布情况
sns.distplot(df['avg_salary'])
plt.show()

从分布图看出平均薪资主要在10000-30000之间。 

3.3.7校招和社招的占比

# 分析校招和社招的占比
sns.countplot(data=df,x='isSchoolJob')
plt.xticks([0,1],labels=['社招','校招'])
plt.show()

绝大多数都是社招,校招占据极少数。 

3.3.8不同工作年龄的平均薪资差异

# 分析不同工作年龄的平均薪资差异
sns.barplot(data=df,y='avg_salary',x='workYear')
plt.show()

 除了不限以外,平均薪资都是随着工作经验年数的增加而增加。

3.3.9不同城市的平均薪资

# 不同城市的平均薪资
df.groupby('city').mean()['avg_salary'].plot(kind='barh')
plt.xlabel('平均薪资')
plt.title('不同城市的平均薪资')
plt.show()

  

可以看出北京上海杭州深圳平均薪资都在20k左右。 

3.3.10公司福利词云图

# 分析公司福利词云图
from pyecharts.charts import WordCloud
import collections
result_list = []
for i in data['companyLabelList'].values:
    for j in eval(i):
        result_list.append(j)
word_counts = collections.Counter(result_list)
word_counts_top = word_counts.most_common(100)
print(word_counts_top)
wc = WordCloud()
wc.add('',word_counts_top)
wc.render_notebook()

 可以看出带薪年假和绩效奖金是最多的福利。

3.3.11分析哪种行业最火

# 分析那种行业最火
from pyecharts.charts import WordCloud
import collections
result_list = []
for i in data['industryField'].values:
    word_list = str(i).split(',')
    for j in word_list:
        result_list.append(j)
word_counts = collections.Counter(result_list)
word_counts_top = word_counts.most_common(100)
print(word_counts_top)
wc = WordCloud()
wc.add('',word_counts_top)
wc.render_notebook()

可以看出移动互联网、电商、数据服务、金融行业等比较火。 

3.3.12数据分析岗位需要的技能

# 分析数据分析岗位需要的技能
from pyecharts.charts import WordCloud
import collections
result_list = []
for i in data['skillLables'].values:
    for j in eval(i):
        result_list.append(j)
word_counts = collections.Counter(result_list)
word_counts_top = word_counts.most_common(100)
print(word_counts_top)
wc = WordCloud()
wc.add('',word_counts_top)
wc.render_notebook()

可以看出SQL、可视化、BI、Python、Hadoop、Hive等都是数据分析师必备的重要技能。 

4.总结

        本次通过对数据分析师相关岗位的分析,我们发现数据分析相关岗位主要集中在北上广深等城市,以中大厂为主,经验要求以1-5年为主,学历以本科以上为主,平均薪资在15k左右,技能方面以SQL、可视化、BI、Python、Hadoop、Hive为主。

心得与体会:

通过这次Python项目实战,我学到了许多新的知识,这是一个让我把书本上的理论知识运用于实践中的好机会。原先,学的时候感叹学的资料太难懂,此刻想来,有些其实并不难,关键在于理解。

在这次实战中还锻炼了我其他方面的潜力,提高了我的综合素质。首先,它锻炼了我做项目的潜力,提高了独立思考问题、自我动手操作的潜力,在工作的过程中,复习了以前学习过的知识,并掌握了一些应用知识的技巧等

在此次实战中,我还学会了下面几点工作学习心态:

1)继续学习,不断提升理论涵养。在信息时代,学习是不断地汲取新信息,获得事业进步的动力。作为一名青年学子更就应把学习作为持续工作用心性的重要途径。走上工作岗位后,我会用心响应单位号召,结合工作实际,不断学习理论、业务知识和社会知识,用先进的理论武装头脑,用精良的业务知识提升潜力,以广博的社会知识拓展视野。

2)努力实践,自觉进行主角转化。只有将理论付诸于实践才能实现理论自身的价值,也只有将理论付诸于实践才能使理论得以检验。同样,一个人的价值也是透过实践活动来实现的,也只有透过实践才能锻炼人的品质,彰显人的意志。

3)提高工作用心性和主动性。实习,是开端也是结束。展此刻自我面前的是一片任自我驰骋的沃土,也分明感受到了沉甸甸的职责。在今后的工作和生活中,我将继续学习,深入实践,不断提升自我,努力创造业绩,继续创造更多的价值。

这次Python实战不仅仅使我学到了知识,丰富了经验。也帮忙我缩小了实践和理论的差距。在未来的工作中我会把学到的理论知识和实践经验不断的应用到实际工作中,为实现理想而努力。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/765783.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

解决appium-doctor报ffmpeg cannot be found

一、下载ffmpeg安装包 https://ffmpeg.org/download.html 找到如图所示红框位置点击下载ffmpeg安装包。 二、配置ffmpeg环境变量 三、检查ffmpeg版本信息 重新管理员打开dos系统cmd命令提示符&#xff0c;输入ffmpeg查看是否出现版本信息&#xff0c;安装完好。 ffmpeg

在php中安装php_xlswriter扩展报错,找不到php_xlswriter.dll

前言&#xff1a;这里已经把下载的php_xlswriter.dll扩展放到了php安装目录的ext目录下&#xff0c;运行php -m还是报错找不到该扩展 原因&#xff1a;下载的扩展是nts的&#xff0c;而安装的php是ts的。查看当前php是nts还是ts&#xff1a; 在PHP中&#xff0c;可以利用phpin…

DWG文件怎么转图片?简单好用的转换方法分享

将CAD文件转换成图片的优势在于&#xff0c;图片文件更易于共享和传输。CAD文件通常比较大&#xff0c;而图片文件则更加轻便&#xff0c;容易通过电子邮件或者其他方式进行传输。此外&#xff0c;图片文件更易于浏览和查看。CAD文件需要特殊的软件才能打开和查看&#xff0c;而…

全志F1C200S嵌入式驱动开发(GPIO输出)

【 声明:版权所有,欢迎转载,请勿用于商业用途。 联系信箱:feixiaoxing @163.com】 和v3s一样,f1c200s本身的外部引脚比较少。所以这个时候,不可避免地,很多引脚的功能就会重叠在一起。这种情况下,我们就要学会取舍了。比如说,如果是学习sd卡的时候,那么spi的…

寻找下一个生成式AI独角兽,亚马逊云科技创业加速器火热来袭

生成式AI让人工智能技术又一次破圈&#xff0c;带来了机器学习被大规模采用的历史转折点。它正在掀起新一轮的科技革命&#xff0c;为人类带来前所未有的颠覆性的影响&#xff0c;而诸多创业者也应势而上&#xff0c;寻求创新机遇。生成式AI可以创造全新的客户体验、提高企业内…

QPainter中坐标系变换问题

一、坐标系简介。 Qt中每一个窗口都有一个坐标系&#xff0c;默认的&#xff0c;窗口左上角为坐标原点&#xff0c;然后水平向右依次增大&#xff0c;水平向左依次减小&#xff0c;垂直向下依次增大&#xff0c;垂直向上依次减小。原点即为&#xff08;0&#xff0c;0&#xf…

【Jenkins】Jenkins构建前端流水线

目录 一、前言二、新建前端流水线1、点击新建任务2、填写流水线名称&#xff08;这里我选择的是自由风格的软件项目&#xff09;&#xff0c;任务名称一般格式为&#xff1a;项目名称-前后端3、创建成功后的结果 三、配置前端流水线1、进入刚创建好的任务页面中&#xff0c;点击…

攻击载荷、木马、蠕虫、感染型病毒,你了解多少?

恶意程序是指数字世界中带有攻击意图的程序实体&#xff0c;通常可以分为攻击载荷、木马、蠕虫、感染型病毒。 1.攻击载荷 攻击载荷是指攻击者发起初始攻击并建立网络连接的武器载体&#xff0c;按照功能可以分为投递攻击类、连接控制类、独立攻击类。 投递攻击类有远程攻击类…

电商 api 接口文档编写

1、开篇 欢迎使用ShowDoc&#xff01; API格式&#xff1a; 备注&#xff1a;API必须返回如下3个字段&#xff1a; 参数名必选类型说明status是int状态message是string信息提示result否mix结果 2、用户相关 2.1、登录/退出 简要描述&#xff1a; 用户登录API 请求URL&…

HCIA-虚拟化

1、虚拟化概述 KVM是所有云平台的底座&#xff0c;虚拟化是所有云的基础&#xff0c;虚拟化只提供基础架构&#xff0c;云可以提供服务。 CNA是个定制的欧拉系统EulerOS&#xff0c;基于centos内核只保留和虚拟化相关的代码&#xff0c;CNA默认已经部署好kvm虚拟化的软件。CNA…

Vue3的watchEffect的妙用,与watch的区别

前言 在Vue3中&#xff0c;引入了Composition API&#xff0c;其中的watchEffect()函数是一个非常强大和灵活的工具&#xff0c;用于处理响应式数据的变化&#xff0c;使得项目更加弹性和灵活。它与watch有所不同&#xff0c;本文将介绍watchEffect()的定义、特点、与watch的区…

LeetCode 1183 矩阵中 1 的最大数量 (图解)

题目省略了 题解 很多题解都写的是&#xff0c;求正方形矩阵在原矩阵的等效位置的数量&#xff0c;但是不画图可能不好理解&#xff0c;比如我现在有个 3*3 的矩阵&#xff0c;需要用2*2的正方形填充 上图中我枚举了所有的点在小正方形可能出现的情况&#xff08;A、B、C、D&…

Appium-Python-Client 源码剖析 (一) driver 的元素查找方法

目录 前言 源码版本:0.9 结构图&#xff1a; mobileby.py appium 的 webdriver.py selenium 的 webdriver.py seleniumdriver appiumdriver 前言 Appium-Python-Client是一个用于Python语言的Appium客户端库&#xff0c;它提供了丰富的API和功能&#xff0c;用于编写和…

SpringBoot整合缓存(Caffeine、Redis)

SpringBoot整合缓存 注解介绍 EnableCaching 标记在CacheManager统一配置类&#xff0c;需要配合Configuration使用 Cachable 标记在需要使用缓存的实现类上&#xff0c;一般用于查询操作。当该方法输入参数对应的缓存数据不存在与缓存引擎中&#xff08;类似Redis&#x…

视频配音乐怎么制作?教你简单好用的配乐方法

在很多情况下&#xff0c;为视频配乐可以增强观众的情感体验&#xff0c;使观众更加投入到视频内容中。配乐可以增强视频的节奏和情感共鸣&#xff0c;使观众更容易理解和接受视频的信息。此外&#xff0c;配乐还可以为视频添加品味和风格&#xff0c;使其更具吸引力。教大家几…

人际关系处理文库 怎样与女人相处 怎样与领导相处 张胜利 岳贵安著 PDF 网盘免费...

人际关系处理文库-17部大全 怎样与男人相处、怎样与女人相处、怎样与领导相处、怎样对付小人、怎样识别谎言、怎样洞察人心、怎样变通协调、怎样出人头地、怎样对付难缠的人、怎样对付小报告、怎样广结人缘、怎样看穿陷阱、怎样笼络人心、怎样妙言善辩、怎样轻松自如、怎样善解…

Huggingface tokenizer decode batch_decode报错解决思路与分析

文章目录 摘要引出原因最初报错的解决办法batch_decode 源码decode 和 batch_decode 都可以成功运行的例子decode 和 batch_decode 不能同时成功运行的例子源码将输入转成 python list 摘要 本篇文章&#xff0c;由笔者最初遇到的decode报错开始&#xff0c;叙述笔者如何解决这…

继连续亏损后,软银依然下注机器人,今年能否在人工智能浪潮中分一杯羹?

原创 |文 BFT机器人 近日&#xff0c;将近7个月没露面的孙正义&#xff0c;现身软银集团年度股东大会并表示&#xff0c;软银目前账面现金有5万亿日元&#xff08;约合人民币2547亿元&#xff09;&#xff0c;已准备好将防守模式转变为进攻模式&#xff0c;All in AI&#xff…

imazing怎么导出app,Imazing修改APP存档的方法【2023详解】

相信很多小伙伴都不清楚Imazing导出APP及能够帮助我们更好地去管理手机&#xff0c;还能够替换从网上下载的游戏存档&#xff0c;让用户可以有一个更好地体验&#xff0c;那么具体要如何去操作呢&#xff1f;下面就跟着小编一起来看看Imazing修改APP存档的方法吧。 使用软件 iM…

修改windows文件没有权限

一、问题描述&#xff1a;有时候我们在修改windows文件时&#xff0c;提示没有修改权限。 二、解决方案 修改windows的hosts文件 为例