2021年帆软杯一等奖作品 |《基于数据可视化的中国编程岗位需求分析》

news2024/9/9 0:57:41

# 作品主题 #——基于数据可视化的中国编程岗位需求分析

一、团队介绍

团队名称:汪汪队立大功
团队成员:乔好鑫、许春阳、窦晨辉
指导老师:施金妹
团队的三位成员均是来自于海南科技职业大学大数据技术与应用专业,专业课主修了python,java等多门有关编程语言课程,经过系统化课程的学习,对编程语言有了一定了解,同时也激发了他们对编程浓烈的学习兴趣。带着这样一份对编程的学习热情促使他们组合在一起,共同深入了解编程,一起进步。

二、作品背景和设计思路

在大数据时代的背景下,编程岗位是一个炙手可热的大分类岗位,作为大数据技术与应用专业的大学生,出于对未来就业方向的思考,选择了中国编程岗位需求这一方向,旨在通过FineBI对C、Java、Python三大编程岗位网上招聘信息进行可视化分析,从而更好选择就业方向,明确就业目标。

确定好主题之后,首先明确了团队的设计思路,把编程招聘网站的选取作为第一步,以此确定数据来源,经过团队讨论、指导老师建议后,最终将目光放在了三个高频公认的招聘网站上:boss直聘、猎聘、前程无忧,通过对网站招聘信息的字段检索、板块分类,得到了初步的信息,再经过数据分析、数据处理等流程,最终得到可视化的数据分析图。

在这里插入图片描述

三、作品亮点

亮点一:真实、具有时效性的数据选择

首先是对编程语言的界定,在中国知网上以关键字、主题检索方式,检索出两万七千篇相关论文,经过筛选最终得到研究频次最多的编程语言,以此为基础,总结出了这三类编程语言被高频公认的招聘网站,分别是boss直聘、猎聘、前程无忧,从而进行信息爬取。

亮点二:规范化数据清洗,为分析做足准备

1、去除脏数据

在对招聘网站进行关键词C、Java、Python的检索时,难免会出现与需求信息不相符合的招聘信息,如C驾驶司机、蔬菜配送员等,经过数据筛选将无关信息剔除。

在这里插入图片描述
利用Excel的函数、筛选功能对数据进行预处理,保留岗位的名称,对城市、工作经验和学历进行切割并去除空值,下方是部分展示。

在这里插入图片描述

2、统一薪资值

在招聘信息爬取的过程中,由于薪资提供信息多为范围取值,所以需要对薪资信息进行进一步处理。具体方法是将范围分为上限与下限,进行平均薪资的计算。
充分利用Excel中的分列功能对原始数据进行前后切割,并通过均值函数对薪资进行平均计算且统一薪资的单位为(K/月),得到全新处理的数据,为导入FineBI做最后的准备。

在这里插入图片描述

3、分组统计

处理过的数据导入FineBI自主数据集后,创建自助数据包,对部分字段进行识别处理,字段设置名为学历要求、经验要求、岗位、记录数、平均薪资、公司,用以对岗位分析做进一步的操作。
在统计操作中对部分数据进行了分组,例如软件工程师又有初中高等级划分,把这些进行了归类统计,使统计结果更加简单明了,方便理解。

在这里插入图片描述

将处理好相关招聘数据导入FineBI中进行仪表板的设计与呈现。

根据数据类别分模块处理,利用软件中一系列不同样式的组件,统一配色,达到清晰准确展现出中国编程岗位需求情况的目的。

亮点三:美观、板块化的可视化界面

模块一:boss直聘热门城市三大编程岗位
· 数据概况 ———

boss直聘平台上共爬取了6460条相关记录,C岗位数量3811,Java岗位数量1106,Python岗位数量1543,总体上来说,boss直聘上C岗位招聘的数量是最多的。
北京、上海、杭州编程岗位招聘数量居于前三。

在这里插入图片描述

· 高薪工作TOP榜 ———

矩形树图来进行分析,由图可知,薪资最高的是华为公司,其薪资为40K,第二、三为华为技术有限公司、西安华为同属于华为分部,其他公司紧随其后。由此可知,华为作为目前编程岗位薪资水平最高的公司,如果从薪资方面考虑,华为的编程岗位是最为优质的选择。

在这里插入图片描述

· 工作经验— —平均薪资统计分析 ———

漏斗图来进行分析,根据数据图可知,平均薪资水平的高低并不是经验越高获得的平均薪资就越高,反而呈正态分布,除去经验不限,平均薪资最高的是1-3年和3-5年分别是47K和46K。可以得出结论,目前编程岗位具有1-5年经验的从业者具有较高的薪资水平,说明编程岗位对经验的要求并没有很高的限制,初入行业的新人也可能得到不错的薪资待遇。

在这里插入图片描述

模块二:猎聘热门城市三大编程岗位
· 数据概况 ———

在这里插入图片描述

· 平均工资——经验、学历要求 ———

采用聚合气泡图,将经验要求和学历要求分别设为横纵轴,以平均工资为颜色、形状、细粒度进而展示出三者之间的关系。
由图可知,经验在一年以上且学历在本科以上的平均工资偏高,但三者之间不是绝对的关系,学历、经验不限的情况下,也存在较高平均工资的情况。

在这里插入图片描述
将学历要求和平均薪资以玫瑰图的形式呈现,博士学历的平均薪资更高,占比更大。
以经验为纵轴,对比岗位数量和平均薪资。可以看出,经验不限的岗位数量最多,经验要求十年以上的岗位数量最少;在平均薪资方面,十年以上的经验要求薪资水平最高,一年以下的平均薪资较低。

在这里插入图片描述

模块三:前程无忧全国三大编程岗位
· 数据概况 ———

在这里插入图片描述

· 岗位需求分布 ———

从地图分布图来看,工作岗位多分布在东部和沿海地区,其中珠三角、长三角、京津冀、川渝等地区聚集了大量的工作岗位且薪资水平也相对比较高,而西部地区的岗位需求比较少。如果对薪资水平有较高需求的求职者,这些地区不失为一个好的选择方向。

在这里插入图片描述
从下方词云图、饼图、面积堆积图、折线图来看,最热门的工作岗位为java开发工程师和软件工程师,平均薪资分布在0-20K范围内,其中拥有3-4年工作经验的岗位数量最多。

在这里插入图片描述
在这里插入图片描述

三、作品亮点

本次可视化项目的作品是集聚了整个团队的共同努力,对团队里的每一个人来说都是一种新的挑战。回顾此次作品的创作,我们也收获了许多。在数据选择与爬取处理方面,更加明白了数据真实性、时效性的重要性,切记不可因为自身的方便操作从而主观的删除部分数据,是不可取的行为。在参赛的过程中加深了FineBI的使用,对数据的可视化分析有了更为直观且动态化的了解。对于未来就业选择也有了更为清晰的方向,如今的学习更是确定了目标、增加了学习动力。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/165936.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SpringBoot+2次MD5登录密码加密+MyBatisPlus+Thymeleaf+Bootstrap简单实现登录功能,一文轻松搞定!

这里写目录标题一、演示GIF二、开发前期准备1、数据库2、依赖POM.XML3、idea结构目录三、后端1、实体类2、mapper接口3、mapper.xml4、Servicce接口5、Impl实现6、Controller控制器7、全局异常处理类GlobalExceptionGlobalExceptionHandler8、工具类MD5UtilUUIDUtilCookieUtilV…

消息批处理端口说明

为满足用户需要对多文件做批处理的需求,在2022版本的知行之桥中,开发人员开发设计了3个新的端口,分别是Batch Create 端口、Batch Merge 端口和Batch Split 端口。 功能是对传入端口的消息做批处理,使得消息可以在批处理组中分组在…

mybatis-plus分布式id重复问题

问题起因 k8s 部署的一个服务的两个节点集群 最近频繁报错,数据库主键ID重复,导致数据插入报错 问题定位 还在定位。。。。 问题解决 解决办法主要有两个 指定mybatis-plus workerId dataCenterId 全局配置 #注意这里使用的随机策略 随机区间 …

智能边缘网关

背景介绍 调研发现,数字经济为工业物联网、智能交通以及智慧医疗等场景提出了新的解决方案。工程师利用传感器边缘网关云服务器的系统架构,通过大数据及人工智能算法进行辅助决策,最终为工业设备赋能,提高加工生产效率。近年来&am…

sqli-labs 11~14 多命通关攻略(报错注入)

sqli-labs 11~14 多命通关攻略(报错注入)描述判断注入类型返回结果错误输入总结符号注释判断返回结果中的列数判断返回结果中的列数为 1判断返回结果中的列数为 2报错注入通过报错注入爆破数据库中的表名通过报错注入爆破数据库中的表名(逻辑…

【高阶数据结构】封装unordered_map 和 unordered_set

🌈欢迎来到数据结构专栏~~封装unordered_map 和 unordered_set (꒪ꇴ꒪(꒪ꇴ꒪ )🐣,我是Scort目前状态:大三非科班啃C中🌍博客主页:张小姐的猫~江湖背景快上车🚘,握好方向盘跟我有一起打天下嘞&…

【北京理工大学-Python 数据分析-3.1Pandas库的基本使用】

Pandas库的引用,常用两大功能Series(一维)和DataFrame(二维和多维) Pandas是Python第三方库,提供高性能易用数据类型的分析工具。 Pandas基于NumPy实现,常与NumPy和Matplotlib一起使用。 Numpy和Pandas的…

SpringCloud-Netflix学习笔记03——什么是Eureka

什么是Eureka Eureka:怎么读? Netflix 在设计Eureka 时,遵循的就是AP原则。 1、CAP原则又称CAP定理,指的是在一个分布式系统中 2、一致性(Consistency) 3、可用性(Availability) 4、…

详细实例说明+典型案例实现 对动态规划法进行全面分析 | C++

第三章 动态规划法 目录 ●第三章 动态规划法 ●前言 ●一、动态规划法是什么? 1.简要介绍 2.生活实例 ●二、动态规划法对斐波那契数列的优化 1.优化方法 2.优化核心代码片段 3.代码实现以及结果展示 ●三、动态规划法的典型案例——最短总距离 …

c语言文件操作(万字解析)

c语言文件操作一.文件的打开与关闭1.文件指针-FILE*2.文件的打开与关闭二.文件的顺序读写1.字符操作函数-fgetc和fputc2.字符串操作函数-fgets和fputs3.格式化函数-fprintf和fscanf4.二进制函数-fread和fwrite5.对比一组函数三.文件的随机读写1.fseek和ftell2.调整指针-rewind四…

Python NumPy 数组索引

前言NumPy(Numerical Python的缩写)是一个开源的Python科学计算库。使用NumPy,就可以很自然地使用数组和矩阵。NumPy包含很多实用的数学函数,涵盖线性代数运算、傅里叶变换和随机数生成等功能。本文主要介绍Python NumPy 数组索引…

动态内容管理

这期我们来看动态内存管理的相关知识,话不多说,我们来看今天的正题 目录 1.为什么要有动态内存管理? 2.动态内存函数的介绍 2.1.malloc和free 2.2.calloc 2.3.realloc 3. 常见的动态内存错误 3.1 对NULL指针的解引用操作 3.2 对动态开…

Pytorch DataLoader中的num_workers (选择最合适的num_workers值)

一、概念 num_workers是Dataloader的概念,默认值是0。是告诉DataLoader实例要使用多少个子进程进行数据加载(和CPU有关,和GPU无关) 如果num_worker设为0,意味着每一轮迭代时,dataloader不再有自主加载数据到RAM这一步骤&#xff0…

滑动列表中使用粒子特效层级问题

前言 前面几个月疯狂堆功能,现在开始疯狂加动效,每次一说到动效就脑壳痛,还不如让我写功能。这不,今天又遇到问题了。滑动列表中mask粒子特效问题遮挡。 情况1 步骤1:使用粒子特效的层级应该>当前ui层级。 例如:当前界面所在层级为2000,其上的粒子特效至少为2001。…

dp(八)买卖股票的最好时机 (一,二、三)

目录 买卖股票的最好时机(一)_牛客题霸_牛客网 买卖股票的最好时机(二)_牛客题霸_牛客网 买卖股票的最好时机(三)_牛客题霸_牛客网 假设你有一个数组prices,长度为n,其中prices[i]是股票在第i天的价格,请根据这个价格数组,返回买…

基于云的文档管理系统:DocuWare Cloud

云文档管理软件:DocuWare Cloud 一流的云文档管理软件和工作流自动化内容服务,适用于任何规模的团队和公司——在多租户云平台上交付。 DocuWare Cloud 可在订阅的基础上为不同规模的公司提供灵活的许可证。 每个订阅都涵盖全方位的服务,包…

dvwa中的爆破

环境:dvwa: 192.168.11.135 dvwa版本: Version 1.9 (Release date: 2015-09-19)kail机器:192.168.11.1561、Low级别代码:1、启动 burpsuite 开始抓包,然后点击 login,然后在 bp 里面就能看见抓包到的包。这…

Java集合常见面试题(二)

Collection 子接口之 List ArrayList 和 Vector 的区别? ArrayList 是 List 的主要实现类,底层使用 Object[]存储,适用于频繁的查找工作,线程不安全 ;Vector 是 List 的古老实现类,底层使用Object[] 存储&#xff0…

谷粒学院复习

一、Mybatis Plus复习分布式系统唯一ID主键策略(面试)面试的时候就说知道有以下四种策略,分别介绍一下每一种,然后说一下项目中用的是雪花算法分类自动增长 AUTO INCREMENT就是自动增长,每次都会自动加一。缺点:如果在分库分表的场…

VUE: Vue3+TS的项目搭建及基础使用

简介 通过 Vue-cli4 创建的 Vue3TS 的项目,并进行一些基础使用的举例。 项目搭建 1. 进入命令提示符窗口 在要搭建项目的文件夹中,点击路径,输入CMD并按回车 2. 查看node版本、Vue-cli版本 2.1 node版本(14.x以上&#xf…