2024年云南省职业院校技能大赛赛程规章(大数据赛项)

news2024/9/30 3:16:13

        大家期待已久的职业院校技能大赛在各个省份已经陆续出新文件了,近日云南省的赛程规章也是出来了,我相信不仅是对云南,对其他省份也很有参考价值,小编为大家精简整理了一下文件的内容。

        一、竞赛目标

        为适应大数据产业对高素质技术技能型人才的职业需求,赛项以大数据应用开发为核心内容和工作基础,重点考查参赛选手基于Hadoop、Spark、Flink平台环境下,充分利用Spark Core、Spark SQL、Flume、Kafka、Flink、Hive、HBase、Redis、Maxwell、ClickHouse、MySQL等相关技术的特点,基于Scala、Java、JavaScript等开发语言,综合软件开发相关技术,解决实际问题的能力,激发学生对大数据相关知识和技术的学习兴趣,提升学生职业素养和职业技能,努力为中国大数据产业的发展储备及输送新鲜血液。

通过举办本赛项,可以搭建校企合作的平台,提升大数据专业及其他相关专业毕业生能力素质,满足企业用人需求,促进校企合作协同育人,对接产业发展,实现行业资源、企业资源与教学资源的有机融合,使高职院校在专业建设、课程建设、人才培养方案和人才培养模式等方面,跟踪社会发展的最新需要,缩小人才培养与行业需求差距,引领职业院校专业建设与课程改革。

        二、竞赛内容

        赛项以大数据应用开发为核心内容和工作基础,重点考查参赛选手基于Hadoop、Spark、Flink平台环境下,充分利用Spark Core、Spark SQL、Flume、Kafka、Flink、Hive、HBase、Redis、Maxwell、ClickHouse、MySQL等技术的特点,综合软件开发相关技术,解决实际问题的能力,具体包括:

        1.掌握Hadoop平台、基于Spark的离线分析平台、基于Flink的实时分析平台,在容器环境下,按照项目需求安装相关技术组件并按照需求进行合理配置;

        2.掌握基于Spark的离线数据采集方式方法,完成指定数据的抽取并写入Hive分区表中。掌握基于Flume、Maxwell的实时数据采集,将数据写入Kafka中;

        3.综合利用Flink、Kafka、Hive、Redis、HBase、ClickHouse等技术,使用Java开发语言,完成某电商系统的实时数据处理,包括使用Flink处理Kafka中的数据、实时数据仓库、将数据备份至HBase中、建立Hive外表、将数据处理结果存入Redis、ClickHouse中等操作;

        4.综合利用Spark、Hive、MySQL、HBase、ClickHouse等相关技术,使用Scala开发语言,完成某电商系统的离线数据处理,包括Hive数据仓库、使用Spark处理离线数据、数据合并、去重、排序、数据类型转换、将数据处理结果存入MySQL、HBase、ClickHouse中等操作;

        5.综合运用HTML、CSS、JavaScript等开发语言,Vue.js前端技术,结合ECharts数据可视化组件,利用后端数据接口完成数据可视化;

        6.根据竞赛过程,完成综合分析报告的编写;

        7.竞赛时间6小时,竞赛连续进行。

        三、竞赛方式

1、比赛以师生联赛方式进行,不得跨校组队,同一学校的报名参赛队伍不超过2支。

2、每个参赛队由1名领队、4名选手(1名教师、3名学生)组成,参赛选手和教师报名获得确认后不得随意更换。

3、竞赛时间6小时。

        四、竞赛时间安排

时间内容
14:00 - 18:00各参赛队报道
15:00 - 16:00领队会、赛前说明
16:00 - 16:30选手熟悉赛场
(次日)8:00 - 9:00赛场检录,竞赛选手进入赛位
9:00 - 15:00竞赛选手完成竞赛内容
16:00 - 24:00对选手提交的结果文件进行评分

        五、竞赛规则

1. 学生须为高等职业学校专科、高等职业学校本科、技师学院全日制在籍学生,五年制高职四、五年级学生也可报名参赛。凡在往届全国职业院校技能大赛中获一等奖的学生,不能再参加同一项目同一组别的比赛。参赛选手由省教育厅、省人力资源社会保障厅负责。

2. 竞赛前1日安排各参赛队领队、参赛选手熟悉赛场。

3. 严禁参赛选手、赛项裁判、工作人员私自携带通讯、摄录设备进入比赛场地。

4. 参赛选手所需的硬件、软件和辅助工具统一提供,参赛队不得使用自带的任何有存储功能的设备,如硬盘、光盘、U盘、手机、平板电脑等。

5. 所有参赛选手都必须携带参赛证件进行检录。

6. 参赛队在赛前领取比赛任务并进入比赛工位,比赛正式开始后方可进行相关操作。

7. 比赛过程中,选手须严格遵守操作规程,确保人身及设备安全,并接受裁判员的监督和指示。因选手原因造成设备故障或损坏而无法继续比赛的,裁判长有权决定中止该队比赛;非因选手个人原因造成设备故障的,由裁判长视具体情况作出裁决。

8. 竞赛开始时统一发放本阶段赛卷,竞赛结束后,参赛选手要确认已成功提交竞赛要求的配置文件和文档,裁判员与参赛选手一起签字确认,参赛选手在确认后不得再进行任何操作。

9. 赛项成绩解密后,在指定地点,以纸质形式向全体参赛队进行公布,成绩无异议后,在闭赛式上予以宣布。

        六、技术环境

(一)竞赛设备

设备类别数量设备用途基本配置
竞赛服务器

每支参赛队伍1台。

根据参赛队数量,配备10%的备份机器。

构建大数据平台集群性能相当于i5处理器,64GB以上内存,1TB以上硬盘,网卡(千兆),显示器要求1024*768以上。
竞赛客户机

每支参赛队伍4台。

根据参赛团队数量,配备10%的备份机器。
竞赛选手比赛使用性能相当于i5处理器,16GB以上内存,1TB以上硬盘,显示器要求1024*768以上。

(二)软件平台

        由2023年全国职业院校技能大赛(高职组)大数据应用开发赛项合作企业——北京四合天地科技有限公司提供四合天地大数据实训管理系统。

(三)软件环境

设备类型软件类别软件名称、版本号
竞赛服务器竞赛环境大数据集群操作系统CentOS 7、Docker-CE 20.10
大数据平台组件Hadoop 3.1.3
Hive 3.1.2
HBase 2.2.3
Spark 3.1.1
Kafka 2.4.1
Redis 6.2.6
Flume 1.9.0
Maxwell 1.29.0
Flink 1.14.0
ClickHouse 21.9.4
JDK 1.8
MySQL 5.7

开发

    客户端
PC操作系统Ubuntu18.04 64位
浏览器Chrome
开发语言Scala 2.12
Java 8
开发工具

        IDEA 2022

(Community Edition)
Visual Studio Code 1.69
数据库连接工具MySQL Workbench
SSH工具Asbru-cm或Ubuntu SSH客户端
API测试工具Postman API Platform
数据可视化组件Vue.js 3.0
ECharts 5.1
文档编辑器WPS Linux版
输入法搜狗拼音输入法 Linux版

        七、评分标准

任务考查点描述评分标准分值
大数据平台环境搭建大数据相关平台组件安装配置在指定的宿主机上,基于Docker环境完成Hadoop完全分布式、Spark、Flink、Hive、Kafka、Flume、ClickHouse、HBase等的安装配置。主要评分点包括Hadoop完全分布式安装配置、Spark安装配置、Flink安装配置、Hive安装配置、Kafka安装配置、Flume安装配置、ClickHouse安装配置、HBase安装配置。10
数据采集离线数据采集、实时数据采集按照要求基于Scala语言完成特定函数的编写,使用Spark完成离线数据采集;按照要求使用Linux命令,利用Flume、Maxwell、Kafka等工具完成实时数据采集。主要评分点包括Spark数据读取、数据存储、Flume数据采集、Maxwell数据采集、Kafka等操作。15
实时数据处理实时数据处理计算代码编写使用Java语言基于Flink完成Kafka中的数据消费,将数据分发至Kafka的dwd层中,并在HBase中进行备份同时建立Hive外表,基于Flink完成相关的数据指标计算并将计算结果存入Redis、ClickHouse中。主要评分点包括Flink数据处理、数据指标计算、HBase、Hive、ClickHouse、Redis等相关操作。25
离线数据处理离线数据处理计算代码编写使用Scala语言基于Spark完成离线数据清洗、处理、计算,包括数据的合并、去重、排序、数据类型转换等并将计算结果存入MySQL、HBase、ClickHouse中。主要评分点包括基于Spark的数据清洗、数据指标计算、HBase、Hive、ClickHouse、MySQL等相关操作。20
数据可视化数据可视化代码编写编写前端Web界面,调用后台数据接口,使用Vue.js、ECharts完成数据可视化。主要评分点包括可视化前端代码开发、前端展示。15
综合分析报告文档编写根据项目要求,完成综合分析报告编写。主要评分点包括能够按照赛项要求进行综合分析。10
职业素养职业素养团队分工明确合理、操作规范、文明竞赛。主要评分点包括:竞赛团队分工明确合理、操作规范、文明竞赛。5

        八、奖项设置

        竞赛设参赛选手团体奖。奖项设置按参赛队数量为基数确定,其中比例分别为一等奖10%,二等奖20%,三等奖30%。

        如出现参赛队总分相同情况,按照任务分值权重顺序的得分高低排序,即总成绩相同的情况下比较任务C的成绩,任务C成绩高的排名优先,如果任务C成绩也相同,则按任务D、任务B、任务A、任务E、任务F的成绩进行排名,以此类推完成相同成绩的排序。如果所有任务分值相同,则查看文档撰写规范、职业素养的分值进行排序。

        九、竞赛须知

(一)参赛队须知

1. 参赛队名称:统一使用规定的学校代表队名称,不使用其他组织、团体的名称;

2. 参赛队组成:每支参赛队由4名选手(1名教师、3名学生)组成。不接受跨校组队,同一学校的报名参赛队伍不超过2支;

3. 各参赛院校应指定1名负责人任赛项领队,全权负责该校参赛事务的组织、协调和领导工作。

4. 参赛选手在报名获得确认后,原则上不再更换。如在筹备过程中,参赛选手因故不能参赛,须由其所在学校供职部门于赛项开赛前10个工作日之前出具书面说明,经赛项执委会办公室核实后予以更换。允许队员缺席比赛;允许指导教师缺席比赛。

5. 参赛队按照赛项竞赛规程安排,凭赛项执委会颁发的参赛证和有效身份证件参加比赛及相关活动。

6. 赛项执委会统一安排各参赛队在比赛前一天进入赛场熟悉环境和设施情况。

7. 参赛队选手、领队要有良好的职业道德,严格遵守比赛规则和比赛纪律,服从裁判,尊重裁判和赛场工作人员,自觉维护赛场秩序。

8. 领队应负责赛事活动期间本队所有选手的人身及财产安全,如发现意外事故,应及时向赛项执委会报告。

9. 各学校组织代表队时,须为参赛选手购买竞赛期间的人身意外伤害保险。

(二)领队须知

1. 严格遵守赛场的各项规定,服从裁判,文明竞赛。如发现弄虚作假者,取消参赛资格,名次无效。

2. 领队务必带好有效身份证件,在活动过程中佩戴“领队证”参加竞赛相关活动。

3. 各代表队领队要坚决执行竞赛的各项规定,加强对参赛人员的管理,做好赛前准备工作,督促选手带好证件等竞赛相关材料。

4. 在比赛期间要严格遵守比赛规则,不得私自接触裁判人员。

5. 竞赛过程中,未经裁判许可,领队及其他人员一律不得进入竞赛现场。

6. 如对竞赛过程有疑议,由领队负责以书面形式向赛项仲裁委员会反映,但不得影响竞赛进行。

7. 对申诉的仲裁结果,领队要带头服从和执行,并做好选手工作。参赛选手不得因申诉或对处理意见不服而停止竞赛,否则以弃权处理。

8. 领队应及时查看有关赛项的通知和内容,认真研究和掌握本赛项竞赛的规程、技术规范和赛场要求,指导选手做好赛前的一切技术准备和竞赛准备。

(三)参赛选手须知

1. 参赛选手应严格遵守赛场规章、操作规程和工艺准则,保证人身及设备安全,接受裁判员的监督和警示,文明竞赛。

2. 参赛选手应按照规定时间抵达赛场,凭身份证、学生证,以及统一发放的参赛证,完成入场检录、抽签确定竞赛工位号,不得迟到早退。

3. 参赛选手凭竞赛工位号进入赛场,不允许携带任何电子设备及其他资料、用品。

4. 参赛选手应在规定的时间段进入赛场,认真核对竞赛工位号,在指定位置就座。

5. 参赛选手入场后,迅速确认竞赛设备状况,填写相关确认文件,并由参赛队长确认签字(竞赛工位号)。

6. 参赛选手在收到开赛信号前不得启动操作。在竞赛过程中,确因计算机软件或硬件故障,致使操作无法继续的,经裁判长确认,予以启用备用计算机。

7. 参赛选手应在竞赛规定时间内完成任务书内容,并按照要求,将相应文档拷贝到U盘。

8. 参赛选手需及时保存工作记录。对于因各种原因造成的数据丢失,由参赛选手自行负责。

9. 参赛队所提交的答卷采用竞赛工位号进行标识,不得出现地名、校名、姓名、参赛证编号等信息,否则取消竞赛成绩。

10. 竞赛过程中,因严重操作失误或安全事故不能进行比赛的(例如因操作原因发生短路导致赛场断电的、造成设备不能正常工作的),现场裁判有权中止该队比赛。

11. 在比赛中如遇非人为因素造成的设备故障,经裁判确认后,可向裁判长申请补足排除故障的时间。

12. 参赛选手不得因各种原因提前结束比赛。如确因不可抗因素需要离开赛场的,须向现场裁判举手示意,经裁判长许可并完成记录后,方可离开。凡在竞赛期间内提前离开的选手,不得返回赛场。

13. 竞赛操作结束后,参赛选手需要根据任务书要求,将相关成果文件拷贝至U盘,填写结束比赛相关确认文件,并由参赛队长签字确认(竞赛工位号)。因参赛选手未能按要求,将相应的文档等拷贝至U盘的,竞赛成绩计为零分。

14. 竞赛时间结束,选手应全体起立,停止操作。将资料和工具整齐摆放在操作平台上,经工作人员清点后可离开赛场,离开赛场时不得带走任何资料。

15. 在竞赛期间,未经执委会批准,参赛选手不得接受其他单位和个人进行的与竞赛内容相关的采访。参赛选手不得将竞赛的相关信息私自公布。

        好了,以上就是这次云南省赛程规章的大致内容了~~~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2178462.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

活动在线报名小程序源码系统 自主提交表单+创建表单 带完整的安装代码包以及搭建部署教程

系统概述 随着各类活动的日益丰富和多样化,传统的报名方式逐渐显现出其局限性。纸质报名表格繁琐易错、人工统计费时费力,难以满足现代活动管理的需求。因此,开发一款集自主提交表单和创建表单功能于一体的活动在线报名小程序源码系统成为必…

mit6824-01-MapReduce详解

文章目录 MapReduce简述编程模型执行流程执行流程排序保证Combiner函数Master数据结构 容错性Worker故障Master故障 性能提升定制分区函数局部性执行缓慢的worker(slow workers) 常见问题总结回顾参考链接 MapReduce简述 MapReduce是一个在多台机器上并行计算大规模数据的软件架…

C++进阶知识2 多态

多态 1. 多态的概念2. 多态的定义及实现2.1 多态的构成条件2.1.2 虚函数2.1.3 虚函数的重写/覆盖2.1.5 虚函数重写的⼀些其他问题2.1.6 override和final关键字2.1.7 重载/重写/隐藏的对⽐ 3. 多态的原理3.2 多态的原理3.2.1 多态是如何实现的3.2.2 动态绑定与静态绑定3.2.3 虚函…

828华为云征文|部署在线文档应用程序 CodeX Docs

828华为云征文|部署在线文档应用程序 CodeX Docs 一、Flexus云服务器X实例介绍二、Flexus云服务器X实例配置2.1 重置密码2.2 服务器连接2.3 安全组配置2.4 Docker 环境搭建 三、Flexus云服务器X实例部署 CodeX Docs3.1 CodeX Docs 介绍3.2 CodeX Docs 部署3.3 CodeX…

SpringBoot整合JPA 基础使用

一、什么是JPA ‌‌1.JPA的定义和基本概念‌‌ ‌JPA(Java Persistence API)‌是Java中用于进行持久化操作的一种规范,它定义了一系列用于操作关系型数据库的API接口。通过这些接口,开发人员可以方便地进行数据库的增删改查等操…

ArcgisEngine开发中,Ifeatureclass.Addfield 报错0x80040655处理方法

1、ArcgisEngine开发中,Ifeatureclass.Addfield 报错0x80040655。如下图所示。 2、经分析,这是由于字段类型错误,经检查,是由于字段名为中文名,超出shp格式的最大字段长度量,看资料说是5个中文字符&#xf…

fastadmin 搜索提交重置按钮文本修改

默认 修改require-backend.min.js文件 效果 当然最好还是去需修改lang文件 效果 如果修改没生效记得清楚一下缓存,再刷新 完结 赠人玫瑰,手有余香!如果文章内容对你有所帮助,请不要吝啬你的点赞评论和关注,你…

校园跑腿系统二手市场校园搭子校园社团活动系统2000的和4800的有什么区别

校园跑腿系统、二手市场、校园搭子、校园社团活动系统在不同价格档位(如2000元和4800元)之间可能存在多方面的区别,这些区别主要体现在功能丰富性、技术支持、用户体验、定制化程度以及后续服务等方面。然而,由于具体的价格差异和…

TDengine 流计算与窗口机制的深度解析:揭示计数窗口的关键作用

在 TDengine 3.2.3.0 版本中,我们针对流式计算新增了计数窗口,进一步优化了流式数据处理的能力。本文将为大家解读流式计算与几大窗口的关系,并针对新增的计数窗口进行详细的介绍,帮助大家进一步了解 TDengine 流式计算&#xff0…

趣味SQL | 从围棋收官到秦楚大战的数据库SQL实现(下)

目录 0 上集回顾 1 双先量化,得失权衡 2 各守城池,妥协攻守 3 SQL演算,三策评详 4 寸土必争,利益倍增 5 SQL再演,策略精进 6 棋道相通,治国有术 如果觉得本文对你有帮助,那么不妨也可…

这是我见过最强的AI大模型教程书籍!免费白嫖,可以上车!!

这是LLM入门级书籍,共145页,主要介绍了大型语言模型(LLM)的基本原理和底层技术。 阅读本书,您将能够掌握 LLM 的基本概念,了解自然语言处理(NLP)的发展历程,理解 Transf…

家中浮毛太多怎么办?希喂、米家、安德迈更推荐哪款?

在现代养宠家庭生活中,宠物空气净化器已经成为不可或缺的家电之一。 而在众多空气净化器类型中,宠物空气净化器以其独特的设计和卓越的净化效果,逐渐赢得了越来越多养宠家庭的青睐。 它不仅能有效地吸附空中飞舞的浮毛,还能高效…

召回10 Deep Retrieval召回

Deep Retrieval召回:给定用户特征采用beam search算法召回路径,根据路径召回物品,对物品排序,最终用分数高的物品作为召回结果。 双塔模型是将向量表征作为用户和物品之间的中介。 Deep Retrieval是将路径作为用户和物品之间的中介…

基于Java+VUE+echarts大数据智能道路交通信息统计分析管理系统的设计与实现

大数据智能交通管理系统是一种基于Web的系统架构,通过浏览器/服务器(B/S)模式实现对城市交通数据的高效管理和智能化处理。该系统旨在通过集成各类交通数据,包括但不限于车辆信息、行驶记录、违章情况等,来提升城市管理…

场地预约系统小程序的设计

管理员账户功能包括:系统首页,个人中心,用户管理,场地类型管理,场地信息管理,我的预约管理,场地使用管理 微信端账号功能包括:系统首页,场地信息,我的预约&a…

简易CPU设计入门:取指令(三),ip_buf与rd_en的非阻塞赋值

在开篇,还是请大家首先准备好本项目所用的源代码。如果已经下载了,那就不用重复下载了。如果还没有下载,那么,请大家点击下方链接,来了解下载本项目的CPU源代码的方法。 下载本项目代码 准备好了项目源代码以后&…

图形化编程-在DevC++中集成EasyX图形库

1、EasyX介绍 EasyX (EasyX Graphics Library)是针对 C/C++ 的图形库,可以帮助使用C/C++语言的程序员快速上手图形和游戏编程,可以用EasyX 很快的画一个房子,或者一辆移动的小车,也可以编写俄罗斯方块、贪吃蛇、黑白棋等小游戏,可以练习图形学的各种算法等等。 EasyX …

鸿蒙媒体开发系列15——图片解码(PixcelMap)

如果你也对鸿蒙开发感兴趣,加入“Harmony自习室”吧!扫描下方名片,关注公众号,公众号更新更快,同时也有更多学习资料和技术讨论群。 1、概述 应用开发中的图片开发是对图片像素数据进行解析、处理、构造的过程&#x…

【Linux】Docker下载与使用-nginx

目录 一、Docker介绍 二、Docker结构 三、下载Daocker 1. 在linux上下载docker,执行以下命令即可: 2. 开启docker 3. 执行以下操作并进行使用 四、在Docker上安装nginx 一、Docker介绍 Docker:是给予Go语言实现的开源项…

开发者福音!一个小型热门项目,可以在线优雅快速生成 SQL 和模拟数据(带私活源码)

GitHub上开源了一个小型热门项目,可以在线快速生成SQL和模拟数据。 这对于前端开发的同学来说,简直是一大福音,可以大幅提升调试效率。 以后,再不用等后端同学开发完数据接口再进行下一步。 一起来看看吧! 项目介绍…