【楚怡杯】职业院校技能大赛 “Python程序开发”赛项样题六

news2024/9/20 7:58:00

模块一:网络爬虫(20分)

任务一:获取网站数据

【任务说明】

数据是很多企业的生命,没有数据就没有一切。企业首先要解决的问题就是数据问题,那么获取数据的手段有很多种,其中爬虫就是性价比最高的一种。现有一个天气网站,网站上有大量城市关于天气相关指数等数据,请根据具体要求,编写爬虫实现数据抓取。

【任务要求】

以网站首页为入口,从该页面获取青岛、开封、苏州、扬州、烟台、丽江、桂林、三亚、厦门、大理共10个城市的历史天气数据,抓取字段见表一。

表一:历史天气数据字段

字段

城市、日期、最高气温、最低气温、天气、风向

现需要通过爬虫抓取相应数据,具体要求如下:

1.使用requests库向url发送请求;

2.使BeautifulSoup或Xpath从响应内容中解析数据;

3.从首页中获取视频分类名和各类别链接;

4.向各类别链接发送请求,从响应内容中获取视频具体的播放、评论、点赞等数据;

5.将抓取的数据存入MySQL数据库中;

6.绕过网站的反爬虫检测;

【操作说明】

1、从虚拟机桌面“赛题/01_网络爬虫/01_获取网站数据”文件夹中获取相关项目工程代码。

2、完成任务后,根据平台“答题区”对应内容要求,完成答题报告并点击“保存”按钮实时保存。

模块二:数据清洗(30分)

任务一:数据清洗

【任务说明】

数据清洗是数据分析过程中很重要的一个环节,没有高质量的数据清洗就没有高质量的数据分析。在不准确的数据基础上做出的分析,结论将变得毫无价值和意义。

现有一份相关行业的企业数据,请根据任务要求完成数据清洗功能。

【任务要求】

数据集中有公司名、估值市值、省份、地址、城市、企业属性、成立时间、行业几个字段,请你使用NumPy和Pandas按如下要求对数据进行清洗:

1.删除空值;

2.将"成立时间"的时间戳转换成时间类型;

3.对"行业"拆分为"行业大致类别"、"行业细致类别",并删除"行业";

4.对"行业细致类别"分组查看"估值市值"的降序排序内容;

5.查看进8年以来新建的公司内容部;

6.对"企业属性"的异常值用众数填充;

7.修改列名"估值市值"为"估值市值(亿) ";

8.根据"地址"统计"估值市值"的总和;

9.查看已上市公司最多的5个城市;

10.将"成立时间"放置第二列,并只保留年月日;

11.将清洗后的数据存入MySQL数据库中。

【操作说明】

1、从虚拟机桌面“赛题/02_数据清洗/01_数据清洗”文件夹中获取相关项目工程代码。

2、完成任务后,根据平台“答题区”对应内容要求,完成答题报告并点击“保存”按钮实时保存。

模块三:数据分析及可视化(30分)

任务一:独行月球电影每日评论数分析

【任务说明】

现有独行月球电影每日评论数据,请根据任务要求完成数据分析。

【任务要求】

读取所需数据集后对数据进行必要的清洗,绘制出面积图并用Django框架渲染到前端页面,绘图要求如下:

1.使用PyEcharts库绘制面积图;

2.整个画布大小宽为700px,高为400px,背景颜色为红蓝渐变,上红下蓝,红色:rgb(235,26,67),蓝色:rgb(41,163,154);

3.x轴为日期y轴为评论条数,标签颜色都为白色透明度为0.5;

4.y轴轴线颜色为白色,宽度为3;

5.标题为"独行月球每日评论量",居中显示、字体颜色为白色

6.轴线、点边框为白色、点为红色、图元标签为白色

7.线面积部分为蓝色由上到下渐变

8.栅格线透明度为0.3

9.提示线为十字型,线类型为虚线

10.使用Django框架在前端页面中渲染展示面积图;

示意图如下:

图1:面积示意图

【操作说明】

1、从虚拟机桌面“赛题/03_数据分析及可视化/ 03_工程代码”文件夹中获取相关项目工程代码。

2、完成任务后,根据平台“答题区”对应内容要求,完成答题报告并点击“保存”按钮实时保存。

任务二:独行月球电影每日评论用户分析

【任务说明】

现有独行月球电影每日评论数据,请根据任务要求完成数据分析。

【任务要求】

读取所需数据集后,对数据进行必要的清洗,绘制出独行月球电影每日评论用户词云图。绘图要求如下:

1.随机取200个用户名,使用PyEcharts库绘制词云图;

2.画布大小宽为700px,高为500px;

3.标题为"独行月球ID词云图",字体居中显示

4.背景颜色为镜像渐变,r大小为1.2,渐变0时,设置颜色为透明色,1时为蓝色:rgb(41,163,154)

5.使用Django框架在前端页面中渲染任务一的面积图和任务二词云图;

6.示意图如下:

图2:词云图示意图

【操作说明】

1、从虚拟机桌面“赛题/03_数据分析及可视化/ 03_工程代码”文件夹中获取相关项目工程代码。

2、完成任务后,根据平台“答题区”对应内容要求,完成答题报告并点击“保存”按钮实时保存。

模块四:机器学习(15分)

任务一:房屋销售预测

任务说明】

数据主要包括2014年5月至2015年5月美国King County的房屋销售价格以及房屋的基本信息。 数据分为训练数据和测试数据,分别保存在kc_train.csv和kc_test.csv两个文件中。 其中训练数据主要包括10000条记录,14个字段,主要字段说明如下: 第一列“销售日期”:2014年5月到2015年5月房屋出售时的日期 第二列“销售价格”:房屋交易价格,单位为美元,是目标预测值 第三列“卧室数”:房屋中的卧室数目 第四列“浴室数”:房屋中的浴室数目 第五列“房屋面积”:房屋里的生活面积 第六列“停车面积”:停车坪的面积 第七列“楼层数”:房屋的楼层数 第八列“房屋评分”:King County房屋评分系统对房屋的总体评分 第九列“建筑面积”:除了地下室之外的房屋建筑面积 第十列“地下室面积”:地下室的面积 第十一列“建筑年份”:房屋建成的年份 第十二列“修复年份”:房屋上次修复的年份 第十三列"纬度":房屋所在纬度 第十四列“经度”:房屋所在经度

【任务要求】

1.读取房屋销售数据;

2.提取合适的特征;

3.对数据进行编码等预处理;

4.划分训练集和测试集;

5.构建机器学习模型;

6.编写模型训练相关代码,完成模型训练;

7.将训练好的模型进行保存;

8.使用模型进行预测。

【操作说明】

1、从虚拟机桌面“赛题/04_机器学习/01_房屋销售预测”文件夹中获取项目工程文档。

2、完成任务后,根据平台“答题区”对应内容要求,完成答题报告并点击“保存”按钮实时保存。

任务二:工业蒸汽量预测

【任务说明】

火力发电的基本原理是:燃料在燃烧时加热水生成蒸汽,蒸汽压力推动汽轮机旋转,然后汽轮机带动发电机旋转,产生电能。在这一系列的能量转化中,影响发电效率的核心是锅炉的燃烧效率,即燃料燃烧加热水产生高温高压蒸汽。锅炉的燃烧效率的影响因素很多,包括锅炉的可调参数,如燃烧给量,一二次风,引风,返料风,给水水量;以及锅炉的工况,比如锅炉床温、床压,炉膛温度、压力,过热器的温度等。

【任务要求】

1.读取蒸汽量数据;

2.对数据进行清洗以及预处理;

3.特征提取以及特征工程;

4.划分训练集及测试集;

5.选取合适的机器学习模型;

6.使用数据训练模型并进行模型调优;

7.根据锅炉的工况,预测产生的蒸汽量;

8.将训练好的模型进行保存。

【操作说明】

1、从虚拟机桌面“赛题/04_机器学习/02_工业蒸汽量预测”文件夹中获取项目工程文档。

2、完成任务后,根据平台“答题区”对应内容要求,完成答题报告并点击“保存”按钮实时保存。

职业素养(5分)

【任务要求】

参赛选手操作规范、代码清晰易读、遵守考场纪律、收纳整理干净整洁、文明竞赛。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1985058.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

市值1.3亿的厂房,1.8万就被捡漏了 究竟是馅饼还是陷阱

建筑总面积达9550.64平方米 市场价为1.3亿元的厂房 被1元钱起拍变卖 最终成交价仅有1.8万元 每平方米房价不足2元 究竟是馅饼还是陷阱 2024年8月5日,北京市西城区人民法院的一个价值1.3亿元的厂房以18162.97元的最高价竞成交。 7 月 7 日起,北京市西…

【初阶数据结构题目】12.环形链表I

环形链表I 点击链接做题 思路:快慢指针 代码: /*** Definition for singly-linked list.* struct ListNode {* int val;* struct ListNode *next;* };*/ typedef struct ListNode ListNode; bool hasCycle(struct ListNode *head) {//快慢指针…

【机器学习】BP神经网络基本结构

🌈个人主页: 鑫宝Code 🔥热门专栏: 闲话杂谈| 炫酷HTML | JavaScript基础 ​💫个人格言: "如无必要,勿增实体" 文章目录 BP神经网络基本结构1. 引言2. BP神经网络的基本概念2.1 什么是BP神经网络2.2 BP…

性价比高的蓝牙耳机推荐?分享我的2024年开放式耳机选购指南

2024年快到下旬了,市场上的蓝牙耳机价格也是差不多都沉淀起来了。所以就性价比高的蓝牙耳机的入手时间来说,那确实是年底左右的时间挑选入手会比较好一点。 而挑选性价比高的蓝牙耳机类型呢,我会首选开放式耳机。因为就开放式耳机而言&#…

yarn insntall 报错,显示 @achrinza/node-ipc@9.2.2 不支持现在的node版本

最近执行yarn install 时,突然遇到这样一个段报错 error achrinza/node-ipc9.2.2: The engine "node" is incompatible with this module. Expected version "8 || 10 || 12 || 14 || 16 || 17". Got "18.10.0" error Found incompa…

中创算力:以知识产权转化运用促进高质量发展

创新是引领发展的第一动力,保护知识产权就是保护创新。为深入实施知识产权公共服务普惠工程,促进知识产权公共服务更好服务高水平科技,国家知识产权局发布关于全面提升知识产权公共服务效能的指导意见。 在政策落地过程中,如何精…

《Milvus Cloud向量数据库指南》—Milvus Cloud赋能Ivy.ai:解锁大数据潜力,加速AI创新

引入Milvus Cloud:Ivy.ai的大规模全托管向量数据库解决方案新篇章 在人工智能驱动的数字化时代,数据成为了企业最宝贵的资产之一,而如何高效地管理和利用这些数据,则是决定企业能否在竞争中脱颖而出的关键因素。对于Ivy.ai这样致力于提升高等教育、医疗保健和公共部门沟通…

BM1反转链表[栈+头插法]

题目要求如下: 问题比较简单,就是将链表中的值进行反转即可。 一种比较简单的方式是使用栈链表的方式来实现,下面是相应的代码: #include <stdio.h> #include <stdlib.h> int arr[10001] {0}; struct ListNode* ReverseList(struct ListNode* head ) {if (head …

【数据结构】——介绍树

树 树的概念和结构 树是⼀种⾮线性的数据结构&#xff0c;它是由 n&#xff08;n>0&#xff09;个有限结点组成⼀个具有层次关系的集合。把它叫做树是因为它看起来像⼀棵倒挂的树&#xff0c;也就是说它是根朝上&#xff0c;⽽叶朝下的。 • 有⼀个特殊的结点&#xff0c;…

韩国裸机云站群服务器是什么?有什么优势

韩国裸机云站群服务器是什么&#xff1f;韩国裸机云站群服务器是一种提供多IP地址分配和高性能网络服务的云计算解决方案。这种服务器结合了裸机服务器与云端技术&#xff0c;具有高性能、高可靠性和灵活可扩展性的特点。它广泛应用于需要多IP管理和高稳定性的网络应用&#xf…

unity项目语言设置成中文

步骤一&#xff1a;安装简体中文包 操作&#xff1a;在unity hub界面点击安装&#xff0c;然后在安装的unity版本中点击添加模块 操作&#xff1a;选择简体中文安装包进行安装 步骤二&#xff1a;切换简体中文包 操作&#xff1a;创建一个项目&#xff08;或者打开已经创建过…

从0开始的算法(数据结构和算法)基础(五)

哈希表 哈希表是什么&#xff1f; 哈希表&#xff08;Hash Table&#xff09;是一种数据结构&#xff0c;用于快速存储和查找数据。它通过将键&#xff08;key&#xff09;映射到数组中的索引位置来实现高效的查找、插入和删除操作。 乍一看不明白很正常&#xff0c;如果你学过…

国外一个免费的PDF转图片的网站,WPS VIP才能享受的大量功能,这里都有了。

国外一个免费的PDF转图片的网站&#xff0c;WPS VIP才能享受的大量功能&#xff0c;这里都有了。https://imagestool.com/ 免费PDF转图片 等WPS收费功能 【慧哥开源充电桩平台】下载源码地址 https://liwenhui.blog.csdn.net/article/details/134773779?spm1001.2014.3001.55…

入侵检测技术

课程目标 了解需要入侵检测技术的原因 熟知入侵检测系统&#xff08;IDS&#xff09;的概念、结构、分类及作用 掌握入侵检测技术及其应用 目录 Why 为什么要学习IDS 1.防火墙不能保证绝对的安全 网络边界的设备 自身可以被攻破 对某些攻击保护很弱 不是所有的威胁来自…

分而治之?如何高效提炼大型语言模型的推理能力

人工智能咨询培训老师叶梓 转载标明出处 虽然大模型&#xff08;如GPT-4&#xff09;在开放域问答&#xff08;ODQA&#xff09;、数学、科学以及自主智能体等领域展现出了非凡的推理能力&#xff0c;但是这些模型在进行复杂推理时&#xff0c;往往需要处理大量的参数&#xff…

项目管理中,项目经理有哪些优势?

项目经理在项目管理中扮演着至关重要的角色&#xff0c;他们的优势主要体现在以下几个方面&#xff1a; 一、计划与组织能力 超强的计划能力&#xff1a;项目经理需要制定各种计划&#xff0c;因此更擅长制定精确、合理的项目计划。他们能够有效地分解项目任务&#xff0c;排…

Elastic 基于 RAG 的 AI 助手:使用 LLM 和私有 GitHub 问题分析应用程序问题

作者&#xff1a;来自 Bahubali Shetti 作为 SRE&#xff0c;分析应用程序比以往任何时候都更加复杂。你不仅必须确保应用程序以最佳方式运行以确保出色的客户体验&#xff0c;而且在某些情况下还必须了解内部工作原理以帮助排除故障。分析基于生产的服务中的问题是一项团队运动…

麒麟V10系统 arm架构 安装docker

查看服务器环境 ## 查看系统版本&#xff0c;确认版本 cat /etc/kylin-release## 操作系统 uname -p## 内核版本&#xff08;≥ 3.10&#xff09; uname -r## iptables 版本&#xff08;≥ 1.4&#xff09; iptables --version iptables v1.8.1 (legacy)# 我这边是arm64/v8 架…

首届中文NL2SQL挑战赛亚军比赛攻略_BugCreater

关联比赛: 首届中文NL2SQL挑战赛 1. 任务描述 本次比赛的任务&#xff1a;根据Question、表格信息&#xff08;包含列名、列类型、内容&#xff09;&#xff0c;预测对应的SQL语句&#xff08;下图黄色部分&#xff09;。比赛只涉及单表查询&#xff0c;需要预测的有4部分&a…

pointofix下载与调整中文

想要在屏幕上批注&#xff0c;用pointofix最好&#xff0c;本篇文章告诉你如何下载pointofix和把pointofix语言弄成中文。 首先打开pointofix官网下载pointofix的安装包。 Pointofix - Herunterladen - Downloadhttps://www.pointofix.de/download.php点击这个pointofix180de…