【2023年第十一届泰迪杯数据挖掘挑战赛】A题:新冠疫情防控数据的分析 32页和40页论文及实现代码

news2024/11/18 9:24:56

请添加图片描述

【2023年第十一届泰迪杯数据挖掘挑战赛】A题:新冠疫情防控数据的分析 32页和40页论文及实现代码

相关链接

(1)建模方案

【2023年第十一届泰迪杯数据挖掘挑战赛】A题:新冠疫情防控数据的分析 建模方案及python代码详解

(2)相关赛题论文

【2023年第十一届泰迪杯数据挖掘挑战赛】A题:新冠疫情防控数据的分析 32页和40页论文及实现代码

【2023年第十一届泰迪杯数据挖掘挑战赛】B题:产品订单的数据分析与需求预测 23页论文及实现代码

【2023年第十一届泰迪杯数据挖掘挑战赛】C题:泰迪内推平台招聘与求职双向推荐系统构建 27页论文及实现代码

1 题目

一、背景

自2019年底至今,全国各地陆续出现不同程度的新冠病毒感染疫情,如何控制疫情蔓 延、维持社会生活及经济秩序的正常运行是疫情防控的重要课题。大数据分析为疫情的精准 防控提供了高效处置、方便快捷的工具,特别是在人员的分类管理、传播途径追踪、疫情研 判等工作中起到了重要作用,为卫生防疫部门的管理决策提供了可靠依据。疫情数据主要包 括人员信息.csv、场所信息.csv、个人自查上报信息.csv、场所码扫码信息.csv、核酸采样检测信息.csv、疫苗接种信息.csv。本赛题提供了某市新冠疫情防疫系统的相关数据信息,请根据这些数据信息进行综合分 析,主要任务包括数据仓库设计、疫情传播途径追踪、传播指数估计及疫情趋势研判等。

(1)人员信息表:附件2.csv

序号字段名字段说明字段类型默认值
1user_id人员id:人员的唯一标识bigint(20)
2openid微信OpenIDvarchar(64)null
3.gender性别:男、女varchar(2)null
4nation民族varchar(20)null
5age年龄intnull
6birthdate出生日期varchar(20)null
7create_time创建时间timestampnull

(2)场地信息表:附件3.csv

序号字段名字段说明字段类型默认值
1grid_point_id场所id:场所的唯一标识bigint(20)
2name场所名varchar (255)null
3.point_type场所类型varchar (50)nnulnulll
4x_coordinateX坐标(单位:米)decimal(12,2)null
5y_coordinateY坐标(单位:米)decimal(12,2)null
6create_time创建时间timestampnull

(3)个人自查上报信息表:附件4.csv

NO.字段名字段说明字段类型默认值
1sno序列号:自查记录的唯一标 识bigint(20)
2user_id人员ID:对应于"人员信息表"中的user_id . ID长整型数字(20)
3.x_coordinate上报地点的x坐标小数(12,2)null
4y_coordinate上报地点的y坐标小数(12,2)null
5symptom症状:1 发热、2 乏力、3 干 咳、4 鼻塞、5 流涕、6 腹泻、 7 呼吸困难、8 无症状varchar (100)null
6nucleic_acid_result核酸检测结果:0 阴性、1 阳 性、2 未知(非必填)varchar (10)null
7resident_flag是否常住居民:0未知,1是,2否intnull
8dump_time上报时间timestampnull

(4)场所码扫码信息表:附件5.csv

序号字段名字段说明字段类型默认值
1sno序列号:扫码记录的唯一标 识bigint(20)
2grid_point_id场所ID:对应于"场所信息表"中的grid_point_idbigint(20)
3user_id人员ID:对应于"人员信息表"中的user_id . IDbigint(20)
4temperature体温doublenull
5create_time扫码记录时间timestampnull

(5)核酸采样检测信息表:附件6.csv

序号字段名字段说明字段类型默认值
1sno序列号:核酸采样记录的唯 一标识bigint(20)
2user_id人员ID:对应于"人员信息表"中的user_id . IDbigint(20)null
3cysj采样日期和时间timestampnull
4jcsj检测日期和时间timestampnull
5jg检测结果:阴性、阳性、未 知varchar (50)null
6grid_point_id场所ID:对应于"场所信息表"中的grid_point_idbigint(20)

(6)疫苗接种信息表:附件7.csv

序号字段名字段说明字段类型默认值
1sno序列号:疫苗接种记录的唯 一标识bigint(20)
2inject_sn接种流水号varchar(50)
3user_id人员ID:对应于"人员信息表"中的user_id . IDvarchar(50)
4age接种者年龄intnull
5gender性别:1 男、2 女varchar(10)null
6birthdate出生日期varchar(50)null
7inject_date接种日期timestampnull
8inject_times针次:1 第一针、2 第二针、 3 加强针varchar(30)null
9vaccine_type疫苗类型:1 灭活疫苗、2 重 组蛋白疫苗、3 病毒载体疫 苗、4 核酸疫苗、5 减毒疫苗varchar(30)null

二、问题

  1. 根据核酸检测中阳性人员的出行时间与场所追踪密接者,将结果保存到“result1.csv”文件中,文件模板格式如下
序号密接者ID密接日期密接场所ID阳性人员ID
  1. 由问题1的结果,根据密接者的出行时间与场所追踪相应的次密接者,将结果保存到“result2.csv”文件中,文件模板如下。
序号次密接者ID次密接日期次密接场所ID密接者ID
  1. 建立模型,分析接种疫苗对病毒传播指数的影响。

  2. 根据阳性人员的数量及辐射范围,分析确定需要重点管控的场所。

  3. 为了更精准地进行疫情防控和人员管理,你认为还需要收集哪些相关数据。基于这些数据构建模型,分析其精准防控的效果。

注在解决上述问题时,要求结合赛题提供的数据信息表建立数据仓库,实现数据治理的内容,请在论文中明确阐述做了哪些数据治理工作,具体是如何实现的。

2 论文一介绍

新冠疫情防控数据的分析 --基于机器学习算法的大数据分析

摘要

自新冠疫情发生以来,这一感染性极强的病毒在全球呈现爆发式的蔓延和增长,对全球的社会经济和人类的日常生活都造成了极大的影响。因此,对于疫情的防控和治疗措施对于全球而言都是及其重要的一个课题。

本文主要是基于题目所给的自疫情发生以来所记录的部分数据,运用Python对数据进行清洗和处理,确定密接者和次密接者的信息,结果导出在result1.csv和result2.csv文件中,使疫情防控更为精确而有效;其次,根据人员接种疫苗前后的感染情况,运用SEIR传染病模型求解病毒传播指数,运用卡方检验和皮尔逊、斯皮尔曼等级相关系数进行相关性检验,以此求解不同人群在不同场合感染、传播病毒的速率,结果表明,接种疫苗能够减缓病毒传播速度;最后,再根据阳性人员的密集程度将重点防控区域落于公共交通场所,社区住所,以及学校和各大娱乐场所,以便达到更好的疫情防控效果。此外,根据分析我们还发现如果将成年人视为重点防控人员,可以在一定程度上减缓病毒传播的速度,从而达到一定的防控效果。

基于此次数据调查与分析,希望可以给疫情防控带来一定的可行措施,使疫情防控更为精确化,减缓病毒的传播速率;此外,对于机器学习算法在解决现实问题中的运用,可以大大降低人力资源的浪费,更高效的解决实际问题。

**关键字:**机器学习算法, SEIR传染病模型,卡方检验, 皮尔逊、斯皮尔曼等级相关系数

在这里插入图片描述

3 论文二介绍

基于机器学习新冠疫情防控趋势研判

摘要

由于各地陆续出现不同程度的新冠病毒感染疫情,如何控制疫情蔓延、维持社会生活及经济秩序的正常运行是疫情防控的重要课题。基于该背景下,大数据分析为疫情情况的预测和峰值提高重要参照,提高治理效率,降低人员伤亡,出台符合中国国情的疫情应对措施。大数据特别是在人员的分类管理、传播途径追踪、疫情研判等工作中起到了重要作用,为卫生防疫部门的管理决策提供了可靠依据。

本文就新冠疫情防控情趋势研判,提出了创新性的解决方法:使用K-近邻(KNN)机器学习算法来找到与阳性人员有过密切接触的其他人员,且使用 KNN算法来实现次密接者追踪,还引用了机器学习线性回归模型进行分析探究接种疫苗和病毒指数的影响,再根据热力图和机器学习K-Means聚类算法找出阳性人员的数量及辐射范围,分析确定需要重点管控的场所,最后使用时空分析方法分析人员流动的有向图和使用聚类分析算法将地点划分为不同的聚类,再结合数据治理的知识,对疫情防控和人员管理提供更加精准的决策参考。

关键字:

k-近邻(KNN) 线性回归 机器学习 K-Means聚类

在这里插入图片描述

4 获取方式

电脑浏览器打开

(1)第一篇

(2)第二篇

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/485560.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【初学人工智能原理】【4】梯度下降和反向传播:能改(下)

前言 本文教程均来自b站【小白也能听懂的人工智能原理】,感兴趣的可自行到b站观看。 本文【原文】章节来自课程的对白,由于缺少图片可能无法理解,故放到了最后,建议直接看代码(代码放到了前面)。 代码实…

《LearnUE——基础指南:开篇—2》——准备工作

目录 0.2.1 UE的获取与创建项目 0.2.2 UE4编辑器界面布局 1. 编辑器介绍 2. 新建蓝图与蓝图拖动 3. 菜单介绍 4. 工具栏介绍 0.2.3 学习资料 0.2.1 UE的获取与创建项目 登录UE官网:www.unrealengine.com 点击“登录”,如果没有账号&#xff0…

自动驾驶——离散系统LQR的黎卡提方程Riccati公式推导与LQR工程化

1.LQR Question Background 之前写过连续系统的黎卡提方程Riccati推导,但是考虑到实际工程落地使用的是离散系统,于是又进行了离散黎卡提方程Riccati的公式推导。 2.Proof of Riccati Equation Formula for Discrete Systems 工程化落地,就是使用公式(2-14)实时计算控制率…

Windows编译安装AzerothCore魔兽世界开源服务端Lua脚本引擎Eluna和防作弊anticheat模块教程

Windows编译安装AzerothCore魔兽世界开源服务端Lua脚本引擎Eluna和防作弊anticheat模块教程 大家好,我是艾西今天和大家聊聊魔兽世界游戏内的脚步以及防作弊模块 Eluna是azerothcore服务端的Lua脚本引擎,可以在原有azerothcore的基础上实现很多拓展以及…

Linux操作系统指令(1)

目录 一、什么是Linux操作系统?二、Linux基本指令12.1 ls指令2.2 pwd指令2.3 cd指令2.4 touch指令2.5 mkdir指令(非常重要)2.6 rmdir指令 && rm 指令(十分重要)2.7 man指令(非常重要)2.…

基于松鼠算法的极限学习机(ELM)回归预测-附代码

基于松鼠算法的极限学习机(ELM)回归预测 文章目录 基于松鼠算法的极限学习机(ELM)回归预测1.极限学习机原理概述2.ELM学习算法3.回归问题数据处理4.基于松鼠算法优化的ELM5.测试结果6.参考文献7.Matlab代码 摘要:本文利用松鼠算法对极限学习机进行优化,并…

设计模式-创建型模式-(工厂、简单工厂、抽象工厂)

一、简单工厂模式 上代码 public class FoodFactory {public static Food makeFood(String name) {if (name.equals("noodle")) {Food noodle new LanZhouNoodle();noodle.addSpicy("more");return noodle;} else if (name.equals("chicken")…

Java中的注解和反射

注解 在Java程序中,我们可以在很多地方看到注解,如一下情况: 注解有检查和约束的作用 内置注解 当被Deprecated注解修饰的方法被使用的时候,方法会被画上杠: 元注解 当我们打开一个注解的时候,可以看到以下这些信…

一份标准的软件测试方案模板

第一章 概述 ​ 软件的错误是不可避免的,所以必须经过严格的测试。通过对本软件的测试,尽可能的发现软件中的错误,借以减少系统内部各模块的逻辑,功能上的缺陷和错误,保证每个单元能正确地实现其预期的功能。检测和排…

ROS 视觉建图不显示点云

I 乐视摄像头找不到彩色输出(供参考) 1.安装依赖 sudo apt install ros-$ROS_DISTRO-rgbd-launch ros-$ROS_DISTRO-libuvc ros-$ROS_DISTRO-libuvc-camera ros-$ROS_DISTRO-libuvc-ros2.进入ROS摄像机目录 cd /home/wheeltec/wheeltec_robot/src/ros_…

[计算机图形学]动画与模拟:关键帧动画、质点弹簧系统、运动学与绑定(前瞻预习/复习回顾)

一、动画的简要概念 动画和语言一样,一开始都是作为传达信息的工具。什么是动画呢?简单的理解就是让画面变成“活的”,也就是让它们能够动起来,其次需要一定的美观。在图形学上,我们可以把动画理解为建模或者是几何的一…

1.1 n阶行列式子的定义

学习目标: 掌握n阶行列式的定义和计算方法,并能够解决相关的数学问题。 学习步骤: 学习n阶行列式的定义,需要一定的抽象思维能力和数学基础。 了解基本概念和性质:在学习n阶行列式之前,需要先了解行列式…

设计模式——工厂模式(简单工厂、工厂方法、抽象工厂)

是什么? 工厂模式的目的是将创建对象的具体过程隐藏起来,从而达到更高的灵活性 工厂模式分为:简单工厂模式、工厂方法模式、抽象工厂模式; 为什么? 在Java中,万物皆是对象,我们在使用的时候…

(8) 支持向量机(下)(模型评估指标、ROC曲线)

文章目录 1 二分类SVC的进阶1.1 参数C的理解进阶1.2 二分类SVC中的样本不均衡问题:重要参数class_weight 2 SVC的模型评估指标2.1 混淆矩阵2.1.1 模型整体效果:准确率2.1.2 捕捉少数类的艺术:精确度,召回率和F1 score2.1.3 判错多…

【fluent】axial、radial、tangentia的含义和区别,axial/radial/tangentia coordination表达的意义

Reference 本文主要参考fluent的官方文档。 ANSYS FLUENT 12.0 User’s Guide - 31.2 Velocity Reporting Options 笛卡尔坐标系——Cartesian coordinate system 不管什么坐标系,都要讲究维数。这个维数根据问题难度确定,对于3D问题需要用三维坐…

魔兽服务端编译部署NPCBots和 Al机器人模块教程

魔兽服务端编译部署NPCBots和 Al机器人模块教程 大家好,我是艾西。在平时自己一个人玩魔兽的时候是不是会比较无聊,因为游戏机制或副本难度自己一个人无法进行快乐的玩耍。今天艾西教大家编译部署NPCBots和 Al机器人模块,直接一个人玩魔兽也…

Python研究生组蓝桥杯(省二)参赛感受

为什么参加蓝桥杯? 今年是读研的第一年,看着我简历上的获奖经历“优秀学生干部”“优秀志愿者”“优秀毕业生”......大学四年,我竟然没有一次竞赛类的经历,也没有拿得出手的项目,我陷入了深深的焦虑。 听说蓝桥杯的…

FLstudio21支持中文语言及水果最新版本功能特点

水果的话,我用的版本是去年刚更新的FLstudio21,目前支持中文挺友好的,算很新的版本了。打开软件进入主界面,会看到如下图所示。FL Studio 21版不仅拥有非常多的音频编辑功能,而且这款软件还内置了丰富多样的插件&#…

云服务器部署python项目

前言:相信看到这篇文章的小伙伴都或多或少有一些编程基础,懂得一些linux的基本命令了吧,本篇文章将带领大家服务器如何部署一个使用django框架开发的一个网站进行云服务器端的部署。 文章使用到的的工具 Python:一种编程语言&…

每天一道算法练习题--Day19 第一章 --算法专题 --- ----------回溯

回溯 回溯是 DFS 中的一种技巧。回溯法采用 试错 的思想,它尝试分步的去解决一个问题。在分步解决问题的过程中,当它通过尝试发现现有的分步答案不能得到有效的正确的解答的时候,它将取消上一步甚至是上几步的计算,再通过其它的可…