2023年深圳杯A题赛题详细解析1.1版本

news2024/11/16 19:39:12

A题  影响城市居民身体健康的因素分析

附件A1是某市卫生健康研究部门对部分居民所做的“慢性非传染性疾病及其相关影响因素流行病学”调查问卷表,附件A2是相应的调查数据结果,附件A3是中国营养学会最新修订的《中国居民膳食指南》中为平衡居民膳食提出的八条准则。

图片

  给出的数据涉及调查问卷,虽然得到的问卷结果很好。但是我认为这依旧属于问卷类比赛,所以问卷的信度效度检验,一些问卷类赛题需要做的环节,个人建议可以仿照学习一下。因此,给大家找了正大杯(问卷类比赛中国赛的地位)的优秀论文,大家可以参考着进行类似于问卷处理即可。

图片

数据分析,给出的附件二数据可以大致根据附件一问题设置,分成大致几类一级指标。图中颜色,主要涉及不同的题目,蓝色涉及问题三、黄色绿色涉及到问题二题目。

图片

   数据预处理,包含降维、异常值、缺失值等操作。这里展示异常值问题,例如 吸烟问题  ID12342 1963年出生的人,问卷结果显示不抽烟,但是每天吸烟7根,一周吸烟7次。一定是一个不对的数据为异常值。后续,关于其他的处理还需要我进行实际操作才能给大家分享更加详细的处理。

图片

问题1、参考附件A3,分析附件A2中居民的饮食习惯的合理性,并说明存在的主要问题。

数据处理+分析

对于问题一,分析居民的饮食习惯合理性即对给出数据进行分析,给出必要文字描述即可。这里问题一实质上出题人的想法应该是,让大家简单的对题目给出的数据以及参考资料进行分析描述,做一个初步的处理。方法类似于语文建模,对较为关键的因素指标进行单因素描述性分析即可。

我认为主要可以参考附件三中,八准则的三四五条判定饮食的合理性。

图片

问题2 、分析居民的生活习惯和饮食习惯是否与年龄、性别、婚姻状况、文化程度、职业等因素相关。

降维处理+相关性分析

对于问题二,问题实质为分析生活习惯和饮食习惯两个变量与其他给出数据指标的相关性(可以看做是单一变量对多变量的多元分析问题,相关方法可以参考司守奎老师第十章多元分析这一章)。切记!!问题二不要分析的过于深,问题二三是一个整体是层层递进的过程,没必要在问题二全部分析完毕。

问题3 、根据附件A2中的数据,深入分析常见慢性病(如高血压、糖尿病等)与吸烟、饮酒、饮食习惯、生活习惯、工作性质、运动等因素的关系以及相关程度。

对于问题三,可以理解为问题二的深入分析,虽然不再是问题二的生活习惯和饮食习惯两个变量。而是,直接想让我们得出常见慢性病与其他各个指标相关程度,换而言之,想让我们得出确切的函数表达式(用以描述两个变量与其他指标的函数关系,类似于得出y=k1x1+k2x2+k3x3+b这样的结果。

对于问题三,直接去分析常见慢性病与其他200多个指标的相关性,一定是不可取的。因此,我认为问题二三的处理应该涉及数据降维工作,即对于有较多指标的饮食习惯进行降维处理后。再建立类似于得出y=k1x1+k2x2+k3x3+b的模型会更加合适。

问题4 、依据附件A2中居民的具体情况,对居民进行合理分类,并针对各类人群提出有利于身体健康的膳食、运动等方面的合理建议。

对于问题四,题目中提及的进行对居民进行合理分类,我们可以选择一些分类模型,得出合理的结果就可以,类似于Q型、R型聚类分析等。也可以参考正大本的论文,该问题类似于正大杯中,我们去把客户进行分类,挖掘潜在用户。可以参考一下。

文中提及资料 点击 阅读原文 获取

注记:

该思路更新至7.27 后续可能也会根据大家的评论进行必要修改。个人拙见,希望大家理解。

1、调查问卷

问卷信度和效度

参考正大杯的优秀论文(问卷类)

2、数据预处理

异常值 例如 吸烟问题 ID12342 1963年出生的人,问卷结果显示不抽烟,但是每天吸烟7根,一周吸烟7次。一定是个不对的数据为异常值。

3、问题实质

问题一、数据处理+数据分析

问题二、数据降维+相关性分析 多元分析(十课时保奖课第五六课时提及过)

问题三、数据降维+确定性函数关系

问题四、分类

4、问题四思路可以沿用正大杯论文中潜在用户挖掘这一类型的做法。

文中提及资料 点击 阅读原文 获取

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/800668.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

UG NX二次开发(C#)-参数化修改三维模型中的文字

文章目录 1、前言2、在UG NX中创建一个带文字的三维模型3、创建一个UI界面4、 NXOpen二次开发实现5、测试1、前言 在UG NX中通过表达式不仅能修改尺寸参数、位置参数,也能修改文字,通过设计一个UI 界面,使得文字根据输入值的变化而变化,本文就针对三维模型中得文字来讲一下…

LeakCanary内存泄漏检测框架分析。

一、什么叫内存泄漏、内存溢出? 内存溢出(out of memory):是指程序在申请内存时,没有足够的内存空间供其使用,出现out of memory;比如申请了一个integer,但给它存了long才能存下的数,那就是内存溢出。 内…

JavaEE——Bean的生命周期

目录 1、实例化Bean 2、设置Bean的属性 3、初始化Bean (1)、执行通知 (2)、初始化的前置方法 (3)、初始化方法 (4)、执行自定义方法 (5)、初始化的后置…

js读取接口返回的最快的那一个

promise.race 顾名思义,Promse.race就是赛跑的意思,意思就是说,Promise.race([p1, p2, p3])里面哪个结果获得的快,就返回那个结果,不管结果本身是成功状态还是失败状态。 Promise.race([this.$axios.get("api/on…

UiPath-TTS

UiPath-Text to Speech既TTS应用 缘起原理法一 - Invoke Method法二 - Invoke Code 总结 缘起 不知道大家有没有使用过Excel的Read Cell功能或者智能音箱,实用性因场景而异,但是很好玩。回到RPA应用中,大家想象一下,如果你给自己…

STM32的CAN外设简介

目录 STM32的CAN外设简介 CAN框图剖析 CAN控制内核 工作模式 位时序及波特率 CAN发送邮箱 CAN接收FIFO 验收筛选器(重点) 整体控制逻辑 STM32的CAN外设简介 STM32的芯片中具有bxCAN控制器 (Basic Extended CAN 基本扩展CAN外设),它支…

executor.CoarseGrainedExecutorBackend: RECEIVED SIGNAL TERM

Bug现象 spark程序运行正常,但是查看web ui的时候如下图所示: 查看executor logs发现: ERROR executor.CoarseGrainedExecutorBackend: RECEIVED SIGNAL TERM原因分析 首先程序能够正常运行,只是发现某些executor状态为Dead了,说明该executor被移除了,至于为什么会被…

代码随想录算法训练营第二天| 977

977. 有序数组的平方y 思路,原数组是有序的,但是因为负数平方后可能变无序了,因此利用双指针遍历原数组,比较 nums[left]*nums[left]和nums[right]*nums[right]谁更大,然后对新数组赋值 class Solution {public int…

爬虫003_pycharm的安装以及使用_以及python脚本模版设置---python工作笔记021

这里我们用ide,pycharm来编码,看一看如何下载 这里我们下载这个社区办,这个是免费的,个人版是收费的 然后勾选以后 安装以后我们来创建一个项目 这里可以选择python的解释器,选择右边的... 这里我们找到我们自己安装的python解释器

SpringBoot——数据层三组件之间的关系

简单介绍 在之前的文章中,我们介绍了一下SpringBoot中内置的几种数据层的解决方案,在数据层由三部分组成,分别是数据库,持久化技术以及数据源,但是我今天写着写着,突然就想不起来这三部分到底是干什么的了…

助你丝滑过度到 Vue3 生命自定义hooktoRef ②⑥

作者 : SYFStrive 博客首页 : HomePage 📜: VUE3~TS 📌:个人社区(欢迎大佬们加入) 👉:社区链接🔗 📌:觉得文章不错可以点点关注 👉…

TCP状态转换图

TCP状态转换图 了解TCP状态转换图可以帮助开发人员查找问题. 说明: 上图中粗线表示主动方, 虚线表示被动方, 细线部分表示一些特殊情况, 了解即可, 不必深入研究. 对于建立连接的过程客户端属于主动方, 服务端属于被动接受方(图的上半部分) 而对于关闭(图的下半部分), 服务端…

JVM内存的变化

我举得,从空间的角度去理解java的运行,能更深刻的帮助我们学习后面“面向对象”的知识。因此,单独拿出一章,来解释内存的变化。以程序为实例进行判断。 需要一点JVM运行时的内存状态知识点基础。 参考博客: 这种是不…

ubuntu20.04 安装 Qt5.15

目录 安装前工作 选择安装QT的哪个版本 安装时候选择哪些组件 安装Qt5.15 在线安装 我选择的组件 源码包安装 测试 安装前工作 ubuntu20.04.3安装Qt6.22操作步骤_ubuntu安装qt6_sonicss的博客-CSDN博客 # 安装g、gcc编译器 sudo apt-get install build-essential 安装l…

leetcode 455. 分发饼干

2023.7.27 今天起福州要刮台风了,不过还是在宿舍坚持每日一题。 今天开始刷的系列属于贪心算法系列。本题是贪心算法的一个入门题。 贪心算法总体思路就是先找局部最优,在一步步的找出全局最优。 本题很明显全局最优就是 需要尽可能多投喂更多的孩子。…

「双指针技巧解决一些数组问题」

文章目录 0 分类1 快慢指针刷题1.1 删除有序数组中的重复项题解Code结果 1.2 删除排序链表中的重复元素题解Code结果 1.3 移除元素题解Code结果 1.4 移动0题解Code 2 左右指针刷题2.1 二分查找2.2 两数之和 II - 输入有序数组题解Code结果 2.3 反转字符串题解Code结果 2.4 最长…

品牌渠道管理的逻辑

无规矩不成方圆,规则确定了,接下来就是推行这个规则并且执行落地就可以,所以明确问题制定规则就非常重要。这个原则也适用于品牌渠道管理工作,品牌面对经销商低价乱价等问题时,如果仅用打击一种方式去管理,…

Component template should contain exactly one root element

在vue中报错: Component template should contain exactly one root element. If you are using v-if on multiple elements, use v-else-if to chain them instead报错的大致意思是:组件的模板应该只能包含一个根元素,也就是是说作为元素的直…

科技项目验收测试:验证软件产品功能与性能的有效手段

科技项目验收测试是验证软件产品功能与性能的重要手段,在项目开发中起到了至关重要的作用。本文将从产品质量、需求验证、性能测试等方面,探讨科技项目验收测试的有效手段。 1、产品质量保证是验收测试的核心 科技项目验收测试的核心目标是验证软件产品…