2023年华数杯作为与国赛同频的比赛(都是周四6点发题,周日晚8点交卷),也是暑期唯一一个正式比赛。今年的报名队伍已经高达6000多对。基于这么多的人数进行国赛前队伍的练习,以及其他用途。为了方便大家跟更好的选题,这里首先对华数杯的C题进行思路解析,题量较大,但是问题难度为本次比赛最低。因此,选题人数相应的也可能是最多的一道。所以,如何能在众多人中脱颖而出,就需要很注意很多细节,稍后在思路讲解中也将对这些细节点进行说明。
C 题 母亲身心健康对婴儿成长的影响
以母亲相关指标与婴儿睡眠为背景引出题设。给出了一组数据集,包括 390名 3 至 12 个月婴儿以及其母亲的相关数据。这些数 据涵盖各种主题,母亲的身体指标包括年龄、婚姻状况、教育程度、妊娠时间、分娩方式,以及产妇心理指标CBTS(分娩相关创伤后应激障碍问卷)、EPDS (爱丁堡产后抑郁量表)、HADS(医院焦虑抑郁量表)和婴儿睡眠质量指标包括整晚睡眠时间、睡醒次数和入睡方式。
对于数据类型题目,上来第一步不是直接读问题,而是处理数据,对于下面这组数据集一定存在异常值、缺失值。所以,首先进行数据预处理是必须的。
例如,对于婚姻状况这种的数据。婚姻状况,未婚以及已婚,但是存在有人的婚姻状况是3、6是异常值,对于这样的数据需要处理,至于处理方法选择剔除或者进行插值处理等等,就根据队伍情况进行选择即可。
1. 许多研究表明,母亲的身体指标和心理指标对婴儿的行为特征和睡眠质量有影响,请问是否存在这样的规律,根据附件中的数据对此进行研究。
问题一,是否存在这样的规律,即进行简单的分析结果,绘制散点图,进行相关性分析即可;对于相关性分析,可以选择Pearson‘皮尔逊’相关系数、Spearman‘斯皮尔曼’相关系数或者其他的相关系数指标,进行表示是都存在这种规律就可以。切记问题一只问了请问是否存在这样的规律?是否存在 是没有必要得出具体关系表达式。切勿画蛇添足,问题一创新点主要就是散点图,大家可以画的好看一些,注重一下结果的可视化表达。
2. 婴儿行为问卷是一个用于评估婴儿行为特征的量表,其中包含了一些关于婴儿情绪和反应的问题。我们将婴儿的行为特征分为三种类型:安静型、中等型、矛盾型。请你建立婴儿的行为特征与母亲的身体指标与心理指标的关系模型。数据表中最后有20组(编号391-410号)婴儿的行为特征信息被删除,请你判断他们是属于什么类型。
问题二,婴儿行为问卷、量表题需要进行问卷信度和效度检验。具体的步骤,大家可以参考我给出的32篇正大杯优秀论文。仿照问卷类比赛优秀论文进行必要的信度效度检验。
问题二要求我们建立婴儿的行为特征与母亲的身体指标与心理指标的关系模型,即建立一个y与多个X的关系模型,最为简单的可以直接建立多元回归分析模型即可,这种方式虽然简单但是可以与问题四的回归分析模型相对应,整个论文是一个体系。也可以选择一些其他的较为复杂的模型。
3.对母亲焦虑的干预有助于提高母亲的心理健康水平,还可以改善母婴交 互质量,促进婴儿的认知、情感和社交发展。CBTS、EPDS、HADS的治疗费用相对于患病程度的变化率均与治疗费用呈正比,经调研,给出了两个分数对应的治疗费用,详见表1。现有一个行为特征为矛盾型的婴儿,编号为238。请你建立模型,分析最少需要花费多少治疗费用,能够使婴儿的行为特征从矛盾型变为中等型?若要使其行为特征变为安静型,治疗方案需要如何调整?
问题三,分析最少需要花费多少治疗费用。最值问题的求解即为优化模型,优化模型寻求优化模型三要求,决策变量目标函数约束条件。对于问题三,构建优化模型以消耗费用最小为目标函数,根据题目翻译出相应的约束条件进行求解即可;这里约束条件的选择可以为:治疗费用相对于患病程度的变化率均与治疗费用呈正比,可以构建出等式约束,等。
也给大家准备了优化模型的代码包,方便大家编写相应的优化代码。
4.婴儿的睡眠质量指标包含整晚睡眠时间、睡醒次数、入睡方式。请你对婴儿的睡眠质量进行优、良、中、差四分类综合评判,并建立婴儿综合睡眠质量与母亲的身体指标、心理指标的关联模型,预测、最后20组(编号391-410号)婴儿的综合睡眠质量。
问题四,分为两部分一、进行综合评价,二、对最后20组数据进行预测。对于问题四评价模型可以自己需要选择合适的模型即可,尽量选择客观评价模型。这里,需要考虑的是需要对最终结果进行优、良、中、差四分类综合评判。因此,可以根据最终建立评价模型得出的综合评价得分进行阈值划分处理。例如,前25%排名认定优;25%-50%认定良等。
对于预测后半部分进行预测,这里属于多个自变量对多个因变量,因此这里我个人意见比较推荐大家使用偏最小二乘法回归分析。至于大家有更好的想法,也可以进行尝试。
5. 在问题三的基础上,若需要让238号婴儿的睡眠质量评级为优,请问问题三的治疗策略是否需要调整?如何调整?
问题五可以与问题三放在一起求解,即问题五是问题三的拓展,引入了睡眠质量评级这一新的约束条件进行求解。
汇总:
数据预处理 异常值、缺失值
问题一、相关性分析 多元分析(偏最小二乘)
问题二、问卷信度和效度分析 多元回归分析 (偏最小二乘) 利用模型进行预测
问题三、优化模型
问题四、一.综合评价+综合值阈值设定
二.偏最小二乘法回归分析
问题五、引入新约束 问题三的拓展
选题人数预估:A:B:C=1:2:4
后续,由于个人精力有限,本次比赛将选择C题作为半成品论文以及完整论文的写作题目,8月4号也将为大家展示这两篇论文,给大家提供一种参考答案,方便大家更好的做题。