【2023 华数杯全国大学生数学建模竞赛】 C题 母亲身心健康对婴儿成长的影响 45页论文及python代码
1 题目
母亲是婴儿生命中最重要的人之一,她不仅为婴儿提供营养物质和身体保护, 还为婴儿提供情感支持和安全感。母亲心理健康状态的不良状况,如抑郁、焦虑、压力等,可能会对婴儿的认知、情感、社会行为等方面产生负面影响。压力过大的母亲可能会对婴儿的生理和心理发展产生负面影响,例如影响其睡眠等方面。
附件给出了包括 390名 3 至 12 个月婴儿以及其母亲的相关数据。这些数据涵盖各种主题,母亲的身体指标包括年龄、婚姻状况、教育程度、妊娠时间、分娩方式,以及产妇心理指标CBTS(分娩相关创伤后应激障碍问卷)、EPDS(爱丁堡产后抑郁量表)、HADS(医院焦虑抑郁量表)和婴儿睡眠质量指标包括整晚睡眠时间、睡醒次数和入睡方式。
请查阅相关文献,了解专业背景,根据题目数据建立数学模型,回答下列问题。
-
许多研究表明,母亲的身体指标和心理指标对婴儿的行为特征和睡眠质量有影响,请问是否存在这样的规律,根据附件中的数据对此进行研究。
-
婴儿行为问卷是一个用于评估婴儿行为特征的量表,其中包含了一些关于婴儿情绪和反应的问题。我们将婴儿的行为特征分为三种类型:安静型、中等型、矛盾型。请你建立婴儿的行为特征与母亲的身体指标与心理指标的关系模型。数据表中最后有20组(编号391-410号)婴儿的行为特征信息被删除,请你判断他们是属于什么类型。
-
对母亲焦虑的干预有助于提高母亲的心理健康水平,还可以改善母婴交互质量,促进婴儿的认知、情感和社交发展。CBTS、EPDS、HADS的治疗费用相对于患病程度的变化率均与治疗费用呈正比,经调研,给出了两个分数对应的治疗费用,详见表1。现有一个行为特征为矛盾型的婴儿,编号为238。请你建立模型, 分析最少需要花费多少治疗费用,能够使婴儿的行为特征从矛盾型变为中等型?
若要使其行为特征变为安静型,治疗方案需要如何调整?
表1. 患病得分与治疗费用
CBTS | EPDS | HADS | |||
---|---|---|---|---|---|
得分 | 治疗费用(元) | 得分 | 治疗费用(元) | 得分 | 治疗费用(元) |
0 | 200 | 0 | 500 | 0 | 300 |
3 | 2812 | 2 | 1890 | 5 | 12500 |
-
婴儿的睡眠质量指标包含整晚睡眠时间、睡醒次数、入睡方式。请你对婴儿的睡眠质量进行优、良、中、差四分类综合评判,并建立婴儿综合睡眠质量与母亲的身体指标、心理指标的关联模型,预测最后20组(编号391-410号)婴儿的综合睡眠质量。
-
在问题三的基础上,若需要让238号婴儿的睡眠质量评级为优,请问问题三的治疗策略是否需要调整?如何调整?
2 问题分析
2.1 问题一
对于母亲的身体指标和心理指标对婴儿的行为特征和睡眠质量的影响,这是一个回归分析建模问题。将婴儿行为特征和婴儿的整晚睡眠时间作为因变量,而母亲的身体指标和心理指标(母亲年龄、婚姻状况、教育程度、妊娠时间、分娩方式、CBTS、EPDS和HADS)作为自变量进行分析。一般采用多元线性回归模型来建模。多元线性回归模型的目标是找到一组线性关系,将自变量与因变量联系起来。回归模型的形式可以表示为:
Y
=
β
0
+
β
1
∗
X
1
+
β
2
∗
X
2
+
.
.
.
+
β
n
∗
X
n
+
ε
Y = β0 + β1*X1 + β2*X2 + ... + βn*Xn + ε
Y=β0+β1∗X1+β2∗X2+...+βn∗Xn+ε
其中Y表示因变量(即婴儿行为特征和婴儿睡眠质量),X1到Xn表示自变量(即母亲的身体指标和心理指标),β0到βn表示回归系数,ε表示误差项。
对于回归模型的拟合程序的评估指标有调整的R方、AIC、BIC等。注意在回归分析中,需要提出假设条件,并要分析回归结果,考虑各个指标的系数估计值和其显著性检验结果。如以下三个方面。
- 系数估计值:表示自变量对因变量的影响强度,例如β1表示自变量x1对因变量y的影响强度,β2表示自变量x2对因变量y的影响强度等等。
- t值和p值:用于检验各个系数估计值的显著性程度。t值可以表示变量的标准误和系数之间的比值,而p值可以表示该t值在显著性水平下的置信区间范围。一般来说,p值小于0.05或0.01时,表示该系数估计值在显著性水平下具有统计学意义,即该自变量对因变量的影响显著。
- 回归方程的拟合程度:可用R方和调整R方来衡量。R方表示模型拟合数据的适配度,可解释为自变量对因变量方差的百分比。调整R方则考虑了自变量数目影响,具有更加稳健的拟合效果。另外,由于数据集中包含相关系数较多,我们还可以考虑使用主成分分析(PCA)来减少自变量的维度,提取主要的特征,并建立主成分回归模型。
此外在多元回归分析中,需要考虑各个特征之间是否存在多重共线性,在回归分析之前可以采用主成分分析(PCA)来减少自变量的维度,提取主要的特征,再建立主成分回归模型。
2.2 问题二
这是一个分类问题,并需要预测20个样本的类别。分类模型的建立步骤如下:
-
数据预处理:对收集到的数据进行缺失值处理、异常值处理、标准化等预处理步骤。
-
特征工程:进行特征转换、特征组合或选择等操作,以提取更具有区分度的特征。
-
模型选择:根据数据的特征和模型的要求,选择适合的多类别分类算法,如逻辑回归、支持向量机、决策树、随机森林、神经网络等。
-
模型评估:使用交叉验证、混淆矩阵、准确率、召回率、F1分数等指标,对模型进行评估和优化。
-
模型应用:使用训练好的模型对新样本进行预测和分类,就可以得到婴儿的行为特征分类结果。
2.3 问题三
首先使用线性回归模型来建立CBTS、EPDS和HADS的得分与治疗费用之间的关系。可以将CBTS、EPDS和HADS的得分作为自变量,将治疗费用作为因变量,通过拟合线性回归模型,来估计得分与治疗费用之间的线性关系。
拟合出的线性回归模型可以用来预测婴儿的行为特征变为中等型需要的最少治疗费用。对于编号为238的婴儿,可以通过输入其目前的CBTS、EPDS和HADS得分到线性回归模型中,得到对应的治疗费用。然后,可以逐个调整CBTS、EPDS和HADS得分,计算相应的治疗费用,直到婴儿的行为特征从矛盾型变为中等型为止。记录每次调整的治疗费用,最后选取最小的治疗费用作为答案。
要使婴儿的行为特征变为安静型,需要进一步调整CBTS、EPDS和HADS得分。可以使用一些有优化方法的库函数来进行调整。以最小化总治疗费用为目标,可以使用约束优化方法,将CBTS、EPDS和HADS的得分设定为变量,并设置约束条件,使得婴儿的行为特征达到安静型。然后使用优化算法求解最小化总治疗费用的问题,并得到对应的CBTS、EPDS和HADS得分以及最小的治疗费用。
2.4 问题四
这是一个聚类问题,使用聚类分析将婴儿睡眠质量分为四类:优、良、中和差。可以根据婴儿的整晚睡眠时间、睡醒次数和入睡方式这几个指标,通过K-Means、Birch等指定K值的聚类算法对婴儿睡眠质量进行分类。使用四类作为聚类数,将数据集中的所有样本分成四个组。每个组代表一类睡眠质量。
此外,在以上分类的基础上,给数据打上label,使用线性回归等方法建立婴儿综合睡眠质量与母亲的身体指标、心理指标之间的关系模型。回归模型的自变量包括母亲的身体指标(如年龄、妊娠时间等)和心理指标(如CBTS、EPDS、HADS得分),因变量为婴儿的综合睡眠质量评分。可以通过训练得到的回归模型,预测最后20组(编号391-410号)婴儿的综合睡眠质量评分。
2.5 问题五
在问题三的基础上,预测调整后编号238,在调整诊疗方案后,即是安静型的特征下,目前的睡眠质量是哪个类别。如果属于优就不用调整,属于其他,就需要调整。
3 论文介绍
基于机器学习组合模型的婴儿睡眠质量研究
摘要
本文旨在探究母亲心理健康状态对婴儿发展的影响,特别是与婴儿睡眠质量之间的关联。母亲作为婴儿生命中最重要的人之一,不仅提供营养物质和身体保护,还为婴儿提供情感支持和安全感。然而,母亲心理健康的不良状况,如抑郁、焦虑和压力,可能对婴儿的认知、情感和社会行为等方面产生负面影响,甚至影响其睡眠质量。因此,我们收集了390名3至12个月婴儿及其母亲的相关数据,包括母亲的身体指标(年龄、婚姻状况、教育程度、妊娠时间、分娩方式)以及产妇心理指标(CBTS、EPDS、HADS)。另外,我们还记录了婴儿的睡眠质量指标,包括整晚睡眠时间、睡醒次数和入睡方式。
通过对这些数据进行分析,我们希望揭示母亲心理健康与婴儿睡眠质量之间的关系,并进一步了解其他潜在的相关因素。研究结果对于深入理解母婴关系以及制定相应的解决方案具有重要的意义。
本文尝试建立结构方程模型、决策树和随机森林等各种组合模型来探索母亲身心健康对婴儿成长的影响,并提出解决方案以改善母婴交互质量,提高婴儿睡眠质量。
针对问题一,我们使用结构方程模型和Spearman相关性分析来探讨母亲的身体指标和心理指标对婴儿的行为特征和睡眠质量是否有影响。在本问中,结构方程模型由两部分组成,分别为测量模型和结构模型,用于描述观察变量和潜在变量之间的关系。接着,我们使用Spearman相关性分析对变量之间是否存在统计上的显著关系进行检验,并分析相关系数为的正负向及相关性程度,最终得出结论:母亲的身体指标和心理指标对婴儿的行为特征和睡眠质量有影响。
针对问题二,我们使用多种机器学习模型来判断婴儿的行为特征信息,如:逻辑回归、随机森林、XGBOOST、神经网络等,最终从中选出性能指标最高的模型为随机森林,并使用TPE算法进行全局寻优,创建Seaborn热力图和直方图进行可视化,最终得出最后20组(编号391-410号)婴儿的行为特征信息类型。
针对问题三,我们将模型分为两部分,第一部分,我们构建了一个预测模型,该模型可以基于CBTS、EPDS、HADS这三个变量预测婴儿的行为特征;第二部分,我们配置CBTS、EPDS、HADS的治疗组合从而实现该婴儿的行为特征转变。在模型的选择上,我们选择XGBoost模型、决策树模型、随机森林模型、LGBM模型、Adaboost模型和GBOT模型。最终选择了模型性能最高的决策树模型,最终得出:最少需要花费1445元治疗费用,能够使婴儿的行为特征从矛盾型变为中等型。CBTS、EPDS、HADStt分别为13、21、18时,治疗费用为3119元,可将其特征转变为安静型。
针对问题四和问题五,我们同样将模型分为两部分,第一个模型用于评价婴儿的睡眠质量,主要基于婴儿的睡眠质量指标来构建,然后通过层次分析法和熵权法确定权重,再通过rsr秩和比法和topsis等方法构建综合评价模型,最终得出睡眠质量得分。第二个模型分别以综合睡眠质量得分、母亲的身体指标、心理指标来构建,最终预测出最后20组婴儿的综合睡眠质量。
关键词:母亲心理健康 婴儿发育 结构方程模型 相关性分析 随机森林 决策树
4 下载
转到知乎文章底部下载链接
zhuanlan.zhihu.com/p/649532758