2023年五一假期期间,数学建模竞赛就有四场,各种比赛各种需求应接不暇。因此,对于本次浅析有不足的地方欢迎大家指出。为了更好的帮助大家华中杯选题,首先为大家带来ABC三个题目的浅析,帮助大家更快的选题,提前规避难点。
A 题 新型镇静药物临床实验疗效分析与预测
A题单独只看题目就能大概知道,这是一道数据分析+预测类题目。以新型镇静药物临床实验为背景,设置如下问题。
问题一,判断新药组和原有药物组是否存在显著差异,对于显著差异,每个队伍的想法都应该不太一样,这里仅仅提个个人建议,仅供参考。判断新药组和原有药物组是否存在显著差异,一般需要进行差异性分析1,也就是假设检验的一种方法。
对于问题一的另一个设问,建立的数学模型,对患者术中、术后 24h 的不良反应进行预判。预判,我的初步认知应该是让我们建立一个预测模型,进行预测。详细的思路还需要对数据进行分析才可以,稍后会进行补充。
问题二,问题题设偏向于因素分析,这里大家可以参考一下关联分析中的几种方法,或者建立回归分析也是可以的。
问题三、对3分钟以内的 IPI 数据进行预测,预测模型即可。选择合适的预测模型即可。具体选择建议,稍后补充。
B 题 小学数学应用题相似性度量及难度评
个人认为B题应该是本次比赛最难的一道题目,难点有二
其一,需要进行定量分析,定量的量是数据,我们需要把附件给出的文字转化为数据,转化的方法是很有难度的。
其二,相似性的度量方法,这个司守奎老师书中第10章多元分析的讲述差不多。我们需要先选取一种度量,选取何种度量是一个问题,对于这种度量选择何种相似性度量方法还是问题。
因此,在我看来B题最难(目前看来),相应的选题人数也很有可能最少。具体思路,稍后进行补充。
C 题 空气质量预测与预警
C题则是本次比赛最简单的一道题目。问题的题目就突出一个模型,预测。所C题也基本是围绕预测展开的。具体预测模型,大家可以参考我给出A题的那个预测模型种类图。
对于题目给出的数据,我们第一步就是进行数据预处理。数据预处理无非就是数据清洗(主要就是缺失值、噪声数据、异常值、不一致性等问题。常用的方法有删除、填补、平滑、修正等。)
问题一,需要我们数据预处理 + 指标选取。指标的选取,需要就是选取与 PM2.5 浓度变化有 关的因素。对于这一问,我们可以进行关联分析,主要方法如下所示。
至于,筛选出因素对 PM2.5 浓度影响的程度,我们就可以根据相关系数进行排序即可。
问题二,涉及到预测模型的选择。这个大家可以先看一下A题的预测模型方法示意图。稍后我也会给出一些比较合适的预测模型。对于问题二提及的均方根误差(RMSE),如下所示,是一种用于衡量预测值与实际值之间差异的统计量,通常用于评估回归模型的预测能力。切记,通常来讲对于预测模型,随着预测步长的增加,RMSE是是越来越大,即预测步数越大,精度越小。所以,一旦结果趋势不对,很可能是数据或者模型出错了。
问题三,构建AQI 多步预测模型,直接多步预测、递归多步预测、直接-递归混合预测、多输出预测等
其中预测结果进行可视化。可以认为是对结果的另类展示,我们可以进行绘图或者制表的展示即可。