模型设计思路与创新点:
建模的时候应该先确定我们需要建立什么类的模型?优化类还是统计类?这个题需要大量的数据分析,因此我们可以建立一个统计学模型。
统计学建模思路:观察规律,建立模型,参数估计,显著度检验,置信度检验等。
这个题最核心的要求在于旅游模型的可持续性:既要对环境友好,又要对经济效益友好。
于是我想到可以使用SIR传染病模型最后趋于的稳态,和Logistic阻滞增长模型种群处于K/2的时候增速最快的节点来表征这个可持续性。
SIR传染病模型有三个状态变量,Logistic阻滞增长模型有一个状态变量,将两个结合,交互就可以得到一个新的微分方程组,有四个状态变量N(t),S(t),I(t),R(t),这是这篇论文最大的创新。N(t):时间 t 时的游客数量,S(t):未受影响的居民数量,I(t):当前正受到旅游负面影响的居民数量,R(t):已适应或不再受到旅游负面影响困扰的居民数量。
题目中提到:游客多了本地居民就会不高兴,所以我们用本地居民的抵抗人数来量化游客过多的负面效应。
两个模型怎么交互呢?我们这样设计:
W(t) 是游客活动量,用当地市场交通量来表示(网上有数据可以查得到)
C(t) 是基础设施的使用量,假设它正比于游客量,正比系数是2023年的全球碳排放量中旅游业排放的比例。
下面是模型的参数:
r表示游客增长率
K表示生态承载上限
δ表示居民的抵触情绪或负面评价对游客数量的“抑制效应”系数
β为传播率(正比于游客对居民压力的影响率)
γ为恢复或适应速率
σ表示生态效应对居民的正向或负向反馈作用系数
模型实现的效果:
我们用游客数量衡量旅游的经济效益,这是显然的:
(第一个方程)当游客数量N太多会降低游客的增速,被旅游业困扰的原住民数量增多也会降低游客的增速(这一点是我们的创新)
(第二个方程)被困扰的原住民的增速负相关于有不被困扰的原住民的数量
(第三个方程)被困扰的原住民的增速不仅被其它原住民和游客影响,还被生态效益E(t)所影响(这一点也是我们的创新)
(第四个方程)原住民会逐渐的习惯被困扰的状态,变成不被困扰的原住民
接下来我们建模生态效益:
(第五个方程)
总生态效益E(t)被游客人数N(t),交通量W(t)(交通量正像关于二氧化碳排放量),公共设施使用量C(t),我们假设每个人使用的设施是一个比值,使用2023年旅游业的碳排放量对所有行业占比来代替。
为了简化模型,考虑到几年来交通量变化不大,使用一个关于时间t的二次多项式来表示。
这是一个统计学模型,模型建立以后,我们可以用模型来表示回归曲线,题目中要求我们进行模型的稳定性分析,我们可以对参数进行参数估计和显著度检验,用参数的显著性作为模型的稳定性。
获取数据与回归:
设立完模型以后,我们需要收集数据,对数据拟合我们的模型,看看我们的模型拟合效果如何,显著度水平如何,如果显著度水平高,说明变量是起到作用的;如果拟合效果好,则可以用来预测。
数据我们通过2023年的阿拉斯加州旅游业报告和朱诺市的旅游业调研报告获取的,由于报告获取过程中没有原始数据,故我们根据报告中的相关参数获取了两种数据。第一种数据通过期望和正态性假设生成;第二种数据通过对原始的单条时间序列数据进行滑动窗口得到时间序列样本集。
报告原链接:
https://juneau.org/wp-content/uploads/2023/12/CBJ-Tourism-Survey-2023-Report-12.11.23.pdf
a_visitor_report_7.pdf (alaska.gov)
sustainabletravel.org
这是数据来源的一张采集截图:
后面的内容只在第一种数据上介绍,对于第二种数据我们只构建了数据集,还没来得及做回归分析。
模型结果展示:
下面简单展示我们模型的结果(线性回归):
N(t)vs.t曲线大体上呈现一个缓慢上升的趋势,因为很多人会涌入景点。
S(t)vs.t):随时间有下降,说明游客涌入时,当地居民很快就会受到影响。
I(t)vs.t):被影响的居民先增多再减少
R(t)vs.t:理论上上升,因为更多居民逐渐适应游客的涌入。
C(t)vs.t:若交通市场人流总量随时间总体增加,则显现出增长态势。
W(t)vs.t:由于我们定义,只要N(t)随时间变化,W(t)的变化趋势也相似。
回归结果与显著度分析:
最后是我们的回归结果和显著度分析:
变量 | α | β | Std.Error(β ) | t值 | p值 | 结论 |
N(t) | 1.60E+06 | 5400 | 1400 | 3.86 | 0.00012 | 显著(p<0.01) |
S(t) | 4.50E+05 | 250.8 | 67 | 3.74 | 0.00021 | 显著(p<0.01) |
I(t | 9.93E+05 | 2331.6 | 112 | 20.78 | 1.51E69 | 显著(p<0.01) |
R(t) | 3.36E+05 | 2629 | 120 | 21.92 | 4.77E75 | 显著(p<0.01) |
C(t) | 1.48E+06 | 2200 | 23 | 95 | 1.00E300 | 显著(p<0.01) |
W(t) | 1.20E+05 | 1100 | 12 | 91 | 3.00E290 | 显著(p<0.01) |
可以看到:对任何一个状态变量,模型都是显著的,说明模型变量选择还是合理的。
我们设立的模型思路清晰且简洁,具有创新性和专业性,且我们已经写好了一篇成品论文,附带了两种数据集和模型的回归代码,借鉴我们的论文会让您的论文更出彩。下面附上我们的成品论文的目录。更多内容请点击如下链接:
美赛B题成品论文-基于SIR与Logistic模型- 首发,可直接用于论文