数学建模学习笔记

news2025/1/20 17:08:26

数学建模学习笔记

现学现卖,随缘更新QwQ
主要根据b站大师兄的视频整理而成,有不懂的可以去看原视频

List

  • 数学建模学习笔记
  • 一、 层次分析法
    • 1.1 矩阵的一致性及其检验
    • 1.2 权重计算
    • 1.3 具体流程
  • 二、模糊综合评测
    • 2.1 隶属函数
    • 2.2 隶属函数的确定方法
    • 2.3 模糊综合评测
  • 三、熵权法
    • 3.1 正向化与标准化
    • 3.2 流程
  • 四、TOPSIS优劣解距离法
  • 五、灰色关联分析
    • 5.1 前置定义
    • 5.2 流程
  • 六、线性规划
    • 6.1 基本定义
    • 6.2 标准型
    • 6.3 整数线性规划
    • 6.4 一点补充
  • 七、非线性规划
  • 八、图论与最短路算法
  • 九、网络流模型
  • 十、微分方程
  • 十一、插值与拟合
  • 十二、时间序列
    • 12.1 分类及其结合
    • 12.2 时间序列预测方法
    • 12.3 趋势模型
    • 12.4 季节性(周期性)模型
    • 12.5 时间序列的平稳性
  • 十三、旅行商问题
  • 十四、聚类分析入门


一、 层次分析法

1.1 矩阵的一致性及其检验

对于矩阵 A A A a i j a_{ij} aij表示第i个因素的重要程度是第j个因素的A[i][j]倍。
若矩阵A满足: a i j a_{ij} aij * a j k a_{jk} ajk = a i k a_{ik} aik,则称A为 一致矩阵,否则称为 不一致矩阵
对于一致矩阵A,有如下 三条性质

  1. r a n k ( A ) rank(A) rank(A) = 1,且唯一非零特征根为n
  2. A的任意列向量都是对于特征根n的特征向量

上述性质告诉我们,只要满足两两行/列 成倍数关系,就是一致性矩阵。
对于不一致矩阵,其最大特征根 λ m a x \lambda_{max} λmax>n, λ \lambda λ 与n相差越大,其不一致程度越大。由此,给出一致性检验指标 C I CI CI = λ m a x − n n − 1 \frac{ \lambda_{max} - n} {n-1} n1λmaxn 其中 λ m a x \lambda_{max} λmax表示最大特征值。CI越大,表示一致性越差,越接近0则一致性越好。
由于 C I CI CI受随机因素影响,阶数n越大,该因素越显著。为了衡量 C I CI CI的大小,引入 R I RI RI表示随机一致性指标,并以 一致性比例 C R CR CR= C I R I \frac{CI}{RI} RICI 作为判断依据。若 C R CR CR<0.1,则认为判断矩阵的一致性可以接受,否则需要对判断矩阵进行修正,若不满足,则需构造出更多的倍数关系,直至 C R CR CR < 0.1

1.2 权重计算

层次分析法的最终目的就是获得不同要素的权重,以便于后续进行加权平均。具体地,先将每一列进行 归一化,也即将 a i j a_{ij} aij替换为 a i j ∑ i = 1 n a i j \frac{ a_{ij} }{\sum_{i=1}^{n}a_{ij}} i=1naijaij
然后,对于非一致矩阵,将 W i = ∑ j = 1 n a i j n W_i=\frac{\sum_{j=1}^{n}a_{ij}}{n} Wi=nj=1naij作为第i个要素的权重。这种求权重的方法称为算数平均求权重。由于一致矩阵各列成比例,所以只需取第一列即可,不需要进行算术平均。
另一种求权重的方式为:将最大特征值对应的特征向量进行归一化,第i个分量的值即为 W i W_i Wi。这种方法称为特征值法求权重
这种方法较于前一种方法更加方便使用,因而在实际比赛和科研中建议使用特征值法。

1.3 具体流程

  1. 根据专家意见、问卷调查等方式获得判断矩阵 A A A,并对 A A A进行一致性检验,若 C R CR CR<0.1,认为一致性检验通过,否则构造新的判断矩阵
  2. 将判断矩阵各个列进行归一化,随后对每一行求算数平均,所得即为权重

层次分析法是一种主观确定权重的方式,后续还会有客观确定权重的方式——熵权法

二、模糊综合评测

一般的对立集合具有排中律,即“非此即彼”,而对于不满足排中律的情况,则需要引入隶属函数衡量每个元素对于不同集合的隶属度。换句话说,就是对于一个论域 U U U 构造一个函数 f : U → [ 0 , 1 ] f:U \rightarrow [0,1] f:U[0,1],以评判 U U U中每一个元素的隶属度。与层次分析法一样,这种方法也属于主观评价方法。

2.1 隶属函数

对于模糊集合 A = “年轻”, U = ( 0 , 120 ) A=“年轻”,U=(0,120) A=年轻U=(0,120),定义隶属函数 μ A \mu_A μA
μ A = { 1 , 0 < x < 20 40 − x 20 , 20 ≤ x ≤ 40 0 , 40 < x < 120 \mu_A = \begin{cases} 1,0<x<20\\ \displaystyle\frac{40-x}{20},20≤x≤40\\ 0,40<x<120 \end{cases} μA= 10<x<202040x20x40040<x<120
可以看到,这个函数对U中每一个元素都给出了一个对于 A A A的隶属度,越大则越符合。
模糊集合的表示方法包括扎德表示法,序偶表示法,向量表示法等。
序偶表示法: { ( x 1 , A ( x 1 ) ) , ( x 2 , A ( x 2 ) ) . . . ( x n , A ( x n ) } \{(x_1,A(x_1)),(x_2,A(x_2))...(x_n,A(x_n)\} {(x1,A(x1)),(x2,A(x2))...(xn,A(xn)}
向量表示法: A = { A ( x 1 ) , A ( x 2 ) . . . A ( x n ) } A=\{A(x_1),A(x_2) ... A(x_n)\} A={A(x1),A(x2)...A(xn)}
当U为无限集时,定义 A = ∫ x ∈ U μ A ( x ) x d x A=\displaystyle\int_{x\in U} \frac{\mu_A(x)}{x} dx A=xUxμA(x)dx

上面例子中 A = “年轻” A=“年轻” A=年轻属于极小型,因为值越小隶属度应当越高。对于这类集合,其隶属函数应形如:
μ A = { 1 , x < a b − x b − a , a ≤ x ≤ b 0 , x > b \mu_A = \begin{cases} 1,x<a\\ \displaystyle\frac{b-x}{b-a},a≤x≤b\\ 0,x>b \end{cases} μA= 1x<ababxaxb0x>b
相应地,对于极大型 ,其形式为:
μ A = { 0 , x < a x − b b − a , a ≤ x ≤ b 1 , x > b \mu_A = \begin{cases} 0,x<a\\ \displaystyle\frac{x-b}{b-a},a≤x≤b\\ 1,x>b \end{cases} μA= 0x<abaxbaxb1x>b
对于中间型,其左侧为极大型函数,右侧为极小型函数,不作赘述。
上面的构造方法称为梯形型,事实上还存在k次抛物型、柯西型、正态型等等,在需要时可以自行查阅。

2.2 隶属函数的确定方法

确定隶属函数有模糊统计、F分布、三分法等,至少应该满足如下条件:

  1. 极小型集合的下界a,小于a的元素均不属于其他集合(极大型同理)
  2. 增长趋势应符合主观经验

2.3 模糊综合评测

对于一级模糊综合评价,遵循如下步骤:

  1. 确定因素集 U U U,例如 {工作业绩、工作态度、沟通能力},评语集 V V V,例如 {好,较好,中,差,很差}
  2. 确定各因素( U U U中各个元素)的权重,若无数据可采用层次分析法,若给出数据则使用熵权法的TOPSiS,也可以不确定权重
  3. 对每个 u i u_i ui,确定其对于每个 v j v_j vj的隶属度,对指标 u i u_i ui的评判记作: R = [ r i 1 , r i 2 … r i n ] R=[r_{i1},r_{i2}\dots r_{in}] R=[ri1,ri2rin] ,其中 r i j r_{ij} rij表示 u i u_i ui对于 v j v_j vj的隶属度。
  4. 对每一列进行加权平均(即左乘行向量),取数值最大的评语作为最后综合评判结果

若将评语集更改为方案集,上述流程可以判断出哪个方案最优! 此时也可称评语集不带有评价色彩
类似地,对于因素集中、指标过多时,可根据相关性将因素归纳成一个个小集合,从而进行模糊综合评价的嵌套,也即多级模糊综合评测

三、熵权法

信息熵是衡量混乱程度的量,其定义为:
H ( X ) = ∑ i = 1 n [ p ( x i ) I ( x i ) ] = − ∑ i = 1 n [ p ( x i ) l n ( p ( x i ) ) ] H(X)=\sum_{i=1}^n[p(x_i)I(x_i)]=-\sum_{i=1}^n[p(x_i)ln(p(x_i))] H(X)=i=1n[p(xi)I(xi)]=i=1n[p(xi)ln(p(xi))]
其中 I ( x i ) = − l n ( p ( x i ) ) I(x_i)=-ln(p(x_i)) I(xi)=ln(p(xi))表示 x i x_i xi的信息量。根据公式,可以将信息熵理解为对信息量的期望值。信息熵越大,所当前状态的混乱程度最大,也即掌握的信息最少(信息的本质就是减少混乱程度,增大确定性),以该指标衡量对象的可靠性越差,信息有效性也就越小。

3.1 正向化与标准化

在应用熵权法之前,要先对数据进行正向化处理。指标大致可分为四类:极小型(越小越好)、极大型(越大越好)、中间型(越接近越好),区间型(落在区间内最好)。我们的目标是将其余三种类型转换为极大型。

  • 将极小型转化为极大型,公式为 m a x − x max-x maxx 1 x ( x > 0 ) \displaystyle\frac{1}{x}(x>0) x1(x>0) m a x max max表示该指标下的最大值;
  • 中间型转化为极大型,公式为 x ~ i = 1 − ∣ x i − x b e s t ∣ M \displaystyle\tilde x_i = 1-\frac{\left|x_i-x_{best}\right|}{M} x~i=1Mxixbest,其中 M = m a x { ∣ x i − x b e s t ∣ } M=max\{\left|x_i-x_{best}\right| \} M=max{xixbest}表示指标下的最大偏差;
  • 区间型转化为极大型,方式类似于中间型隶属函数 x ~ i = { 1 − a − x i M , x i < a 1 1 , a ≤ x i ≤ b 1 − x i − b M , x i ≥ b \displaystyle\tilde x_i = \begin{cases} 1-\frac{a-x_i}{M},x_i<a_1\\ 1,a\le x_i \le b\\ 1-\frac{x_i-b}{M},x_i\ge b \end{cases} x~i= 1Maxixi<a11axib1Mxibxib,其中 M = m a x { a − m i n , m a x − b } M=max\{a-min,max-b\} M=max{amin,maxb}为最值到边界的最大距离。
  • 对于极大型,若存在负元素,则可将每一个元素替换为 x − m i n x-min xmin

这样,三类数据都可以用极大型指标的方式呈现,且均非负。
随后,为了消除量纲的影响,对每个数据进行标准化。设标准化后的矩阵为 Z Z Z,则 Z Z Z满足: z i j = x i j ∑ i = 1 n x i j 2 \displaystyle z_{ij}=\frac{x_{ij}}{\sqrt{\sum_{i=1}^n x_{ij}^2}} zij=i=1nxij2 xij
对每一列再做归一化,得到的矩阵 P P P称为比重矩阵

3.2 流程

  1. 对数据进行正向话、标准化与归一化,最终得到矩阵 P P P
  2. 令信息熵 e j = − 1 ln ⁡ n p i j ln ⁡ ( p i j ) ( j = 1 , 2 , … , m ) e_j=-\frac{1}{\ln n}p_{ij} \ln (p_{ij})(j=1,2,\dots ,m) ej=lnn1pijln(pij)(j=1,2,,m),注意这里新增了 − 1 ln ⁡ n -\frac{1}{\ln n} lnn1,以将结果规范到[0,1]之间
  3. 由此得到信息效用值 d j = 1 − e j d_j=1-e_j dj=1ej,再将信息效用值归一化,得到熵权 W j = d j / ∑ j = 1 m d j ( j = 1 , 2 , … , m ) W_j = d_j/\sum_{j=1}^m d_j (j=1,2,\dots,m) Wj=dj/j=1mdj(j=1,2,,m)

四、TOPSIS优劣解距离法

该方法用于衡量某一个方案的优劣,具体思想是将每个衡量对象的指标标准化后分析其与最优解与最劣解的距离,进而得出最优解。

  1. 将数据化为 n × m n \times m n×m的矩阵 A A A,n表示待评测对象个数,m表示指标个数。将 A A A进行正向化、标准化;
  2. 选出各个指标下最大值 M i M_i Mi与最小值 m i m_i mi(也即每一列最大值),组成最优解向量 M M M与最劣解向量 m m m
  3. 对每个待衡量对象(也即 A A A的每个行向量)计算其与 M M M m m m的欧氏距离,分别记作 D i + D_i^+ Di+ D i − D_i^- Di,定义该对象的得分 S i = D i − D i + + D i − \displaystyle S_i=\frac{D_i^-}{D_i^+ + D_i^-} Si=Di++DiDi S i S_i Si越大,说明该对象越优,反之则越劣。

如果要考虑权重,则需将距离计算公式改为 ∑ i = 1 m w i ( x i − y i ) 2 \sqrt{\sum_{i=1}^m w_i(x_i-y_i)^2} i=1mwi(xiyi)2 的形式即可,权重的获取方法如上述。

五、灰色关联分析

灰色关联分析用于处理已知信息较少的问题,通过分析大致趋势的贴合程度得出各个影响因素的重要程度。

5.1 前置定义

  • 参考序列(母序列):能反映系统行为特征的数据序列,记作 x 0 x_0 x0,类似于“因变量”。
  • 比较序列(子序列):影响系统行为的因素组成的数据序列,记作 x i ( i = 1 , 2 , … n ) x_i(i=1,2,\dots n) xi(i=1,2,n),类似于“自变量”。
  • 两级最小差 a = m i n s , t ∣ x 0 ( t ) − x s ( t ) ∣ a=min_{s,t} \left| x_0(t)-x_s(t)\right| a=mins,tx0(t)xs(t)
  • 两级最大差 b = m a x s , t ∣ x 0 ( t ) − x s ( t ) ∣ b=max_{s,t} \left| x_0(t)-x_s(t)\right| b=maxs,tx0(t)xs(t)

在这里,我们引入新的去除量纲的方法,即对每个指标中的元素除以该指标的均值。

5.2 流程

  1. 对数据进行预处理(正向化,去除量纲等等),并计算出两级最大/小差;
  2. 对每个元素定义 γ ( x 0 ( k ) , x i ( k ) ) = a + ρ b ∣ x 0 ( k ) − x i ( k ) ∣ + ρ b \gamma (x_0(k),x_i(k))=\displaystyle\frac{a+\rho b}{\left| x_0(k)-x_i(k)\right| + \rho b} γ(x0(k),xi(k))=x0(k)xi(k)+ρba+ρb,其中 ρ \rho ρ称为分辨系数,一般取值为0.5;
  3. 将各指标曲平均值作为该序列的灰色关联度,即 γ ( x 0 , x i ) = 1 n ∑ k = 1 n γ ( x 0 ( k ) , x i ( k ) ) \gamma(x_0,x_i)=\displaystyle\frac{1}{n}\sum\limits_{k=1}^{n}\gamma (x_0(k),x_i(k)) γ(x0,xi)=n1k=1nγ(x0(k),xi(k)),值越大,表明该因素与系统行为关联越大。

具体操作中有一些excel的小技巧,详见 大师兄的讲解视频

六、线性规划

数学规划是一类针对有限制的关系寻求最优解的方法。若关系及其限制均为线性,则称这类规划为线性规划

6.1 基本定义

  • 决策变量:即对最优解有影响的因素
  • 目标函数:形如 y = a 1 x 1 + a 2 x 2 + … a n x n y=a_1x_1+a_2x_2+\dots a_nx_n y=a1x1+a2x2+anxn,规划目标即为求得y的最大/小值
  • 约束条件:形如 b p 1 x p 1 + b p 2 x p 2 + … b p n x p n ≤ ( 或 ≥ ) c b_{p1}x_{p1}+b_{p2}x_{p2}+\dots b_{pn}x_{pn} \leq (或\geq) c bp1xp1+bp2xp2+bpnxpn()c,表示对决策变量的限制条件

针对这类问题,一般采取拉格朗日乘数法,由于实际应用中可以直接调用函数求解,故不作介绍。

6.2 标准型

调用MATLAB要求对输入数据进行标准化。引入线性规划的标准型:
min ⁡ f T x , s . t . { A ⋅ x ≤ b A e q ⋅ x = b e q l b ≤ x ≤ u b \min f^T x,s.t. \begin{cases} A \cdot x\leq b\\ Aeq \cdot x = beq\\ lb \leq x \leq ub \end{cases} minfTx,s.t. AxbAeqx=beqlbxub
其中 f T f^T fT为系数向量 [ c 1 , c 2 , ⋯ c n ] [c_1,c_2, \cdots c_n] [c1,c2,cn]
在MATLAB中,求解函数格式为:

[x,val] = linprog(f, A, b. Aeq, beq, lb, ub)
% 若某项约束不存在则在对应位置填"[]"

其中 x 为目标函数取得最小值时各个变量的取值,val 表示目标函数的最小值
由于最开始给定的数据往往不满足上述形式,所以往往需要先进行预处理。

在实际建模中,我们也常常能见到多个目标函数的情况,例如,投资问题中,我们往往希望风险尽可能低,收益尽可能高。这时,我们可以定义它们的加权平均为新的目标函数。也可以通过将其余目标化为限制条件,进而保证目标函数只有一个,比如认为只要风险小于一定程度即认为可行,将收益最大化。

6.3 整数线性规划

整数线性规划,即部分或全部决策因素只能为整数的一类问题,在MATLAB中也有直接对应的函数,即:

[x,val] = intlinprog(f, intcon,  A, b, Aeq, beq, lb, ub)

注意到,intlinprog 相较于 linprog 新增了 intcon 这一参数,用来指定哪些变量为整数,例如决策变量 x 1 , x 2 , x 3 x_1,x_2,x_3 x1,x2,x3中第一个和第三个为整数,则 intcon=[1,3]

这里引入一个特殊的整数规划模型——0-1整数规划,即变量只能取0或1。落实到函数中,只需要令上述函数中lb=0,ub=1即可。
下面给出对应例题,依次为 0-1背包问题指派问题
0-1背包问题
指派问题
对于整数规划,一个常见误解是只要对线性规划所得解进行简单取整就可以了。事实上,整数线性规划虽然与一般线性规划有许多联系,但绝不能粗暴地以取整相联系。
不过,根据这个思路,我们可以在一般线性规划的最优解附近寻找整数可行解,这种方法称为 完全枚举法;也可以通过将最优解中非整数元素 x i x_i xi作为对整数域的分割点,分别对 { y i ∈ Z ∣ y i ≥ ⌊ x i ⌋ + 1 } \{ y_i \in \mathbb{Z}|y_i \geq \lfloor x_i\rfloor + 1 \} {yiZyixi+1} { y i ∈ Z ∣ y i ≤ ⌊ x i ⌋ } \{ y_i \in \mathbb{Z}|y_i \leq \lfloor x_i\rfloor \} {yiZyixi⌋}两个集合进行讨论,直到所有领域都讨论完 或 找到整数最优解为止。这种方法称为分枝定界法

6.4 一点补充

对于 非线性规划,一些典型的处理方法包括 蒙特卡洛模拟,即用大量随机试验得出最终结果,我们将会在后续予以介绍。
作业1
这道题可以采用0-1整数规划的思维,对应的方程组·为:
{ max ⁡ y = ∑ i = 1 10 c i x i ∑ i = 1 10 w i x i ≤ 30 x i ∈ { 0 , 1 } , i = 1 , 2 , ⋯ 10 \left \{ \begin{array}{c} \max y=\sum\limits_{i=1}^{10}c_i x_i \\ \sum\limits_{i=1}^{10} w_i x_i \leq 30 \\ x_i \in \{ 0,1 \},i=1,2, \cdots 10 \end{array} \right. maxy=i=110cixii=110wixi30xi{0,1}i=1,2,10
该题也是动态规划的经典例题,可以思考如何设计状态转移方程。

七、非线性规划

若存在某些限制 或 目标函数 不满足线性形式,即并非所有因素的幂次均为1,则称这类问题为非线性规划。在MATLAB中,同样有一个求解函数—— fmincon

[x,val]=fmincon(@f, x0, A, b, Aeq, beq, lb, ub, @nonlcun, option)

对于新引入的变量:

  • @f:目标函数,定义在外部
  • x0:初始值,由于求出来的只能是局部最优解,所以必须设定
  • option:求解方法,有interior-point(内点法)、sqp(序列二次规范法)、active-set(有效集法)、trust-region-reflective(信赖域反射算法)
  • @nonlcun调用了一个定义在外部的非线性部分的约束(也可以定义在脚本内部)

虽然该算法只能求出局部最优解,但是如果设立多个初始值,则可能得到全局最优解(类似于蒙特卡洛的思想)。具体实现参看下图(对不起我太懒了)
具体实现
在这里插入图片描述

八、图论与最短路算法

关于这部分内容,由于信息竞赛出身,就不赘述了。这里列出一条大纲,可以根据大纲配合网络资料学习 (以后有时间再回来填坑)

  1. 图的定义与表示方法
  2. 最短路模型与求解算法:
    (1) Dijkstra算法:非负边权单源最短路,贪心思想
    (2) Bellman_Ford算法:能解决存在负边权的模型并判断是否有负权环(此时无最短路),利用n-1次松弛求出最优解,复杂度较大
    (3)Floyd算法:三重循环给出无向图任意两点间的最短距离

在MATLAB中,已经有了对应的求解函数——shortestpath

[P, d] = shortestpath (G, start, end, ['method', algorithm])
  • G:要求解的图
  • start:起始节点
  • end:目标节点
  • [‘method’,algorithm]
  • P:最短路径经过的节点序列
  • d:最短距离

九、网络流模型

碎碎念:学信息竞赛的时候就被这种算法的魅力折服了,因为它真的好神奇,但也是真的难……
求解算法的实现就是简单的模板,难就难在如何判断某个问题能否划归为网络流问题,
关于这部分的算法原理以及C++实现,参看我之前写的一篇文章,包含最大流、最小割与费用流。
在MATLAB中,求解最大流的函数为 graphmax

[Maxflow, FlowMatrix, Cut] = graphmaxflow(matrix, vs, vt)
  • matrix: 要求解的有向图的稀疏矩阵
  • vs;源点
  • vt:汇点
  • Maxflow:最大流
  • FlowMatrix:包含每条边所有流量的稀疏矩阵
  • Cut:计算发点与终点的最小切合后链接起点的逻辑行向量,如果有多个解表示为一个矩阵

对于费用流,不断地在残量网络上进行最短路算法即可。

十、微分方程

微分方程与其说是一个模块,不如说是一种思想,一类问题。面对变化趋势与函数值关联的问题时,我们往往需要建立微分方程来进行刻画,例如:传染病模型,弹簧振动方程等等。
(后面有机会再填坑吧)

十一、插值与拟合

插值与拟合都是分析数据大致分布的方式,数据少而精确,往往用插值;数据多而低精度,往往用拟合。
插值与拟合在MATLAB中都有相应的算法,需要根据具体需要选择合适的拟合方式。
(后面有机会再回来填坑)

十二、时间序列

时间序列,简而言之,就是按时间顺序排列的数据。

12.1 分类及其结合

根据时间对数据的影响,可分为以下几类:

  • 长期趋势变动:长期上升或下降
  • 季节变动:仅受季节因素影响
  • 循环变动:存在周期性
  • 随机变动:与时间无关

我们常见的数据往往是这四类数据以 加法乘法 的方式结合起来,例如:若“羽绒服销量”呈现同比增长的趋势,则应将长期趋势变动程度 与 季节变动程度 相乘。

12.2 时间序列预测方法

某一时刻的数据受最近的数据影响程度较大,而受相对久远的数据影响较小。根据这一思想,要想构建函数进行分析预测,需要引入与时间有关的权值函数 f ( t ) f(t) f(t)
长期趋势变动类型中, f ( t ) f(t) f(t)需要对 t 单调递增。最简单的思路是取 待预测时间点的前n项 取平均,其余项不做考虑,该方法称为 移动平均法(MA),此时
f n ( t ) = { 1 n , t 0 − t ≤ n 0 , t 0 − t > n f_n(t) = \begin{cases} \frac{1}{n},t_0-t \leq n\\ 0,t_0-t>n \end{cases} fn(t)={n1,t0tn0,t0t>n
同样地,可以对移动平均法得到的数据进行二次或更多次移动平均。
这种方式显然是十分粗暴的。一般来说, f ( t ) f(t) f(t)是随t增大而平滑上升的。于是,我们构建这样一个递推式:
x ^ t + 1 = α x t + α ( 1 − α ) x ^ t \hat x_{t+1} = \alpha x_t + \alpha (1 - \alpha)\hat x_t x^t+1=αxt+α(1α)x^t

  • x ^ t + 1 \hat x_{t+1} x^t+1 :对第t+1个时刻的预测值
  • x t x_t xt表示t时刻的观测值。此时,越接近当下的数据项,其对应的权重越大

这种方法称为简单指数平滑法 α \alpha α被称为平滑系数。这种方法无法分析具有趋势的情况,只是单纯地调整了权重。

12.3 趋势模型

在此基础上,我们引入霍特线性趋势模型,其具体方程组如下:
{ l t = α x t + ( 1 − α ) ( l t − 1 + b t − 1 ) (水平平滑方程) b t = β ( l t − l t − 1 ) + ( 1 − β ) b t − 1 (趋势平滑方程) x ^ t + h = l t + h b t (预测方程) \left\{ \begin{array}{} l_t=\alpha x_t + (1 - \alpha )(l_{t-1} + b_{t-1})(水平平滑方程) \\ b_t=\beta(l_t - l_{t-1}) + (1 - \beta)b_{t-1}(趋势平滑方程)\\ \hat x_{t+h} = l_t + hb_t (预测方程) \end{array} \right . lt=αxt+(1α)(lt1+bt1)(水平平滑方程)bt=β(ltlt1)+(1β)bt1(趋势平滑方程)x^t+h=lt+hbt(预测方程)

  • t t t:当前期
  • h h h:预测超前期数
  • x t x_t xt:第t期的实际观测值
  • l t l_t lt:时刻t的预估水平
  • b t b_t bt:时刻t的预测趋势
  • α \alpha α:水平的平滑参数
  • β \beta β:趋势的平滑参数

我们已经能够看到,这里在继承简单平滑法(水平平滑)的基础上,又引入了对未来趋势的分析(趋势平滑),平滑系数则起到了平衡“惯性”(旧有预测)与“变化”(新增信息)的作用。
然而,这个模型依旧是不够理想的,且往往会出现预测过度的情况,所以后人又增加了“阻尼系数”的概念,用以抑制未来某一时刻的趋势,这一模型称为阻尼趋势模型
{ l t = α x t + ( 1 − α ) ( l t − 1 + ϕ b t − 1 ) (水平平滑方程) b t = β ( l t − l t − 1 ) + ( 1 − β ) ϕ b t − 1 (趋势平滑方程) x ^ t + h = l t + ( ϕ + ϕ 2 + ⋯ + ϕ h ) b t (预测方程) \left\{ \begin{array}{} l_t=\alpha x_t + (1 - \alpha )(l_{t-1} + \phi b_{t-1})(水平平滑方程) \\ b_t=\beta(l_t - l_{t-1}) + (1 - \beta)\phi b_{t-1}(趋势平滑方程)\\ \hat x_{t+h} = l_t + (\phi + \phi ^2 + \cdots +\phi ^h)b_t (预测方程) \end{array} \right . lt=αxt+(1α)(lt1+ϕbt1)(水平平滑方程)bt=β(ltlt1)+(1β)ϕbt1(趋势平滑方程)x^t+h=lt+(ϕ+ϕ2++ϕh)bt(预测方程)

  • t t t:当前期
  • h h h:预测超前期数
  • x t x_t xt:第t期的实际观测值
  • l t l_t lt:时刻t的预估水平
  • b t b_t bt:时刻t的预测趋势
  • α \alpha α:水平的平滑参数
  • β \beta β:趋势的平滑参数
  • ϕ \phi ϕ:阻尼系数, 0 < ϕ ≤ 1 0<\phi \leq 1 0<ϕ1

容易发现,当阻尼系数为1时,该模型退化为霍特线性模型。

12.4 季节性(周期性)模型

季节性的预测不同于上个模型的环比推导,更注重同期的比较。
{ l t = α ( x t − s t − m ) + ( 1 − α ) l t − 1 , (水平平滑方程) s t = γ ( x t − l t − 1 ) + ( 1 − γ ) s t − m , (季节平滑方程) x ^ t + h = l t + s t + h − m ( k + 1 ) , k = ⌊ h − 1 m ⌋ , (预测方程) \begin{cases} l_t=\alpha (x_t-s_{t-m})+(1 - \alpha )l_{t-1},(水平平滑方程)\\ s_t = \gamma (x_t - l_{t-1}) + (1 - \gamma )s_{t-m},(季节平滑方程)\\ \hat x_{t+h} = l_t + s_{t+h-m(k+1)},k=\lfloor \frac{h-1}{m} \rfloor ,(预测方程)\\ \end{cases} lt=α(xtstm)+(1α)lt1,(水平平滑方程)st=γ(xtlt1)+(1γ)stm,(季节平滑方程)x^t+h=lt+st+hm(k+1),k=mh1,(预测方程)

  • m m m:周期长度
  • α \alpha α:水平平滑参数
  • γ \gamma γ:季节平滑参数
  • h h h:预测超前期数
  • x ^ t + h \hat x_{t+h} x^t+h:第h期的预测值

与上一个模型复合起来,得到的模型可以更好地刻画增长趋势。
霍特-温特季节性加法模型,应用于较为稳定的、有季节性特征的情况
{ l t = α ( x t − s t − m ) + ( 1 − α ) ( l t − 1 + b t − 1 ) , (水平平滑方程) b t = β ( l t − l t − 1 ) + ( 1 − β ) b t − 1 , (趋势平滑方程) s t = γ ( x t − l t − 1 − b t − 1 ) + ( 1 − γ ) s t − m , (季节平滑方程) x ^ t + h = ( l t + h b t ) s t + h − m ( k + 1 ) , k = ⌊ h − 1 m ⌋ , (预测方程) \begin{cases} l_t=\alpha (x_t-s_{t-m})+(1 - \alpha )(l_{t-1} + b_{t-1}),(水平平滑方程)\\ b_t=\beta(l_t-l_{t-1})+(1 - \beta)b_{t-1},(趋势平滑方程)\\ s_t = \gamma (x_t - l_{t-1} - b_{t-1}) + (1 - \gamma )s_{t-m},(季节平滑方程)\\ \hat x_{t+h} = (l_t + hb_t) s_{t+h-m(k+1)},k=\lfloor \frac{h-1}{m} \rfloor ,(预测方程)\\ \end{cases} lt=α(xtstm)+(1α)(lt1+bt1),(水平平滑方程)bt=β(ltlt1)+(1β)bt1,(趋势平滑方程)st=γ(xtlt1bt1)+(1γ)stm,(季节平滑方程)x^t+h=(lt+hbt)st+hm(k+1),k=mh1,(预测方程)
霍特-温特季节性阻尼趋势模型,应用于稳定性不太强的情况。
{ l t = α x t s t − m + ( 1 − α ) ( l t − 1 + ϕ b t − 1 ) , (水平平滑方程) b t = β ( l t − l t − 1 ) + ( 1 − β ) ϕ b t − 1 , (趋势平滑方程) s t = γ x t l t − 1 + ϕ b t − 1 + ( 1 − γ ) s t − m , (季节平滑方程) x ^ t + h = ( l t + ( ϕ + ϕ 2 + ⋯ + ϕ h ) b t ) s t + h − m ( k + 1 ) , k = ⌊ h − 1 m ⌋ , (预测方程) \begin{cases} \displaystyle l_t=\alpha \frac{x_t}{s_{t-m}}+(1 - \alpha )(l_{t-1} + \phi b_{t-1}),(水平平滑方程)\\ b_t=\beta(l_t-l_{t-1})+(1 - \beta)\phi b_{t-1},(趋势平滑方程)\\ \displaystyle s_t = \gamma \frac{x_t}{l_{t-1} +\phi b_{t-1}} + (1 - \gamma )s_{t-m},(季节平滑方程)\\ \hat x_{t+h} =( l_t + (\phi + \phi ^2 + \cdots +\phi ^h)b_t) s_{t+h-m(k+1)},k=\lfloor \frac{h-1}{m} \rfloor ,(预测方程)\\ \end{cases} lt=αstmxt+(1α)(lt1+ϕbt1),(水平平滑方程)bt=β(ltlt1)+(1β)ϕbt1,(趋势平滑方程)st=γlt1+ϕbt1xt+(1γ)stm,(季节平滑方程)x^t+h=(lt+(ϕ+ϕ2++ϕh)bt)st+hm(k+1),k=mh1,(预测方程)
总结

12.5 时间序列的平稳性

平稳性指性质与观测时间无关的序列,因此,具有趋势或季节性的时间序列不是平稳的。值得注意的是,仅具有周期性行为的时间序列平稳的,因为周期长度不固定,我们预先不知道周期的波峰或波谷在哪。
若时间序列 { x t } \{x_t \} {xt}满足以下三个条件:
(1) E ( x t ) = E ( x t − s ) = u E(x_t)=E(x_{t-s})=u E(xt)=E(xts)=u(均值为固定常数)
(2) V a r ( x t ) = V a r ( x t − s = σ 2 Var(x_t) = Var(x_{t-s}=\sigma ^2 Var(xt)=Var(xts=σ2(方差存在且为常数)
(3) C o v ( x t , x t − s ) = γ s Cov(x_t,x_{t-s})=\gamma _s Cov(xt,xts)=γs(协方差只和间隔s有关,与t无关)
则称 x t {x_t} xt协方差稳定
要判断序列是否平稳,我们一般通过检查自相关系数ACF,定义: ρ s = c o v ( x 1 , x t − s ) V a r ( x t ) V a r ( x t − s ) = γ s γ 0 , 其中 γ 0 = C o v ( x 1 , x t ) = V a r ( x t ) \rho _s = \frac{cov(x_1,x_{t-s})}{\sqrt{Var(x_t)} \sqrt{Var(x_{t-s})}}=\frac{\gamma _s}{\gamma _0},其中\gamma _0 = Cov(x_1,x_t) = Var(x_t) ρs=Var(xt) Var(xts) cov(x1,xts)=γ0γs,其中γ0=Cov(x1,xt)=Var(xt)
这个量可以用来衡量间隔s的一对变量的相关系数。然而,由于某一个变量可能受其前面多个元素影响,对于 x t = ϕ s 1 x t − 1 + ⋯ ϕ s s x t − s + e t x_t = \phi _{s1}x_{t-1} + \cdots \phi _{ss}x_{t-s} + e_t xt=ϕs1xt1+ϕssxts+et,其中\phi _{ss}就是我们关注的偏自相关系数PACF。

十三、旅行商问题

有一个旅行商需要拜访每一个小镇后再回到家里,小镇之间两两可达且需要一定路费,该如何规划路线才能在总花费最少呢?
将这个问题转化为图论问题,即在一张带权无向图中,遍历所有点后返回的最小代价

一个简单的贪心思路是:先随便找一个圈,再思考如何对这个圈进行改良。对于初始圈,只需要给出这个点的排列就可以了,用 w ( i , j ) w(i,j) w(i,j)指代边权。
具体地,对于排列 P P P,若存在 i , j i,j i,j 满足: w ( i , i + 1 ) + w ( j , j + 1 ) < w ( i , j ) + w ( i + 1 , j + 1 ) w(i,i+1)+w(j,j+1)<w(i,j)+w(i+1,j+1) w(i,i+1)+w(j,j+1)<w(i,j)+w(i+1,j+1) 则断开 ( i , i + 1 ) (i,i+1) (i,i+1) ( j , j + 1 ) (j,j+1) (j,j+1),连接 ( i , j ) (i,j) (i,j) ( i + 1 , j ) (i+1,j) (i+1,j),重新构筑起一个圈。体现在排列 P P P上,即将 p i + 1 , p i + 2 , ⋯ p j p_{i+1},p_{i+2}, \cdots p_j pi+1,pi+2,pj 翻转(或称颠倒顺序),形成新的排列 P ′ P' P。这种算法称为改良圈算法。在实际应用中,为了增大正确性,往往需要设立多个初始圈执行算法。

当然,例子中的旅行商若增大到多个,那么模型又会有新的变化,这个我们日后再讨论。

十四、聚类分析入门

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2033808.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

项目管理中的关键节点——里程碑

里程碑作为项目管理过程中的关键节点&#xff0c;它不仅为项目团队提供了清晰的方向和阶段性目标&#xff0c;还确保了项目能够按照既定的路线稳步前进。 里程碑是项目进程中&#xff0c;那些标志着项目阶段完成或关键决策点的重大事件或时间点。与日常任务或活动不同&#x…

图论(强联通分量)

在图论中&#xff0c;特别是在讨论有向图&#xff08;Directed Graph&#xff09;时&#xff0c;我们常常需要了解图的结构特性&#xff0c;比如强联通分量&#xff08;Strongly Connected Components, SCC&#xff09;。了解强联通分量中的各种边对于理解图的整体结构以及某些…

iPhone官方商店软件下载---免费看各种剧第④弹【iOS版包括iPad】

①点击iPhone自带软件App Store ②点击搜索&#xff0c;输入“模数转换器” &#xff0c;点击下载到手机 ③进入软件页面后&#xff0c;我们需要激活页面&#xff0c;点击“setting”&#xff0c;再点击“feedback” ④在反馈界面输入“小饼干”&#xff0c;点击“Summit”&a…

springboot,mysql多数据源-mybaits

为啥要多数据源&#xff0c;因为我现在有个需求&#xff0c;需要将A库的查询结果&#xff0c;写入到B库。 但是原来的springboot里面就只有A库&#xff0c;所以现在要加上B库。 1.修改application.yaml的数据库连接 这个是原来的 现在改成 其实就是将datasource:xxx&#xff…

微型家庭中控STM32+C#上位机_(STM32部分)

今日尝试开发一款简单好学的 C8T6C#_Winform上位机 的微型家庭中控设备的 小试验品&#xff1a; 这个设备将成为我毕设系统的一个小部分...... 主要开发环境与工具介绍&#xff1a; 单片机 STM32F103C8T6 使用标准库函数编程 Visual Studio 2022软件 C# Winform 开发 上位机…

【相机与图像】2. 相机内外参的标定的代码示例

1 摄像头内参的标定 【相机标定具体操作】 使用将要标定的摄像头&#xff0c;以不同的角度采集棋盘格&#xff0c;要保证视野内出现完整的棋盘格。采集图片数量约15张左右即可。 以11*8的棋盘格为例&#xff0c;具体流程如下&#xff1a; step 1. 设置棋盘格3D点&#xff1b;通…

MapReduce_Writable序列化

使用序列化封装对象 将输入的csv按照员工号拆分成每个员工&#xff0c;每个员工存储为员工对象 数据处理过程 employee_noheader.csv 1,ZhangSan,101,5000 2,LiSi,102,6000 3,WangWu,101,5500 4,ZhaoLiu,103,7000 5,SunQi,102,6500pom.xml <?xml version"1.0&qu…

ctfshow-web入门-sql注入(web201-web205)系统练习sqlmap的使用

目录 1、web201 2、web202 3、web203 4、web204 5、web205 开始系统练习sqlmap的使用 1、web201 随便提交一个看下它调用的接口和请求的参数有哪些 可以看到 URL 为&#xff1a; https://32c7d026-d195-4074-a0f9-492c17dc1a2c.challenge.ctf.show/api/?id1&page1&…

微信答题小程序产品研发-前端开发

开发一款答题小程序界面&#xff0c;涉及到的技术栈&#xff0c;主要包括微信小程序的WXML、WXSS、JavaScript等。 由于时间有限&#xff0c;我先大致记录一下各个功能模块的基本开发概要&#xff0c;后面有空了再详细整理&#xff0c;分享给大家。 1. 首页 &#xff08;1&am…

Windows网络重置后无法连接网络

Windows网络重置后重启电脑无法连接到网络 打开命令提示符快捷键winR输入msconfig点击确定 在系统配置中找到服务先全部禁用&#xff0c;在全部启用&#xff0c;点击应用后重启电脑就可以了

LVS的简单配置及对Mysql主从复制的补充

Day 22 LVS的配置 环境准备 DSN() 用来解析各主机的域名和ip地址&#xff0c;配置域名解析huajuan&#xff0c;负责管理其他主机 web1--->web1.tangpin.huajuan web2--->web2.tangpin.huajuan dns--->dns.tangpin.huajuan web1(192.168.2.200) 用nginx…

解决 MacOS 连接公司 VPN 成功但是不能网络的问题

目录 解决办法2024 Mac mini 爆料 解决办法 操作比较简单&#xff0c;修改配置文件即可&#xff08;如果没有则需要手动创建&#xff09;。 sudo vim /etc/ppp/options在此文件下&#xff0c;加入 plugin L2TP.ppp&#xff1a; plugin L2TP.ppp如果文件里有l2tpnoipsec&…

基于ESP32的智能门锁系统测试

项目介绍 基于ESP32的智能门锁系统。可以运用在商务办公、家用住宅、酒店以及公租房短租公寓等领域。基于esp32的智能门锁系统是生物识别技术和嵌入式系统技术的完美结合&#xff0c;基于ESP32系统进行开发&#xff0c;同时在云端服务器搭建了MQTT服务器并连接开源的家庭自动化…

Apple Intelligence 最詳細解說

Apple Intelligence究竟是什麼&#xff1f; 顧名思義&#xff0c;Apple Intelligence就是Apple獨家開發的 AI 模型&#xff08;深度整合至 iOS 18、iPadOS 18 和 macOS Sequoia&#xff09;&#xff0c;旨在透過理解和生成語言和圖像、解讀上下文&#xff0c;並在特定App中執行…

【计算机网络】UDP实战

其实经过这几天写的几种不同的UDP的简易客户端与服务端&#xff0c;还是很有套路的&#xff0c;起手式都是非常像的。 更多的难点对我来说反而是解耦&#xff0c;各种各样的function一用&#xff0c;回调函数一调&#xff0c;呕吼&#xff0c;就会懵一下。 对于这篇文章&#x…

成功解决7版本的数据库导入 8版本数据库脚本报错问题

我 | 在这里 ⭐ 全栈开发攻城狮、全网10W粉丝、2022博客之星后端领域Top1、专家博主。 &#x1f393;擅长 指导毕设 | 论文指导 | 系统开发 | 毕业答辩 | 系统讲解等。已指导60位同学顺利毕业 ✈️个人公众号&#xff1a;热爱技术的小郑。回复 Java全套视频教程 或 前端全套视频…

大数据面试SQL(七):累加刚好超过各省GDP40%的地市名称

文章目录 累加刚好超过各省GDP40%的地市名称 一、题目 二、分析 三、SQL实战 四、样例数据参考 累加刚好超过各省GDP40%的地市名称 一、题目 现有各省地级市的gdp数据,求从高到低累加刚好超过各省GDP40%的地市名称&#xff0c;临界地市也需要。 例如&#xff1a; 浙江省…

设计模式-延迟加载(Lazy Load)

概念 一个对象&#xff0c;它虽然不包含所需要的所有数据&#xff0c;但是知道怎么获取这些数据。 加载一个对象会引起大量相关对象的加载&#xff0c;这样会损害系统的性能。延迟加载会暂时终止这个加载过程。 运行机制 四种实现延迟加载的方法&#xff1a; 延迟初始化&am…

ThreadLocal —— 让每个线程拥有自己的变量副本

在多线程编程中&#xff0c;数据共享是一个常见的话题。很多时候我们需要多个线程共享同一个数据&#xff0c;以实现数据的一致性和通信。然而&#xff0c;在一些场景下&#xff0c;我们并不希望数据被多个线程共享&#xff0c;而是希望每个线程都拥有自己独立的一份数据。这时…

【C++类和对象(中)】—— 我与C++的不解之缘(四)

前言&#xff1a; 接下来进行类和对象中的学习&#xff0c;了解类和对象的默认成员函数 一、类和对象默认成员函数 默认成员函数就是用户没有显示实现&#xff0c;编译器会自动生成的成员函数。 一个类&#xff0c;我们不显示实现的情况下&#xff0c;编译器就会默认生成一下留…