本文将提供有关如何使用线性回归模型在 Microsoft Excel 中执行简单而强大的预测的分步教程。
我们将探索模型的三种变体,并比较特定单变量数据集的结果——产品在 5 年内的月销售额。三个模型变体将是;
- 原始线性回归 (LR) 模型。
- 具有季节性的 LR 模型——确定特定月份的销售额如何波动,并通过调整我们的预测(希望提高先前模型的性能)来对这些信息做出反应。
- 具有季节性和增长的 LR 模型——如果销售额随着时间的推移而增加/减少(随着业务的增长/收缩),那么我们也可以迎合这种“增长因素”信息,再次有望提高模型的性能。
在这里我应该明确一点,并不是每个 LR 模型都需要季节性和增长因素才能获得最佳性能的模型。在决定应用哪种模型变体之前,由数据分析师/科学家观察数据并搜索这些模式——或者,您可以在选择采用哪种模型之前对所有三种模型进行试验并比较和评估性能.
线性回归 (LR) — Excel 实现
要开发 LR 模型,我们将首先设置我们的电子表格,如下所示。
- 最左边的列将跟踪我们的时间段计数(这应该始终从 1 开始并且每行递增 1)
- 第二列是描述,帮助我们理解数据(在本例中,告诉我们这个月属于哪一年)
- 第三列是实际时间段(在这个例子中我们使用日历月,你可以选择使用天、周、年来工作)。这些应该是顺序的
- 第四列包含我们的实际数据(即我们正在构建我们的模型并基于我们的未来预测)。当我们在下面绘制图表时,我