作者:老余捞鱼
原创不易,转载请标明出处及原作者。
写在前面的话:
最近遇到了 Time Mixer 模型,该模型以在复杂数据集上提供令人印象深刻的结果而闻名。出于好奇,我决定将其应用于我在 Kaggle 上找到的数据集,其中包含 Microsoft 的历史股票价格。在本文中,我们将探讨如何利用 Time Mixer 来预测 Microsoft 股票未来某个时段的实际收盘价,从而展示其在财务时间序列预测方面的潜力。
一、什么是Time Mixer?
时间混合器代表了时间序列分析向前迈出的重要一步,尤其是在处理目标变量随时间变化的复杂变化时。像 ARIMA 这样的传统模型可能难以捕捉这些复杂的模式,从而导致预测结果不佳。这就是 Time Mixer 的亮点。
Time Mixer 属于一类称为 Mixer 模型的新模型。这些模型旨在识别序列中的依赖关系和隐藏模式,就像转换器处理文本或图像的方式一样。与逐步处理序列的递归神经网络 (RNN) 和长短期记忆 (LSTM) 网络不同,时间混合器并行运行,使其能够更有效地处理序列。此外,与 transformer 相比,它更简单、更精简,使其成为传统方法不足的时间序列分析的令人兴奋的选择
时间混合器设计:
- Time-mixer 专门针对时间序列数据,其中涉及按时间顺序索引的数据点序列。它旨在有效地对时间依赖关系进行建模,同时捕获短期和长期模式。
- 该模型通常包括混合层,这些层处理 Importing 序列的方式允许模型学习复杂的时间模式,而无需明确的注意机制。
Time Mixer 的架构
二、探索性数据分析 (EDA)
data = pd.read_csv(“/content/Microsoft_Stock.csv”)
让我们从安装库开始,使用最常用的PIP安装模式。
pip install pandas
pip install numpy
pip install tensorflow
pip install sklearn
pip install matplotlib
深入研究数据,看看数据长什么样。
microsoft_data = pd.read_csv("/content/Microsoft_Stock.csv")
microsoft_data.head()
所以,这个数据框看起来有6列,分别是日期、开盘价、最高价、最低价、收盘价和成交量。让我们检查一下所有列的数据类型以及数据帧的形状。这个数据也是我们平时能接触到的最常见的股票数据。
microsoft_data.info()
<