×

典型时间序列预测模型比较分析

hqy hqy 发表于2025-04-27 13:04:48 浏览5 评论0百度已收录

抢沙发发表评论

我们将探讨五种主要方法:

SARIMAX:检测重复出现的模式并考虑各种外部影响。RNN: 分析顺序数据,适用于按时间顺序排列的信息。LSTM:通过长时间保留数据来增强 RNN。Prophet: 由 Facebook 开发,对数据缺口和重大趋势变化具有强大的抵抗能力。Transformer: 利用自我关注,有效识别复杂模式。

时间序列识别概述

我们使用 “电力生产 ”数据集探索时间序列识别。我们的目标是计算该数据的月平均值,从而发现准确预测所必需的关键趋势和模式。

预测技术

利用 SARIMAX 进行时间序列预测

确定数据集的 ARIMA 模型参数后,我们就可以使用 SARIMAX 进行预测了。SARIMAX 代表带有外生因素的季节性自回归整合移动平均模型,通过纳入季节周期和外部变量的潜在影响来增强 ARIMA。

我们使用平均绝对百分比误差 (MAPE) 作为评估预测准确性的指标。同样的方法可应用于其他数据集,从而确保我们预测方法的一致性。

利用 RNN 进行时间序列预测

递归神经网络(RNN)在时间序列预测中表现突出,因为它能通过隐藏状态动态记忆过去的信息。这与 SARIMAX 的线性建模方法形成鲜明对比,因为 RNN 可以以非线性方式对数据进行建模,使其在理解和预测随时间变化的模式方面表现出色。

以下是简化代码概述:

预处理: 调整季节性并规范化数据,为 RNN 做准备。序列准备: 将数据转换为序列,用于 RNN 训练,模拟时间依赖关系。RNN 架构: 利用 RNN 层进行时间处理,利用线性层进行预测。训练: 在历时上迭代以最小化损失,并通过反向传播更新模型。预测: 应用所学模式预测测试集的未来值。反变换: 将预测值调整回原始比例,以供评估。准确度评估: 采用 MAPE 量化模型的预测准确性。

利用 LSTM 进行时间序列预测

长短期记忆(LSTM)网络旨在通过更好地管理长期依赖性和异常值来改进递归神经网络(RNN)。然而,LSTM 的真正功效因数据集而异,这凸显了经验验证的必要性。在即将对 “电力生产 ”等数据集进行的研究中,我们的目标是对不同算法进行数据驱动的评估,纯粹关注经验结果而非理论预期。

与 RNN 相比,LSTM 在编码方面的显著差异在于模型的构建。LSTM 包括nn.LSTM层,而不是 nn.RNN,专门应对学习时间序列数据中长期依赖关系的挑战。这一结构调整是在实际预测任务中发挥 LSTM 理论优势的关键。

使用 Facebook Prophet 进行时间序列预测

从理论上讲,Facebook Prophet 旨在通过处理非线性趋势、季节性变化和节假日影响来改进预测。它对不同业务预测要求的适应性,尤其是管理缺失数据和适应趋势突变的能力,受到了关注。

Prophet 特别适用于以下业务预测环境:

数据跨度从每月到每年,具有显著的季节性模式。可预测发生的有影响的节假日。诱发趋势变化的外部因素,如产品发布。接近饱和的增长趋势。

使用注意力转换器进行时间序列预测

注意力转换器最初是为自然语言处理(NLP)而开发的,现在正被用于时间序列预测。从理论上讲,注意力变换器能够权衡不同输入数据点的重要性,从而能够细致入微地理解复杂的时间关系,这与 RNN 的顺序处理有所不同。

在时间序列中使用变形器还处于尝试阶段,目的是利用其注意力机制来预测不同数据集的趋势和季节性模式。

以下是使用 Transformers 进行时间序列预测的关键步骤:

位置编码: 为数据添加唯一的位置信息,帮助模型掌握序列顺序,而无需像 RNN 那样逐步处理数据。transformer模型设置: 包括处理数据(编码器)和生成预测(解码器)的层,并根据时间序列的具体情况进行调整。模型训练: 包括在训练数据上优化模型,以减少预测误差。预测: 应用训练有素的模型预测未来值,重塑输入数据以符合转换器的预期。重新添加季节性: 将之前去除的季节性模式与预测重新整合,以准确反映现实世界的相关性。模型评估: 使用平均绝对百分比误差 (MAPE) 评估模型的性能。

结果与比较

RNN 和 Prophet: 这两种方法在准确性和一致性方面表现突出。RNN 尤其擅长处理复杂的数据集,而 Prophet 则在处理季节性较强的数据集时表现出色。

Transformers: 尽管 Transformers 在 NLP 中取得了成功,但在时间序列预测中的效果有限,这表明在应用于这一领域时需要进一步改进。

SARIMAX 和 Prophet: 这些方法适用于具有确定的 ARIMA 结构或较小规模的数据集,因为它们不太容易出现与神经网络相关的过拟合风险。

周期/周期处理: 准确识别和整合周期/循环信息至关重要。与需要手动输入的 RNN 和 LSTM 不同,Prophet 和 SARIMAX 能够更好地自动考虑季节效应。

参数重要性: 对于 Prophet,季节性先验尺度、周期和傅立叶阶数等参数对其季节性建模能力有很大影响。在 RNN 和 LSTM 中,学习率和 dropout=0.2 对实现有效学习和泛化起着至关重要的作用。

计算速度: Prophet 和 SARIMAX 的计算速度更快,与基于神经网络的方法(如 RNN 和 LSTM)相比具有明显优势,后者需要更多时间对大型数据集进行训练。

写在最后

在对 SARIMAX、RNN、LSTM、Prophet 和 Transformer 等时间序列预测方法的比较分析中,我们发现方法的选择对不同数据集的预测准确性有显著影响。RNN 和 Prophet 分别在处理复杂数据和季节性数据方面表现出色,而 LSTM 并不总是如预期那样优于 RNN。Transformers 在其 NLP 大本营以外的领域举步维艰,这表明它们需要适应时间序列预测。

我们的研究结果强调了选择适当模型和微调参数以适应当前数据集具体特征的重要性。尽管预计 LSTM 在管理长期依赖性方面具有优势,但我们的研究结果主张采用更细致的方法来选择模型。这一探索不仅挑战了现有的假设,还为进一步研究开辟了道路,从而在不断发展的时间序列分析领域提高预测精度。