当前位置: X-MOL 学术Pattern Recogn. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Improving the accuracy of global forecasting models using time series data augmentation
Pattern Recognition ( IF 7.5 ) Pub Date : 2021-07-09 , DOI: 10.1016/j.patcog.2021.108148
Kasun Bandara 1 , Hansika Hewamalage 1 , Yuan-Hao Liu 1 , Yanfei Kang 2 , Christoph Bergmeir 1
Affiliation  

Forecasting models that are trained across sets of many time series, known as Global Forecasting Models (GFM), have shown recently promising results in forecasting competitions and real-world applications, outperforming many state-of-the-art univariate forecasting techniques. In most cases, GFMs are implemented using deep neural networks, and in particular Recurrent Neural Networks (RNN), which require a sufficient amount of time series to estimate their numerous model parameters. However, many time series databases have only a limited number of time series. In this study, we propose a novel, data augmentation based forecasting framework that is capable of improving the baseline accuracy of the GFM models in less data-abundant settings. We use three time series augmentation techniques: GRATIS, moving block bootstrap (MBB), and dynamic time warping barycentric averaging (DBA) to synthetically generate a collection of time series. The knowledge acquired from these augmented time series is then transferred to the original dataset using two different approaches: the pooled approach and the transfer learning approach. When building GFMs, in the pooled approach, we train a model on the augmented time series alongside the original time series dataset, whereas in the transfer learning approach, we adapt a pre-trained model to the new dataset. In our evaluation on competition and real-world time series datasets, our proposed variants can significantly improve the baseline accuracy of GFM models and outperform state-of-the-art univariate forecasting methods.



中文翻译:

使用时间序列数据增强提高全球预测模型的准确性

跨多个时间序列集训练的预测模型,称为全球预测模型 (GFM),最近在预测竞赛和实际应用中显示出有希望的结果,优于许多最先进的单变量预测技术。在大多数情况下,GFM 是使用深度神经网络实现的,尤其是循环神经网络 (RNN),它需要足够数量的时间序列来估计其众多模型参数。但是,许多时间序列数据库只有有限数量的时间序列。在这项研究中,我们提出了一种新颖的、基于数据增强的预测框架,该框架能够在数据较少的环境中提高 GFM 模型的基线准确性。我们使用三种时间序列增强技术:GRATIS、移动块引导(MBB)、和动态时间扭曲重心平均 (DBA) 以综合生成时间序列的集合。然后使用两种不同的方法将从这些增强的时间序列中获得的知识转移到原始数据集:池化方法和转移学习方法。在构建 GFM 时,在池化方法中,我们在原始时间序列数据集旁边训练增强时间序列模型,而在迁移学习方法中,我们将预先训练的模型适应新数据集。在我们对竞争和现实世界时间序列数据集的评估中,我们提出的变体可以显着提高 GFM 模型的基线精度,并优于最先进的单变量预测方法。然后使用两种不同的方法将从这些增强的时间序列中获得的知识转移到原始数据集:池化方法和转移学习方法。在构建 GFM 时,在池化方法中,我们在原始时间序列数据集旁边训练增强时间序列模型,而在迁移学习方法中,我们将预先训练的模型适应新数据集。在我们对竞争和现实世界时间序列数据集的评估中,我们提出的变体可以显着提高 GFM 模型的基线精度,并优于最先进的单变量预测方法。然后使用两种不同的方法将从这些增强的时间序列中获得的知识转移到原始数据集:池化方法和转移学习方法。在构建 GFM 时,在池化方法中,我们在原始时间序列数据集旁边训练增强时间序列模型,而在迁移学习方法中,我们将预先训练的模型适应新数据集。在我们对竞争和现实世界时间序列数据集的评估中,我们提出的变体可以显着提高 GFM 模型的基线精度,并优于最先进的单变量预测方法。我们在原始时间序列数据集旁边训练一个增强时间序列模型,而在迁移学习方法中,我们将预先训练的模型适应新数据集。在我们对竞争和现实世界时间序列数据集的评估中,我们提出的变体可以显着提高 GFM 模型的基线精度,并优于最先进的单变量预测方法。我们在原始时间序列数据集旁边训练了一个增强时间序列模型,而在迁移学习方法中,我们将预先训练的模型调整到新数据集。在我们对竞争和现实世界时间序列数据集的评估中,我们提出的变体可以显着提高 GFM 模型的基线精度,并优于最先进的单变量预测方法。

更新日期:2021-07-16
down
wechat
bug