当前位置: X-MOL 学术Appl. Numer. Math. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
A low cost and highly accurate technique for big data spatial-temporal interpolation
Applied Numerical Mathematics ( IF 2.8 ) Pub Date : 2020-07-01 , DOI: 10.1016/j.apnum.2020.03.009
M. Esmaeilbeigi , O. Chatrabgoun , A. Hosseinian-Far , R. Montasari , A. Daneshkhah

Abstract The high velocity, variety and volume of data generation by today's systems have necessitated Big Data (BD) analytic techniques. This has penetrated a wide range of industries; BD as a notion has various types and characteristics, and therefore a variety of analytic techniques would be required. The traditional analysis methods are typically unable to analyse spatial-temporal BD. Interpolation is required to approximate the values between the already existing data points, yet since there exist both location and time dimensions, only a multivariate interpolation would be appropriate. Nevertheless, existing software are unable to perform such complex interpolations. To overcome this challenge, this paper presents a layer by layer interpolation approach for spatial-temporal BD. Developing this layered structure provides the opportunity for working with much smaller linear system of equations. Consequently, this structure increases the accuracy and stability of numerical structure of the considered BD interpolation. To construct this layer by layer interpolation, we have used the good properties of Radial Basis Functions (RBFs). The proposed new approach is applied to numerical examples in spatial-temporal big data and the obtained results confirm the high accuracy and low computational cost. Finally, our approach is applied to explore one of the air pollution indices, i.e. daily P M 2.5 concentration, based on different stations in the contiguous United States, and it is evaluated by leave-one-out cross validation.

中文翻译:

一种低成本、高精度的大数据时空插值技术

摘要 当今系统生成的数据速度快、种类多、容量大,因此需要大数据 (BD) 分析技术。这已经渗透到广泛的行业;BD 作为一个概念具有多种类型和特征,因此需要多种分析技术。传统的分析方法通常无法分析时空BD。需要插值来近似现有数据点之间的值,但由于存在位置和时间维度,因此只有多元插值才是合适的。然而,现有软件无法执行如此复杂的插值。为了克服这一挑战,本文提出了一种用于时空 BD 的逐层插值方法。开发这种分层结构为处理更小的线性方程组提供了机会。因此,这种结构增加了所考虑的 BD 插值的数值结构的准确性和稳定性。为了构建这个逐层插值,我们使用了径向基函数 (RBF) 的良好特性。将所提出的新方法应用于时空大数据中的数值例子,所得结果证实了其高精度和低计算成本。最后,我们的方法被应用于探索空气污染指数之一,即基于美国本土不同站点的每日 PM 2.5 浓度,并通过留一法交叉验证进行评估。这种结构增加了所考虑的 BD 插值的数值结构的准确性和稳定性。为了构建这个逐层插值,我们使用了径向基函数 (RBF) 的良好特性。将所提出的新方法应用于时空大数据中的数值例子,所得结果证实了其高精度和低计算成本。最后,我们的方法被应用于探索空气污染指数之一,即基于美国本土不同站点的每日 PM 2.5 浓度,并通过留一法交叉验证进行评估。这种结构增加了所考虑的 BD 插值的数值结构的准确性和稳定性。为了构建这个逐层插值,我们使用了径向基函数 (RBF) 的良好特性。将所提出的新方法应用于时空大数据中的数值例子,所得结果证实了其高精度和低计算成本。最后,我们的方法被应用于探索空气污染指数之一,即基于美国本土不同站点的每日 PM 2.5 浓度,并通过留一法交叉验证进行评估。将所提出的新方法应用于时空大数据中的数值例子,所得结果证实了其高精度和低计算成本。最后,我们的方法被应用于探索空气污染指数之一,即基于美国本土不同站点的每日 PM 2.5 浓度,并通过留一法交叉验证进行评估。将所提出的新方法应用于时空大数据中的数值例子,所得结果证实了其高精度和低计算成本。最后,我们的方法被应用于探索空气污染指数之一,即基于美国本土不同站点的每日 PM 2.5 浓度,并通过留一法交叉验证进行评估。
更新日期:2020-07-01
down
wechat
bug