当前位置: X-MOL 学术Spat. Stat. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
A selective view of climatological data and likelihood estimation
Spatial Statistics ( IF 2.1 ) Pub Date : 2022-01-25 , DOI: 10.1016/j.spasta.2022.100596
Federico Blasi 1 , Christian Caamaño-Carrillo 2 , Moreno Bevilacqua 3 , Reinhard Furrer 4
Affiliation  

This article gives a narrative overview of what constitutes climatological data and their typical features, with a focus on aspects relevant to statistical modeling. We restrict the discussion to univariate spatial fields and focus on maximum likelihood estimation. To address the problem of enormous datasets, we study three common approximation schemes: tapering, direct misspecification, and composite likelihood for Gaussian and non-Gaussian distributions. We focus particularly on the so-called ‘sinh-arcsinh distribution’, obtained through a specific transformation of the Gaussian distribution. Because it has flexible marginal distributions—possibly skewed and/or heavy-tailed—it has a wide range of applications. One appealing property of the transformation involved is the existence of an explicit inverse transformation that makes likelihood-based methods straightforward. We describe a simulation study illustrating the effects of the different approximation schemes. To the best of our knowledge, a direct comparison of tapering, direct misspecification, and composite likelihood has never been made previously, and we show that direct misspecification is inferior. In some metrics, composite likelihood has a minor advantage over tapering. We use the estimation approaches to model a high-resolution global climate change field. All simulation code is available as a docker container and is thus fully reproducible. Additionally, the present article describes where and how to get various climate datasets.



中文翻译:

气候数据和可能性估计的选择性视图

本文对气候数据的构成及其典型特征进行了叙述性概述,重点关注与统计建模相关的方面。我们将讨论限制在单变量空间领域,并专注于最大似然估计。为了解决庞大数据集的问题,我们研究了三种常见的近似方案:锥形、直接错误指定以及高斯和非高斯分布的复合似然。我们特别关注所谓的“sinh-arcsinh 分布”,它是通过对高斯分布的特定变换获得的。因为它具有灵活的边际分布(可能是偏斜和/或重尾分布),所以它具有广泛的应用范围。所涉及的变换的一个吸引人的特性是存在显式逆变换,这使得基于似然的方法变得简单。我们描述了一项模拟研究,说明了不同近似方案的影响。据我们所知,以前从未对锥度、直接错误指定和复合似然进行直接比较,并且我们表明直接错误指定较差。在某些指标中,复合似然比逐渐减少具有较小的优势。我们使用估计方法来模拟高分辨率的全球气候变化场。所有模拟代码都可以作为 docker 容器使用,因此是完全可重现的。此外,本文还介绍了在何处以及如何获取各种气候数据集。我们描述了一项模拟研究,说明了不同近似方案的影响。据我们所知,以前从未对锥度、直接错误指定和复合似然进行直接比较,并且我们表明直接错误指定较差。在某些指标中,复合似然比逐渐减少具有较小的优势。我们使用估计方法来模拟高分辨率的全球气候变化场。所有模拟代码都可以作为 docker 容器使用,因此是完全可重现的。此外,本文还介绍了在何处以及如何获取各种气候数据集。我们描述了一项模拟研究,说明了不同近似方案的影响。据我们所知,以前从未对锥度、直接错误指定和复合似然进行直接比较,并且我们表明直接错误指定较差。在某些指标中,复合似然比逐渐减少具有较小的优势。我们使用估计方法来模拟高分辨率的全球气候变化场。所有模拟代码都可以作为 docker 容器使用,因此是完全可重现的。此外,本文还介绍了在何处以及如何获取各种气候数据集。我们表明直接错误指定是劣等的。在某些指标中,复合似然比逐渐减少具有较小的优势。我们使用估计方法来模拟高分辨率的全球气候变化场。所有模拟代码都可以作为 docker 容器使用,因此是完全可重现的。此外,本文还介绍了在何处以及如何获取各种气候数据集。我们表明直接错误指定是劣等的。在某些指标中,复合似然比逐渐减少具有较小的优势。我们使用估计方法来模拟高分辨率的全球气候变化场。所有模拟代码都可以作为 docker 容器使用,因此是完全可重现的。此外,本文还介绍了在何处以及如何获取各种气候数据集。

更新日期:2022-01-26
down
wechat
bug