当前位置: X-MOL 学术Earth Space Sci. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
A Framework for the Cross‐Validation of Categorical Geostatistical Simulations
Earth and Space Science ( IF 3.1 ) Pub Date : 2020-08-17 , DOI: 10.1029/2020ea001152
Przemysław Juda 1 , Philippe Renard 1 , Julien Straubhaar 1
Affiliation  

The mapping of subsurface parameters and the quantification of spatial uncertainty requires selecting adequate models and their parameters. Cross‐validation techniques have been widely used for geostatistical model selection for continuous variables, but the situation is different for categorical variables. In these cases, cross‐validation is seldom applied, and there is no clear consensus on which method to employ. Therefore, this paper proposes a systematic framework for the cross‐validation of geostatistical simulations of categorical variables such as geological facies. The method is based on K‐fold cross‐validation combined with a proper scoring rule. It can be applied whenever an observation data set is available. At each cross‐validation iteration, the training set becomes conditioning data for the tested geostatistical model, and the ensemble of simulations is compared to true values. The proposed framework is generic. Its application is illustrated with two examples using multiple‐point statistics simulations. In the first test case, the aim is to identify a training image from a given data set. In the second test case, the aim is to identify the parameters in a situation including nonstationarity for a coastal alluvial aquifer in the south of France. Cross‐validation scores are used as metrics of model performance and quadratic scoring rule, zero‐one score, and balanced linear score are compared. The study shows that the proposed fivefold stratified cross‐validation with the quadratic scoring rule allows ranking the geostatistical models and helps to identify the proper parameters.

中文翻译:

分类地统计模拟的交叉验证框架

地下参数的映射和空间不确定性的量化要求选择适当的模型及其参数。交叉验证技术已广泛用于连续变量的地统计模型选择,但分类变量的情况则有所不同。在这些情况下,很少使用交叉验证,并且对于使用哪种方法也没有明确的共识。因此,本文为分类变量(如地质相)的地统计学模拟的交叉验证提供了一个系统框架。该方法基于K折交叉验证结合适当的评分规则。只要观察数据集可用,就可以应用它。在每次交叉验证迭代中,训练集都会成为经过测试的地统计模型的条件数据,并将模拟的集合与真实值进行比较。提议的框架是通用的。使用多点统计仿真通过两个示例说明了其应用。在第一个测试用例中,目标是从给定的数据集中识别出训练图像。在第二个测试用例中,目的是在包括法国南部沿海冲积含水层的非平稳性在内的情况下识别参数。交叉验证得分用作模型性能的指标,并且比较二次得分规则,零得分和平衡线性得分。研究表明,采用二次评分规则提出的五重分层交叉验证可以对地统计学模型进行排名,并有助于确定适当的参数。使用多点统计仿真通过两个示例说明了其应用。在第一个测试用例中,目标是从给定的数据集中识别出训练图像。在第二个测试用例中,目的是在包括法国南部沿海冲积含水层的非平稳性在内的情况下识别参数。交叉验证得分用作模型性能的指标,并且比较二次得分规则,零得分和平衡线性得分。研究表明,采用二次评分规则提出的五重分层交叉验证可以对地统计学模型进行排名,并有助于确定适当的参数。使用多点统计仿真通过两个示例说明了其应用。在第一个测试用例中,目标是从给定的数据集中识别出训练图像。在第二个测试用例中,目的是在包括法国南部沿海冲积含水层的非平稳性在内的情况下识别参数。交叉验证得分用作模型性能的指标,并且比较二次得分规则,零得分和平衡线性得分。研究表明,采用二次评分规则提出的五重分层交叉验证可以对地统计学模型进行排名,并有助于确定适当的参数。在第二个测试用例中,目的是在包括法国南部沿海冲积含水层的非平稳性在内的情况下识别参数。交叉验证得分用作模型性能的指标,并且比较二次得分规则,零得分和平衡线性得分。研究表明,采用二次评分规则提出的五重分层交叉验证可以对地统计学模型进行排名,并有助于确定适当的参数。在第二个测试用例中,目的是在包括法国南部沿海冲积含水层的非平稳性在内的情况下识别参数。交叉验证得分用作模型性能的指标,并且比较二次得分规则,零得分和平衡线性得分。研究表明,采用二次评分规则提出的五重分层交叉验证可以对地统计学模型进行排名,并有助于确定适当的参数。
更新日期:2020-08-17
down
wechat
bug