当前位置: X-MOL 学术Gas Sci. Eng. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
A comparative study on outlier detection techniques for noisy production data
Gas Science and Engineering ( IF 5.285 ) Pub Date : 2022-07-19 , DOI: 10.1016/j.jngse.2022.104720
H.S. Jha , A. Khanal , H.M.D. Seikh , W.J. Lee

Decline curve analyses (DCA) and rate transient analyses (RTA) are widely used to characterize the fluid flow through porous media and forecast future production. Oil and gas production data are routinely analyzed for history matching and optimizing the well stimulation methods in hydrocarbon exploration and production lifecycle. However, outliers add significant uncertainty and non-uniqueness to results from production data analysis. This study provides a structured and comprehensive overview of five widely used outlier detection (OD) techniques for identifying and removing outliers in production data. Each OD technique measures deviation differently and, therefore, has a different outcome even when applied to the same dataset, creating the need to test several methods and find the optimal technique for identifying and removing outliers from production data. First, we generated production data from a typical multi-fractured horizontal well using a numerical reservoir simulator and added random noise to the data. Then, we used five different OD techniques to identify the prelabeled outliers from the synthetic production data. Finally, we identified the best-performing OD algorithm by comparing the various evaluation metrics such as the mean absolute error (MAE), precision, sensitivity, and F1 score. Results showed that the angle-based OD (ABOD) had the best MAE, precision, sensitivity, and F1 score of 8%, 85%, 98%, and 0.90, respectively. The next best-performing OD technique was distance-based OD (DBOD), with MAE, precision, sensitivity, and F1 score of 16%, 71%, 100%, and 0.83, respectively. We tested the ABOD method on several field production datasets by assuming different outlier thresholds (fraction of the data points likely to be outliers). Visual inspection of the processed data showed that the ABOD method effectively identified and removed the outliers from a relatively clean dataset (outlier threshold of 20%) and a highly noisy dataset (outlier threshold of 80%). This algorithm is intuitive and can effectively identify and remove outliers from the field production data to improve production forecasting, reserves estimation, and rate transient analysis for multi-fractured horizontal oil and gas reservoirs.



中文翻译:

噪声生产数据异常值检测技术的比较研究

下降曲线分析 (DCA) 和速率瞬态分析 (RTA) 广泛用于表征通过多孔介质的流体流动和预测未来产量。定期分析油气生产数据以进行历史匹配和优化油气勘探和生产生命周期中的油井增产方法。然而,异常值给生产数据分析的结果增加了很大的不确定性和非唯一性。本研究对用于识别和消除生产数据中异常值的五种广泛使用的异常值检测 (OD) 技术进行了结构化和全面的概述。每种 OD 技术测量偏差因此,即使应用于相同的数据集也会产生不同的结果,因此需要测试几种方法并找到从生产数据中识别和删除异常值的最佳技术。首先,我们使用数值油藏模拟器从典型的多裂缝水平井生成生产数据,并在数据中添加随机噪声。然后,我们使用五种不同的 OD 技术从合成生产数据中识别出预先标记的异常值。最后,我们通过比较各种评估指标,如平均绝对误差 (MAE)、精度、灵敏度和 F1 分数,确定了性能最佳的 OD 算法。结果表明,基于角度的 OD (ABOD) 具有最佳的 MAE、精度、灵敏度和 F1 分数,分别为 8%、85%、98% 和 0.90。下一个表现最好的 OD 技术是基于距离的 OD (DBOD),其 MAE、精度、灵敏度和 F1 得分分别为 16%、71%、100% 和 0.83。我们通过假设不同的异常值阈值(可能是异常值的数据点的一部分)在几个现场生产数据集上测试了 ABOD 方法。对处理后的数据进行目视检查表明,ABOD 方法有效地从相对干净的数据集(异常值阈值为 20%)和高噪声数据集(异常值阈值为 80%)中识别和去除了异常值。该算法直观,可有效识别和去除油田生产数据中的异常值,以改进多裂缝水平油气藏的产量预测、储量估算和速率瞬态分析。F1 得分分别为 16%、71%、100% 和 0.83。我们通过假设不同的异常值阈值(可能是异常值的数据点的一部分)在几个现场生产数据集上测试了 ABOD 方法。对处理后的数据进行目视检查表明,ABOD 方法有效地从相对干净的数据集(异常值阈值为 20%)和高噪声数据集(异常值阈值为 80%)中识别和去除了异常值。该算法直观,可有效识别和去除油田生产数据中的异常值,以改进多裂缝水平油气藏的产量预测、储量估算和速率瞬态分析。F1 得分分别为 16%、71%、100% 和 0.83。我们通过假设不同的异常值阈值(可能是异常值的数据点的一部分)在几个现场生产数据集上测试了 ABOD 方法。对处理后的数据进行目视检查表明,ABOD 方法有效地从相对干净的数据集(异常值阈值为 20%)和高噪声数据集(异常值阈值为 80%)中识别和去除了异常值。该算法直观,可有效识别和去除油田生产数据中的异常值,以改进多裂缝水平油气藏的产量预测、储量估算和速率瞬态分析。我们通过假设不同的异常值阈值(可能是异常值的数据点的一部分)在几个现场生产数据集上测试了 ABOD 方法。对处理后的数据进行目视检查表明,ABOD 方法有效地从相对干净的数据集(异常值阈值为 20%)和高噪声数据集(异常值阈值为 80%)中识别和去除了异常值。该算法直观,可有效识别和去除油田生产数据中的异常值,以改进多裂缝水平油气藏的产量预测、储量估算和速率瞬态分析。我们通过假设不同的异常值阈值(可能是异常值的数据点的一部分)在几个现场生产数据集上测试了 ABOD 方法。对处理后的数据进行目视检查表明,ABOD 方法有效地从相对干净的数据集(异常值阈值为 20%)和高噪声数据集(异常值阈值为 80%)中识别和去除了异常值。该算法直观,可有效识别和去除油田生产数据中的异常值,以改进多裂缝水平油气藏的产量预测、储量估算和速率瞬态分析。对处理后的数据进行目视检查表明,ABOD 方法有效地从相对干净的数据集(异常值阈值为 20%)和高噪声数据集(异常值阈值为 80%)中识别和去除了异常值。该算法直观,可有效识别和去除油田生产数据中的异常值,以改进多裂缝水平油气藏的产量预测、储量估算和速率瞬态分析。对处理后的数据进行目视检查表明,ABOD 方法有效地从相对干净的数据集(异常值阈值为 20%)和高噪声数据集(异常值阈值为 80%)中识别和去除了异常值。该算法直观,可有效识别和去除油田生产数据中的异常值,以改进多裂缝水平油气藏的产量预测、储量估算和速率瞬态分析。

更新日期:2022-07-19
down
wechat
bug