当前位置: X-MOL 学术Ann. Am. Assoc. Geogr. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Effects of Data Preprocessing Methods on Addressing Location Uncertainty in Mobile Signaling Data
Annals of the American Association of Geographers ( IF 3.982 ) Pub Date : 2020-07-28
Yang Xu, Xinyu Li, Shih-Lung Shaw, Feng Lu, Ling Yin, Bi Yu Chen

Recent years have witnessed an increasing use of big data in mobility research. Such efforts have led to many insights on the travel behavior and activity patterns of people. Despite these achievements, the data veracity issue and its impact on the processes of knowledge discovery have seldom been discussed. In this research, we investigate the veracity issue of mobile signaling data (MSD) when they are used to characterize human mobility patterns. We first discuss the location uncertainty issues in MSD that would hinder accurate estimations of human mobility patterns, followed by an examination of two existing methods for addressing these issues (clustering-based method and time window–based method). We then propose a new approach that can overcome some of the limitations of these two methods. By applying all three methods to a large-scale mobile signaling data set, we find that the choice of preprocessing methods could lead to changes in the data characteristics. Such changes, which are nontrivial, will further affect the characterization and interpretation of human mobility patterns. By computing four mobility indicators (number of origin–destination trips, number of activity locations, total stay time, and activity entropy) from the outputs of the three methods, we illustrate their varying impacts on individual mobility estimations relevant to location uncertainty issues. Our analysis results call for more attention to the veracity issue in data-driven mobility research and its implications for replicability and reproducibility of geospatial research.



中文翻译:

数据预处理方法对解决移动信令数据中位置不确定性的影响

近年来,在移动性研究中目睹了大数据的使用越来越多。这种努力导致人们对人们的出行行为和活动方式有了许多见解。尽管取得了这些成就,但很少讨论数据准确性问题及其对知识发现过程的影响。在这项研究中,我们调查了移动信令数据(MSD)用于表征人类移动性模式时的准确性问题。我们首先讨论MSD中的位置不确定性问题,这会影响对人类活动模式的准确估计,然后讨论解决这些问题的两种现有方法(基于聚类的方法和基于时间窗的方法)。然后,我们提出一种可以克服这两种方法的某些局限性的新方法。通过将这三种方法应用于大规模移动信令数据集,我们发现预处理方法的选择可能导致数据特性的变化。这种微不足道的变化将进一步影响人类出行方式的表征和解释。通过从这三种方法的输出中计算出四个流动性指标(起点-目的地旅行次数,活动地点数量,总停留时间和活动熵),我们说明了它们对与位置不确定性问题相关的个人流动性估计的不同影响。我们的分析结果呼吁更多地关注数据驱动的流动性研究中的准确性问题及其对地理空间研究的可复制性和可再现性的影响。我们发现预处理方法的选择可能导致数据特征的变化。这种微不足道的变化将进一步影响人类出行方式的表征和解释。通过从这三种方法的输出中计算出四个流动性指标(起点-目的地旅行次数,活动地点数量,总停留时间和活动熵),我们说明了它们对与位置不确定性问题相关的个人流动性估计的不同影响。我们的分析结果呼吁更多地关注数据驱动的流动性研究中的准确性问题及其对地理空间研究的可复制性和可再现性的影响。我们发现预处理方法的选择可能导致数据特征的变化。这种微不足道的变化将进一步影响人类出行方式的表征和解释。通过从这三种方法的输出中计算出四个流动性指标(起点-目的地旅行次数,活动地点数量,总停留时间和活动熵),我们说明了它们对与位置不确定性问题相关的个人流动性估计的不同影响。我们的分析结果呼吁更多地关注数据驱动的流动性研究中的准确性问题及其对地理空间研究的可复制性和可再现性的影响。这将进一步影响人类出行方式的表征和解释。通过从这三种方法的输出中计算出四个流动性指标(起点-目的地旅行次数,活动地点数量,总停留时间和活动熵),我们说明了它们对与位置不确定性问题相关的个人流动性估计的不同影响。我们的分析结果呼吁更多地关注数据驱动的流动性研究中的准确性问题及其对地理空间研究的可复制性和可再现性的影响。这将进一步影响人类出行方式的特征和解释。通过从这三种方法的输出中计算出四个流动性指标(起点-目的地旅行次数,活动地点数量,总停留时间和活动熵),我们说明了它们对与位置不确定性问题相关的个人流动性估计的不同影响。我们的分析结果呼吁更多地关注数据驱动的流动性研究中的准确性问题及其对地理空间研究的可复制性和可再现性的影响。我们说明了它们对与位置不确定性问题相关的个体流动性估计的不同影响。我们的分析结果呼吁更多地关注数据驱动的流动性研究中的准确性问题及其对地理空间研究的可复制性和可再现性的影响。我们说明了它们对与位置不确定性问题相关的个体流动性估计的不同影响。我们的分析结果呼吁更多地关注数据驱动的流动性研究中的准确性问题及其对地理空间研究的可复制性和可再现性的影响。

更新日期:2020-07-28
down
wechat
bug