当前位置: X-MOL 学术Transp. Res. Part C Emerg. Technol. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Generating a synthetic probabilistic daily activity-location schedule using large-scale, long-term and low-frequency smartphone GPS data with limited activity information
Transportation Research Part C: Emerging Technologies ( IF 7.6 ) Pub Date : 2021-09-22 , DOI: 10.1016/j.trc.2021.103408
Yu Cui 1 , Qing He 2 , Ling Bian 3
Affiliation  

Household travel survey data is a critical input to travel behavior modeling, and it also can be used to generate trip schedules for activity-based traffic simulation. With emerging information and communication technology (ICT) tools like smartphones, the collection of passive datasets for travelers’ real-time information becomes available. Smartphone GPS survey apps have emerged to be a popular tool for conducting household travel surveys. Most existing studies employ high-frequency smartphone GPS data and collect accurate activity information. However, their study periods are still rather short, ranging from a few days to a few weeks. For a long-term GPS survey, the issues of missing activity information and sparse GPS data are inevitable and must be addressed carefully.

This paper uses 7-month low-frequency smartphone GPS data collected from over 2000 participants, who report 5 most frequently visited locations weekly. The essential goal is to develop a synthetic model of daily activity-location scheduling to capture data with both known and unknown activities. To handle missing activity data, this research develops a new probabilistic approach, which measures the probability of visiting a place by three scores, global visit score (GVS), temporal visit score (TVS), and periodical visit score (PVS). Three different levels of activity-location schedule are modeled respectively. The first level handles only those data with known activities, while data with unknown activities are disregarded. The second takes unknown activities into account but combines all types of them into a single category. The third one models each location with unknown activities separately. These models are able to generate activity-location schedule in different levels of detail for activity-based traffic simulator. After developing activity-location schedule models, both individual and aggregated validation processes are performed with simulation. The validation result shows that the simulated proportion of activity types and activity duration are close to the survey data, indicating the effectiveness of the proposed approaches. This research sheds a light on building sustainable and long-term travel survey using GPS data with missing activity information. In addition, this study will be valuable to model infectious disease transmission, e.g. COVID-19 and assess health risk in urban areas.



中文翻译:

使用具有有限活动信息的大规模、长期和低频智能手机 GPS 数据生成综合概率每日活动位置计划

家庭旅行调查数据是旅行行为建模的关键输入,也可用于生成基于活动的交通模拟的旅行时间表。借助智能手机等新兴信息和通信技术 (ICT) 工具,可以收集用于旅行者实时信息的被动数据集。智能手机 GPS 调查应用程序已成为进行家庭旅行调查的流行工具。大多数现有研究使用高频智能手机 GPS 数据并收集准确的活动信息。但是,他们的学习时间仍然很短,从几天到几周不等。对于长期的 GPS 调查,活动信息缺失和 GPS 数据稀疏的问题是不可避免的,必须认真解决。

本文使用从 2000 多名参与者收集的 7 个月低频智能手机 GPS 数据,这些参与者每周报告 5 个最常访问的位置。基本目标是开发一个日常活动位置调度的综合模型,以捕获具有已知和未知活动的数据。为了处理缺失的活动数据,本研究开发了一种新的概率方法,该方法通过全局访问分数(GVS)、时间访问分数(TVS)和定期访问分数(PVS)三个分数来衡量访问一个地方的概率。分别对三个不同级别的活动位置计划进行建模。第一级只处理那些具有已知活动的数据,而忽略具有未知活动的数据。第二种将未知活动考虑在内,但将所有类型的活动合并为一个类别。第三个模型分别对每个具有未知活动的位置进行建模。这些模型能够为基于活动的交通模拟器生成不同细节级别的活动位置时间表。在开发活动位置计划模型后,单独和聚合验证过程都通过模拟执行。验证结果表明,模拟的活动类型比例和活动持续时间与调查数据接近,表明所提方法的有效性。这项研究揭示了使用缺少活动信息的 GPS 数据建立可持续和长期的旅行调查。此外,这项研究对于模拟传染病传播(例如 COVID-19)和评估城市地区的健康风险也很有价值。这些模型能够为基于活动的交通模拟器生成不同细节级别的活动位置时间表。在开发活动位置计划模型之后,单独和聚合验证过程都通过模拟执行。验证结果表明,模拟的活动类型比例和活动持续时间与调查数据接近,表明所提方法的有效性。这项研究揭示了使用缺少活动信息的 GPS 数据建立可持续和长期的旅行调查。此外,这项研究对于模拟传染病传播(例如 COVID-19)和评估城市地区的健康风险也很有价值。这些模型能够为基于活动的交通模拟器生成不同细节级别的活动位置时间表。在开发活动位置计划模型之后,单独和聚合验证过程都通过模拟执行。验证结果表明,模拟的活动类型比例和活动持续时间与调查数据接近,表明所提方法的有效性。这项研究揭示了使用缺少活动信息的 GPS 数据建立可持续和长期的旅行调查。此外,这项研究对于模拟传染病传播(例如 COVID-19)和评估城市地区的健康风险也很有价值。在开发活动位置计划模型后,单独和聚合验证过程都通过模拟执行。验证结果表明,模拟的活动类型比例和活动持续时间与调查数据接近,表明所提方法的有效性。这项研究揭示了使用缺少活动信息的 GPS 数据建立可持续和长期的旅行调查。此外,这项研究对于模拟传染病传播(例如 COVID-19)和评估城市地区的健康风险也很有价值。在开发活动位置计划模型后,单独和聚合验证过程都通过模拟执行。验证结果表明,模拟的活动类型比例和活动持续时间与调查数据接近,表明所提方法的有效性。这项研究揭示了使用缺少活动信息的 GPS 数据建立可持续和长期的旅行调查。此外,这项研究对于模拟传染病传播(例如 COVID-19)和评估城市地区的健康风险也很有价值。表明所提出方法的有效性。这项研究揭示了使用缺少活动信息的 GPS 数据建立可持续和长期的旅行调查。此外,这项研究对于模拟传染病传播(例如 COVID-19)和评估城市地区的健康风险也很有价值。表明所提出方法的有效性。这项研究揭示了使用缺少活动信息的 GPS 数据建立可持续和长期的旅行调查。此外,这项研究对于模拟传染病传播(例如 COVID-19)和评估城市地区的健康风险也很有价值。

更新日期:2021-09-23
down
wechat
bug