当前位置: X-MOL 学术Transp. Res. Rec. J. Transp. Res. Board › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Understanding Ridesplitting Behavior with Interpretable Machine Learning Models Using Chicago Transportation Network Company Data
Transportation Research Record: Journal of the Transportation Research Board ( IF 1.6 ) Pub Date : 2021-09-11 , DOI: 10.1177/03611981211036363
Hoseb Abkarian 1 , Ying Chen 1 , Hani S. Mahmassani 1
Affiliation  

As congestion levels increase in cities, it is important to analyze people’s choices of different services provided by transportation network companies (TNCs). Using machine learning techniques in conjunction with large TNC data, this paper focuses on uncovering complex relationships underlying ridesplitting market share. A real-world dataset provided by TNCs in Chicago is used in analyzing ridesourcing trips from November 2018 to December 2019 to understand trends in the city. Aggregated origin–destination trip-level characteristics, such as mean cost, mean time, and travel time reliability, are extracted and combined with origin–destination community-level characteristics. Three tree-based algorithms are then utilized to model the market share of ridesplitting trips. The most significant factors are extracted as well as their marginal effect on ridesplitting behavior, using partial dependency plots for interpretation of the machine learning model results. The results suggest that, overall, community-level factors are as or more important than trip-level characteristics. Additionally, the percentage of White people highly affects ridesplitting market share as well as the percentage of bachelor’s degree holders and households with two people residing in them. Travel time reliability and cost variability are also deemed more important than travel time and cost savings. Finally, the potential impact of taxes, crimes, cultural differences, and comfort is discussed in driving the market share, and suggestions are presented for future research and data collection attempts.



中文翻译:

使用芝加哥交通网络公司数据通过可解释的机器学习模型了解拼车行为

随着城市拥堵程度的增加,分析人们对交通网络公司 (TNC) 提供的不同服务的选择非常重要。本文将机器学习技术与大型 TNC 数据结合使用,重点揭示拼车市场份额背后的复杂关系。芝加哥跨国公司提供的真实世界数据集用于分析 2018 年 11 月至 2019 年 12 月的拼车出行,以了解该市的趋势。提取汇总的起点-目的地旅行级别特征,例如平均成本、平均时间和旅行时间可靠性,并将其与起点-目的地社区级别特征相结合。然后使用三种基于树的算法来模拟拼车旅行的市场份额。提取最重要的因素及其对拼车行为的边际影响,使用部分依赖图来解释机器学习模型结果。结果表明,总体而言,社区层面的因素与出行层面的特征一样重要,甚至更重要。此外,白人的比例对拼车市场份额以及拥有学士学位和两个人的家庭的比例有很大影响。旅行时间可靠性和成本可变性也被认为比旅行时间和成本节省更重要。最后,讨论了税收、犯罪、文化差异和舒适度在推动市场份额方面的潜在影响,并为未来的研究和数据收集尝试提出了建议。使用部分依赖图来解释机器学习模型结果。结果表明,总体而言,社区层面的因素与旅行层面的特征一样重要,甚至更重要。此外,白人的比例对拼车市场份额以及拥有学士学位和两个人的家庭的比例有很大影响。旅行时间可靠性和成本可变性也被认为比旅行时间和成本节省更重要。最后,讨论了税收、犯罪、文化差异和舒适度在推动市场份额方面的潜在影响,并为未来的研究和数据收集尝试提出了建议。使用部分依赖图来解释机器学习模型结果。结果表明,总体而言,社区层面的因素与旅行层面的特征一样重要,甚至更重要。此外,白人的比例对拼车市场份额以及拥有学士学位和两个人的家庭的比例有很大影响。旅行时间可靠性和成本可变性也被认为比旅行时间和成本节省更重要。最后,讨论了税收、犯罪、文化差异和舒适度在推动市场份额方面的潜在影响,并为未来的研究和数据收集尝试提出了建议。社区层面的因素与出行层面的特征一样重要,甚至更重要。此外,白人的比例对拼车市场份额以及拥有学士学位和两个人的家庭的比例有很大影响。旅行时间可靠性和成本可变性也被认为比旅行时间和成本节省更重要。最后,讨论了税收、犯罪、文化差异和舒适度在推动市场份额方面的潜在影响,并为未来的研究和数据收集尝试提出了建议。社区层面的因素与出行层面的特征一样重要,甚至更重要。此外,白人的比例对拼车市场份额以及拥有学士学位和两个人的家庭的比例有很大影响。旅行时间可靠性和成本可变性也被认为比旅行时间和成本节省更重要。最后,讨论了税收、犯罪、文化差异和舒适度在推动市场份额方面的潜在影响,并为未来的研究和数据收集尝试提出了建议。旅行时间可靠性和成本可变性也被认为比旅行时间和成本节省更重要。最后,讨论了税收、犯罪、文化差异和舒适度在推动市场份额方面的潜在影响,并为未来的研究和数据收集尝试提出了建议。旅行时间可靠性和成本可变性也被认为比旅行时间和成本节省更重要。最后,讨论了税收、犯罪、文化差异和舒适度在推动市场份额方面的潜在影响,并为未来的研究和数据收集尝试提出了建议。

更新日期:2021-09-12
down
wechat
bug