当前位置: X-MOL 学术Transp. Res. Part C Emerg. Technol. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
A DBSCAN-based framework to mine travel patterns from origin-destination matrices: Proof-of-concept on proxy static OD from Brisbane
Transportation Research Part C: Emerging Technologies ( IF 8.3 ) Pub Date : 2021-09-08 , DOI: 10.1016/j.trc.2021.103370
Krishna N.S. Behara , Ashish Bhaskar , Edward Chung

Limited studies exist in the literature on demand related travel patterns, the analysis of which requires a rich database of Origin Destination (OD) matrices with appropriate clustering algorithms. This paper develops a methodological framework to explore typical travel patterns from multi-density high dimensional matrices and estimate typical OD corresponding to those patterns. The contributions of the paper are multi-fold. First, to cluster high-dimensional OD matrices, we deploy geographical window-based structural similarity index (GSSI) as proximity measure in the DBSCAN algorithm that captures both OD structure and network related attributes. Second, to address the issue of multi-density data points, we propose clustering on individual subspaces. Third, we develop a simple two-level approach to identify optimum DBSCAN parameters. Finally, as proof-of-concept, the proposed framework is applied on proxy OD matrices from real Bluetooth data (B-OD) from Brisbane City Council region. The OD matrix clusters, typical travel patterns, and typical B-OD matrices are estimated for this study region. The analysis reveals nine typical travel patterns. The methodology was also found to perform better when GSSI was used instead of Euclidian distance as a proximity measure, and two-level DBSCAN instead of K-medoids, Spectral, and Hierarchical methods. The framework is generic and applicable for OD matrices developed from other data sources and any spatiotemporal context. DBSCAN is chosen for this study because it does not require a pre-determined number of clusters, and it identifies outliers as noise.



中文翻译:

一个基于 DBSCAN 的框架,用于从起点-终点矩阵中挖掘出行模式:布里斯班代理静态 OD 的概念验证

与需求相关的旅行模式的文献中存在有限的研究,其分析需要具有适当聚类算法的丰富的起点目的地 (OD) 矩阵数据库。本文开发了一种方法框架,以从多密度高维矩阵中探索典型的出行模式,并估计与这些模式对应的典型 OD。这篇论文的贡献是多方面的。首先,为了对高维 OD 矩阵进行聚类,我们部署了基于地理窗口的结构相似性指数 (GSSI) 作为 DBSCAN 算法中的邻近度量,该算法同时捕获了 OD 结构和网络相关属性。其次,为了解决多密度数据点的问题,我们建议在单个子空间上进行聚类。第三,我们开发了一种简单的两级方法来确定最佳 DBSCAN 参数。最后,作为概念验证,提议的框架应用于来自布里斯班市议会地区的真实蓝牙数据 (B-OD) 的代理 OD 矩阵。该研究区域估计了 OD 矩阵集群、典型的旅行模式和典型的 B-OD 矩阵。分析揭示了九种典型的旅行模式。当使用 GSSI 代替欧几里得距离作为邻近度量,并且使用两级 DBSCAN 代替 K-medoids、光谱和分层方法时,还发现该方法的性能更好。该框架是通用的,适用于从其他数据源和任何时空上下文开发的 OD 矩阵。本研究选择 DBSCAN 是因为它不需要预先确定数量的集群,并将异常值识别为噪声。提议的框架应用于来自布里斯班市议会区域的真实蓝牙数据 (B-OD) 的代理 OD 矩阵。该研究区域估计了 OD 矩阵集群、典型的旅行模式和典型的 B-OD 矩阵。分析揭示了九种典型的旅行模式。当使用 GSSI 代替欧几里得距离作为邻近度量,并且使用两级 DBSCAN 代替 K-medoids、光谱和分层方法时,还发现该方法的性能更好。该框架是通用的,适用于从其他数据源和任何时空上下文开发的 OD 矩阵。本研究选择 DBSCAN 是因为它不需要预先确定数量的集群,并将异常值识别为噪声。提议的框架应用于来自布里斯班市议会区域的真实蓝牙数据 (B-OD) 的代理 OD 矩阵。该研究区域估计了 OD 矩阵集群、典型的旅行模式和典型的 B-OD 矩阵。分析揭示了九种典型的旅行模式。当使用 GSSI 代替欧几里得距离作为邻近度量,并且使用两级 DBSCAN 代替 K-medoids、光谱和分层方法时,还发现该方法的性能更好。该框架是通用的,适用于从其他数据源和任何时空上下文开发的 OD 矩阵。本研究选择 DBSCAN 是因为它不需要预先确定数量的集群,并将异常值识别为噪声。并为该研究区域估计了典型的 B-OD 矩阵。分析揭示了九种典型的旅行模式。当使用 GSSI 代替欧几里得距离作为邻近度量,并且使用两级 DBSCAN 代替 K-medoids、光谱和分层方法时,还发现该方法的性能更好。该框架是通用的,适用于从其他数据源和任何时空上下文开发的 OD 矩阵。本研究选择 DBSCAN 是因为它不需要预先确定数量的集群,并将异常值识别为噪声。并为该研究区域估计了典型的 B-OD 矩阵。分析揭示了九种典型的旅行模式。当使用 GSSI 代替欧几里得距离作为邻近度量,并且使用两级 DBSCAN 代替 K-medoids、光谱和分层方法时,还发现该方法的性能更好。该框架是通用的,适用于从其他数据源和任何时空上下文开发的 OD 矩阵。本研究选择 DBSCAN 是因为它不需要预先确定数量的集群,并将异常值识别为噪声。该框架是通用的,适用于从其他数据源和任何时空上下文开发的 OD 矩阵。本研究选择 DBSCAN 是因为它不需要预先确定数量的集群,并将异常值识别为噪声。该框架是通用的,适用于从其他数据源和任何时空上下文开发的 OD 矩阵。本研究选择 DBSCAN 是因为它不需要预先确定数量的集群,并将异常值识别为噪声。

更新日期:2021-09-08
down
wechat
bug