当前位置: X-MOL 学术Ann. Am. Assoc. Geogr. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Spatiotemporal Data-Adaptive Clustering Algorithm: An Intelligent Computational Technique for City Big Data
Annals of the American Association of Geographers ( IF 3.2 ) Pub Date : 2021-08-17 , DOI: 10.1080/24694452.2021.1935207
Geonhwa You 1
Affiliation  

The emerging paradigm of the modern city demands big data analytics in urban studies. Data mining techniques for big data have the potential to ascertain strategic insights for current and future cities. Clustering is increasingly growing in data mining, serving as a knowledge discovery tool. This article proposes a spatiotemporal clustering method, called spatiotemporal data-adaptive clustering (STDAC), to cope with clustering challenges, such as feature type, parameter setting, and treating spatial and temporal dimensions as equals. The proposed algorithm takes a dual-structure approach to obtain high-quality clusters and discover temporal changes not detected by other techniques. STDAC refers to the feature type and uses k-fold cross-validation (KCV) to replace the user-defined parameters with the data-driven values. The data-driven threshold from KCV performs as the endogenous variable, thus not requiring a priori assumptions or parameter settings. This article used the bus, taxi passengers, and de facto population data as illustrative case studies. The clustering performances were evaluated based on validation indexes, such as the Davies–Bouldin index (DBI) and Dunn index (DI), where STDAC generally had lower DBI and greater DI. The findings showed that STDAC could yield better clustering performances than other established algorithms. Hence, the proposed method would be promising to future studies requiring spatiotemporal big data analytics in urban studies, administrative management, and other fields.



中文翻译:

时空数据自适应聚类算法:一种城市大数据的智能计算技术

现代城市的新兴范式需要城市研究中的大数据分析。大数据的数据挖掘技术有可能确定当前和未来城市的战略洞察力。聚类在数据挖掘中日益增长,作为一种知识发现工具。本文提出了一种时空聚类方法,称为时空数据自适应聚类(STDAC),以应对聚类挑战,例如特征类型、参数设置以及时空维度平等对待。所提出的算法采用双结构方法来获得高质量的集群并发现其他技术未检测到的时间变化。STDAC 是指特征类型,并使用 k 折交叉验证 (KCV) 将用户定义的参数替换为数据驱动的值。来自 KCV 的数据驱动阈值作为内生变量执行,因此不需要先验假设或参数设置。本文使用公共汽车、出租车乘客和实际人口数据作为说明性案例研究。基于验证指标评估聚类性能,例如 Davies-Bouldin 指数 (DBI) 和 Dunn 指数 (DI),其中 STDAC 通常具有较低的 DBI 和较大的 DI。研究结果表明,与其他已建立的算法相比,STDAC 可以产生更好的聚类性能。因此,所提出的方法将有望用于城市研究、行政管理和其他领域中需要时空大数据分析的未来研究。和事实上的人口数据作为说明性案例研究。基于验证指标评估聚类性能,例如 Davies-Bouldin 指数 (DBI) 和 Dunn 指数 (DI),其中 STDAC 通常具有较低的 DBI 和较大的 DI。研究结果表明,与其他已建立的算法相比,STDAC 可以产生更好的聚类性能。因此,所提出的方法将有望用于城市研究、行政管理和其他领域中需要时空大数据分析的未来研究。和事实上的人口数据作为说明性案例研究。基于验证指标评估聚类性能,例如 Davies-Bouldin 指数 (DBI) 和 Dunn 指数 (DI),其中 STDAC 通常具有较低的 DBI 和较大的 DI。研究结果表明,与其他已建立的算法相比,STDAC 可以产生更好的聚类性能。因此,所提出的方法将有望用于城市研究、行政管理和其他领域中需要时空大数据分析的未来研究。研究结果表明,与其他已建立的算法相比,STDAC 可以产生更好的聚类性能。因此,所提出的方法将有望用于城市研究、行政管理和其他领域中需要时空大数据分析的未来研究。研究结果表明,与其他已建立的算法相比,STDAC 可以产生更好的聚类性能。因此,所提出的方法将有望用于城市研究、行政管理和其他领域中需要时空大数据分析的未来研究。

更新日期:2021-08-17
down
wechat
bug