当前位置: X-MOL 学术ISPRS Int. J. Geo-Inf. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
A Machine Learning Approach to Delineating Neighborhoods from Geocoded Appraisal Data
ISPRS International Journal of Geo-Information ( IF 3.4 ) Pub Date : 2020-07-17 , DOI: 10.3390/ijgi9070451
Rao Ali , Josh Graves , Stanley Wu , Jenny Lee , Erik Linstead

Identification of neighborhoods is an important, financially-driven topic in real estate. It is known that the real estate industry uses ZIP (postal) codes and Census tracts as a source of land demarcation to categorize properties with respect to their price. These demarcated boundaries are static and are inflexible to the shift in the real estate market and fail to represent its dynamics, such as in the case of an up-and-coming residential project. Delineated neighborhoods are also used in socioeconomic and demographic analyses where statistics are computed at a neighborhood level. Current practices of delineating neighborhoods have mostly ignored the information that can be extracted from property appraisals. This paper demonstrates the potential of using only the distance between subjects and their comparable properties, identified in an appraisal, to delineate neighborhoods that are composed of properties with similar prices and features. Using spatial filters, we first identify regions with the most appraisal activity, and through the application of a spatial clustering algorithm, generate neighborhoods composed of properties sharing similar characteristics. Through an application of bootstrapped linear regression, we find that delineating neighborhoods using geolocation of subjects and comparable properties explains more variation in a property’s features, such as valuation, square footage, and price per square foot, than ZIP codes or Census tracts. We also discuss the ability of the neighborhoods to grow and shrink over the years, due to shifts in each housing submarket.

中文翻译:

从地理编码的评估数据中划定邻域的机器学习方法

社区识别是房地产中一个重要的,财务驱动的主题。众所周知,房地产行业使用邮政编码(ZIP)和人口普查区作为土地划界的来源,以按价格对房地产进行分类。这些划定的边界是静态的,对于房地产市场的变化是僵硬的,并且不能代表其动态,例如在即将到来的住宅项目中。划定的邻域也用于社会经济和人口分析,其中统计是在邻域一级计算的。划定邻居的当前做法大部分都忽略了可以从财产评估中提取的信息。本文演示了仅使用对象之间的距离及其可比属性的潜力,在评估中确定,以划定由价格和功能相似的房地产组成的社区。我们首先使用空间过滤器来确定评估活动最活跃的区域,然后通过应用空间聚类算法来生成由具有相似特征的属性组成的邻域。通过自举线性回归的应用,我们发现,使用主题的地理位置和可比较的属性来描绘邻域比使用邮政编码或人口普查区域更能说明属性的变化,例如估值,平方英尺和每平方英尺价格。由于每个住房子市场的变化,我们还讨论了社区近年来的增长和萎缩的能力。划定由价格和功能相似的物业组成的社区。我们首先使用空间过滤器来确定评估活动最活跃的区域,然后通过应用空间聚类算法来生成由具有相似特征的属性组成的邻域。通过自举线性回归的应用,我们发现,使用主题的地理位置和可比较的属性来描绘邻域比使用邮政编码或人口普查区域更能说明属性的变化,例如估值,平方英尺和每平方英尺价格。由于每个住房子市场的变化,我们还讨论了社区近年来的增长和萎缩的能力。划定由价格和功能相似的物业组成的社区。我们首先使用空间过滤器来确定评估活动最活跃的区域,然后通过应用空间聚类算法来生成由具有相似特征的属性组成的邻域。通过自举线性回归的应用,我们发现,使用主题的地理位置和可比较的属性来描绘邻域比使用邮政编码或人口普查区域更能说明属性的变化,例如估值,平方英尺和每平方英尺价格。由于每个住房子市场的变化,我们还讨论了社区近年来的增长和萎缩的能力。并通过空间聚类算法的应用,生成由具有相似特征的属性组成的邻域。通过自举线性回归的应用,我们发现,使用主题的地理位置和可比较的属性来描绘邻域比使用邮政编码或人口普查区域更能说明属性的变化,例如估值,平方英尺和每平方英尺价格。由于每个住房子市场的变化,我们还讨论了社区近年来的增长和萎缩的能力。并通过空间聚类算法的应用,生成由具有相似特征的属性组成的邻域。通过自举线性回归的应用,我们发现,使用主题的地理位置和可比较的属性来描绘邻域比使用邮政编码或人口普查区域更能说明属性的变化,例如估值,平方英尺和每平方英尺价格。由于每个住房子市场的变化,我们还讨论了社区近年来的增长和萎缩的能力。我们发现,使用主题和可比属性的地理位置来描绘社区比使用邮政编码或人口普查区域更能说明属性的变化,例如估值,平方英尺和每平方英尺价格。由于每个住房子市场的变化,我们还讨论了社区近年来的增长和萎缩的能力。我们发现,使用主题和可比属性的地理位置来描绘社区比使用邮政编码或人口普查区域更能说明属性的变化,例如估值,平方英尺和每平方英尺价格。由于每个住房子市场的变化,我们还讨论了社区近年来的增长和萎缩的能力。
更新日期:2020-07-17
down
wechat
bug