当前位置: X-MOL 学术International Interactions › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Race to the bottom: Spatial aggregation and event data
International Interactions ( IF 1.226 ) Pub Date : 2022-03-04 , DOI: 10.1080/03050629.2022.2025365
Scott J. Cook 1 , Nils B. Weidmann 2
Affiliation  

Abstract

Researchers now have greater access to granular georeferenced (i.e., spatial) data on social and political phenomena than ever before. Such data have seen wide use, as they offer the potential for researchers to analyze local phenomena, test mechanisms, and better understand micro-level behavior. With these political event data, it has become increasingly common for researchers to select the smallest spatial scale permitted by the data. We argue that this practice requires greater scrutiny, as smaller spatial or temporal scales do not necessarily improve the quality of inferences. While highly disaggregated data reduce some threats to inference (e.g., aggregation bias), they increase the risk of others (e.g., outcome misclassification). Therefore, we argue that researchers should adopt a more principled approach when selecting the spatial scale for their analysis. To help inform this choice, we characterize the aggregation problem for spatial data, discuss the consequences of too much (or too little) aggregation, and provide some guidance for applied researchers. We demonstrate these issues using both simulated experiments and an analysis of spatial patterns of violence in Afghanistan.

Los investigadores tienen ahora un acceso como nunca antes a datos georreferenciados granulares (es decir, espaciales) sobre fenómenos sociales y políticos. Estos datos se han utilizado ampliamente, ya que ofrecen a los investigadores la posibilidad de analizar fenómenos locales, probar mecanismos y comprender mejor el comportamiento a nivel micro. Con estos datos sobre acontecimientos políticos, es cada vez más frecuente que los investigadores seleccionen la escala espacial más pequeña que permitan los datos. Sostenemos que esta práctica requiere un mayor escrutinio, ya que las escalas espaciales o temporales no necesariamente mejoran la calidad de las inferencias. Si bien los datos altamente desagregados reducen algunas amenazas para la inferencia (por ejemplo, el sesgo de agregación), aumentan el riesgo de otras (por ejemplo, la clasificación errónea de los resultados). Por lo tanto, sostenemos que los investigadores deberían adoptar un enfoque basándose más en principios a la hora de seleccionar la escala espacial para su análisis. Para contribuir a realizar esta elección, caracterizamos el problema de la agregación de los datos espaciales, analizamos las consecuencias de una agregación excesiva (o insuficiente) y ofrecemos algunas orientaciones para la investigación aplicada. Demostramos estas cuestiones utilizando tanto experimentos simulados como un análisis de los patrones de violencia en Afganistán.

Les chercheurs ont maintenant un meilleur accès à des données granulaires géoréférencées (c-à-d, spatiales) sur les phénomènes politiques et sociaux que jamais auparavant. Ces données ont été largement utilisées, car elles offrent aux chercheurs le potentiel d’analyser des phénomènes locaux, de tester des mécanismes et de mieux comprendre les comportements au niveau micro. Avec ces données sur les événements politiques, il est devenu de plus en plus courant pour les chercheurs de sélectionner la plus petite échelle spatiale permise par les données. Nous soutenons que cette pratique exige un examen plus approfondi, car des échelles spatiales ou temporelles plus petites n’améliorent pas nécessairement la qualité des déductions. Bien que les données très désagrégées réduisent certains risques pour les déductions (p. ex. biais d’agrégation), elles accroissent le risque d’autres facteurs (p. ex. mauvaise classification des résultats). Par conséquent, nous soutenons que les chercheurs devraient adopter une approche plus raisonnée lorsqu’ils choisissent l’échelle spatiale pour leur analyse. Afin d’éclairer ce choix, nous caractérisons le problème de l’agrégation des données spatiales, nous discutons des conséquences d’une trop grande (ou trop faible) agrégations des données et nous fournissons quelques conseils aux chercheurs appliqués. Nous démontrons ces problèmes en utilisant à la fois des expérimentations simulées et une analyse des schémas spatiaux de la violence en Afghanistan.



中文翻译:

逐底竞争:空间聚合和事件数据

摘要

研究人员现在比以往任何时候都可以更多地访问有关社会和政治现象的精细地理参考(即空间)数据。这些数据得到了广泛的应用,因为它们为研究人员提供了分析局部现象、测试机制和更好地理解微观行为的潜力。有了这些政治事件数据,研究人员选择数据允许的最小空间尺度变得越来越普遍。我们认为这种做法需要更严格的审查,因为较小的空间或时间尺度并不一定会提高推理的质量。虽然高度分类的数据减少了一些推理威胁(例如,聚合偏差),但它们增加了其他风险(例如,结果错误分类)。所以,我们认为,研究人员在选择空间尺度进行分析时应该采用更有原则的方法。为了帮助告知这一选择,我们描述了空间数据的聚合问题,讨论了过多(或过少)聚合的后果,并为应用研究人员提供了一些指导。我们通过模拟实验和对阿富汗暴力空间模式的分析来证明这些问题。

研究人员现在可以前所未有地访问有关社会和政治现象的粒度(即空间)地理参考数据。这些数据已被广泛使用,因为它们为研究人员提供了分析局部现象、测试机制和更好地理解微观层面行为的能力。有了这些关于政治事件的数据,研究人员越来越普遍地选择数据允许的最小空间尺度。我们认为这种做法需要进一步审查,因为空间或时间尺度并不一定会提高推理的质量。虽然高度分类的数据减少了一些推理威胁(例如,聚合偏差),但它增加了其他风险(例如,结果分类错误)。因此,我们认为研究人员应该采取更有原则的方法来选择空间尺度进行分析。为了帮助做出这种选择,我们描述了空间数据聚合问题,讨论了过度(或不足)聚合的后果,并为应用研究提供了一些指导。我们通过模拟实验和对阿富汗暴力模式的分析来证明这些问题。我们描述了空间数据聚合问题,讨论了过度(或不足)聚合的后果,并为应用研究提供了一些指导。我们通过模拟实验和对阿富汗暴力模式的分析来证明这些问题。我们描述了空间数据聚合问题,讨论了过度(或不足)聚合的后果,并为应用研究提供了一些指导。我们通过模拟实验和对阿富汗暴力模式的分析来证明这些问题。

Les chercheurs ont maintenant un meilleur accès à des données graines géoréférencées (c-à-d, spatiales) sur les phénomènes politiques et socialux que never auparavant。Ces données ont été 在很大程度上是 utilisées、car elles offrent aux chercheurs le potentiel d'analyser des phénomènes locaux、de tester des mécanismes et de mieux 在微观层面理解行为。有时 données sur les événements politiques, il est devenu de plus en plus courant pour les chercheurs de sélectionner la plus petite échelle spatiale permise par les données。Nous soutenons que cette pratique 要求考试加上 approfondi, car des échelles spatiales ou temporelles plus petites n'améliorent pas nécessairement la qualité des deductions。虽然他们 données très désagrégées réduisent certains risques pour les deductions (p. ex. biais d'agrégation), 他们accroissent le risque d'autres facteurs (p. ex. mauvaise classification des resultats)。因此,我们是 les chercheurs devraient 采用 approche plus raisonnée lorsqu'ils choisissent l'échelle spatiale pour leur 分析的专家。Afin d'éclairer ce choix, nous charactérisons le problème de l'agrégation des données spatiales, nous Discussions des conséquences d'une trop grande (ou trop faible) agrégations des données et nousfournissons quelques conseils aux chercheurs appliqués。Nous démontrons ces problèmes en utilisant à la fois des exérimentations simulées et une analyze des schémas spatiaux de la暴力在阿富汗。Nous soutenons que les chercheurs devraient 采用 une approche plus raisonnée lorsqu'ils choisissent l'échelle spatiale pour leur 分析。Afin d'éclairer ce choix, nous charactérisons le problème de l'agrégation des données spatiales, nous Discussions des conséquences d'une trop grande (ou trop faible) agrégations des données et nousfournissons quelques conseils aux chercheurs appliqués。Nous démontrons ces problèmes en utilisant à la fois des exérimentations simulées et une analyze des schémas spatiaux de la暴力在阿富汗。Nous soutenons que les chercheurs devraient 采用 une approche plus raisonnée lorsqu'ils choisissent l'échelle spatiale pour leur 分析。Afin d'éclairer ce choix, nous charactérisons le problème de l'agrégation des données spatiales, nous Discussions des conséquences d'une trop grande (ou trop faible) agrégations des données et nousfournissons quelques conseils aux chercheurs appliqués。Nous démontrons ces problèmes en utilisant à la fois des exérimentations simulées et une analyze des schémas spatiaux de la暴力在阿富汗。

更新日期:2022-03-04
down
wechat
bug