当前位置: X-MOL 学术Social Networks › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Networks from archives: Reconstructing networks of official correspondence in the early modern Portuguese empire
Social Networks ( IF 4.144 ) Pub Date : 2020-09-24 , DOI: 10.1016/j.socnet.2020.08.008
Agata Błoch , Demival Vasques Filho , Michał Bojanowski

Historical archives provide invaluable insights into societies of the past, including social networks. However, the required amount of traditional archival work makes historical network studies usually small-scaled. We consider the problem of processing a large corpus of unstructured textual information to extract network data. The corpus consists of almost 170,000 documents of administrative correspondence of the Portuguese Empire, from 1610 to 1833, catalogued in the Portuguese Overseas Archives of Lisbon. Our contribution is twofold: the method and the result. Firstly, grounded in the review of manual, semi-manual and automatic methods of network data extraction from natural language corpora, we propose and demonstrate an approach using modern natural language processing algorithms. This approach tries to mimic traditional archivist’s coding practices and is applicable to large corpora of texts, for which manual coding is infeasible because of scale. We believe our approach is generic and adaptable to other substantive contexts, languages, and types of historical archives. Secondly, the dataset created is rich in additional information such as occupation, administrative affiliation, and geographical location of senders and recipients. We provide a preliminary network analysis suggesting that the dataset is an attractive material for historians and social network researchers for addressing research questions about the political and social evolution of the early modern Portuguese Empire, spanning the reign of seven Portuguese monarchs.



中文翻译:

来自档案馆的网络:重建早期现代葡萄牙帝国的官方通信网络

历史档案馆提供了对包括社会网络在内的过去社会的宝贵见解。但是,传统档案工作所需的数量使历史网络研究通常规模较小。我们考虑处理大量非结构化文本信息集以提取网络数据的问题。该语料库由1610至1833年间葡萄牙帝国的近170,000份行政往来文件组成,并编入里斯本的葡萄牙海外档案馆。我们的贡献是双重的:方法和结果。首先,基于对自然语言语料库中网络数据提取的手动,半手动和自动方法的回顾,我们提出并演示了一种使用现代自然语言处理算法的方法。这种方法试图模仿传统的档案管理员的编码实践,并且适用于大型文本集,由于规模庞大,无法进行手动编码。我们认为我们的方法是通用的,可以适应其他实质性背景,语言和历史档案类型。其次,创建的数据集还包含其他信息,例如职业,行政隶属关系以及发送者和接收者的地理位置。我们提供了初步的网络分析,表明该数据集是历史学家和社会网络研究人员用来解决有关七个现代葡萄牙君主统治时期有关早期现代葡萄牙帝国的政治和社会演变的研究问题的有吸引力的资料。由于规模原因,无法进行手动编码。我们认为我们的方法是通用的,可以适应其他实质性背景,语言和历史档案类型。其次,创建的数据集还包含其他信息,例如职业,行政隶属关系以及发送者和接收者的地理位置。我们提供了初步的网络分析,表明该数据集是历史学家和社会网络研究人员用来解决有关七个现代葡萄牙君主统治时期有关早期现代葡萄牙帝国的政治和社会演变的研究问题的有吸引力的资料。由于规模原因,无法进行手动编码。我们认为我们的方法是通用的,可以适应其他实质性背景,语言和历史档案类型。其次,创建的数据集还包含其他信息,例如职业,行政隶属关系以及发送者和接收者的地理位置。我们提供了初步的网络分析,表明该数据集是历史学家和社会网络研究人员用来解决有关七个现代葡萄牙君主统治时期的早期现代葡萄牙帝国的政治和社会演变的研究问题的有吸引力的资料。创建的数据集包含其他信息,例如职业,行政隶属关系以及发件人和收件人的地理位置。我们提供了初步的网络分析,表明该数据集是历史学家和社会网络研究人员用来解决有关七个现代葡萄牙君主统治时期的早期现代葡萄牙帝国的政治和社会演变的研究问题的有吸引力的资料。创建的数据集包含其他信息,例如职业,行政隶属关系以及发件人和收件人的地理位置。我们提供了初步的网络分析,表明该数据集是历史学家和社会网络研究人员用来解决有关七个现代葡萄牙君主统治时期有关早期现代葡萄牙帝国的政治和社会演变的研究问题的有吸引力的资料。

更新日期:2020-09-24
down
wechat
bug