当前位置: X-MOL 学术arXiv.cs.IR › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Presenting a Dataset for Collaborator Recommending Systems in Academic Social Network: a Case Study on ReseachGate
arXiv - CS - Information Retrieval Pub Date : 2020-12-29 , DOI: arxiv-2101.01141
Zahra Roozbahani, Jalal Rezaeenour, Roshan Shahrooei, Hanif Emamgholizadeh

Collaborator finding systems are a special type of expert finding models. There is a long-lasting challenge for research in the collaborator recommending research area, which is the lack of a structured dataset to be used by the researchers. We introduce two datasets to fill this gap. The first dataset is prepared for designing a consistent, collaborator finding system. The next one, called a co-author finding model, models an academic social network as a table that contains different relations between the pair of users. Both of them provide an opportunity for introducing potential collaborators to each other. These two models have been extracted from ResearchGate (RG) data set and are available publicly. RG dataset has been collected from Jan. 2019 to April 2019 and includes raw data of 3980 RG users. The dataset consists of almost complete information about users. In the preprocessing phase, the well-known Elmo was used for analyzing textual data. We call this as \textbf{R}esearch\textbf{G}ate dataset for \textbf{R}commending \textbf{S}ystems (\textbf{RGRS}). For assessing the validity of data, we analyze each layer of data separately, and the results are reported. After preparing data and evaluating the collaborator finding models, we have done some assessments on \textbf{RGRS}. Some of these assessments are co-author, following-follower, and question answering relations. The outcomes indicate that it is the best relation in propagating knowledge in the network. To the best of our knowledge, there is no processed and analyzed dataset with this size.

中文翻译:

在学术社交网络中为协作推荐系统提供数据集:ReseachGate案例研究

协作者查找系统是一种特殊类型的专家查找模型。在合作者推荐的研究领域中,研究面临着长期的挑战,这是缺乏研究人员可以使用的结构化数据集。我们引入了两个数据集来填补这一空白。准备用于设计一致的协作者查找系统的第一个数据集。下一个称为合著者发现模型,该模型将一个学术社交网络建模为一个表格,其中包含一对用户之间的不同关系。两者都为相互介绍潜在合作者提供了机会。这两个模型已从ResearchGate(RG)数据集中提取并公开提供。RG数据集已于2019年1月至2019年4月收集,其中包括3980名RG用户的原始数据。数据集包含有关用户的几乎完整信息。在预处理阶段,著名的Elmo被用于分析文本数据。我们称其为\ textbf {R}推荐的\ textbf {S}系统(\ textbf {RGRS})的\ textbf {R} esearch \ textbf {G} ate数据集。为了评估数据的有效性,我们分别分析了每个数据层,并报告了结果。在准备好数据并评估了协作者的发现模型之后,我们对\ textbf {RGRS}进行了一些评估。其中一些评估是合著者,追随者和问答关系。结果表明,这是在网络中传播知识的最佳关系。据我们所知,没有经过处理和分析的数据集具有这种大小。著名的Elmo用于分析文本数据。我们称其为\ textbf {R}推荐的\ textbf {S}系统(\ textbf {RGRS})的\ textbf {R} esearch \ textbf {G} ate数据集。为了评估数据的有效性,我们分别分析了每个数据层,并报告了结果。在准备好数据并评估了协作者的发现模型之后,我们对\ textbf {RGRS}进行了一些评估。其中一些评估是合著者,追随者和问答关系。结果表明,这是在网络中传播知识的最佳关系。据我们所知,没有经过处理和分析的数据集具有这种大小。著名的Elmo用于分析文本数据。我们称其为\ textbf {R}推荐的\ textbf {S}系统(\ textbf {RGRS})的\ textbf {R} esearch \ textbf {G} ate数据集。为了评估数据的有效性,我们分别分析了每个数据层,并报告了结果。在准备好数据并评估了协作者的发现模型之后,我们对\ textbf {RGRS}进行了一些评估。其中一些评估是合著者,追随者和问答关系。结果表明,这是在网络中传播知识的最佳关系。据我们所知,没有经过处理和分析的数据集具有这种大小。我们将分别分析每一层数据,并报告结果。在准备好数据并评估了协作者的发现模型之后,我们对\ textbf {RGRS}进行了一些评估。其中一些评估是合著者,追随者和问答关系。结果表明,这是在网络中传播知识的最佳关系。据我们所知,没有经过处理和分析的数据集具有这种大小。我们将分别分析每一层数据,并报告结果。在准备好数据并评估了协作者的发现模型之后,我们对\ textbf {RGRS}进行了一些评估。其中一些评估是合著者,追随者和问答关系。结果表明,这是在网络中传播知识的最佳关系。据我们所知,没有经过处理和分析的数据集具有这种大小。
更新日期:2021-01-05
down
wechat
bug