当前位置: X-MOL 学术J. Web Semant. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Representing anything from scholar papers
Journal of Web Semantics ( IF 2.1 ) Pub Date : 2019-04-17 , DOI: 10.1016/j.websem.2019.02.001
Danhao Zhu , Xin-Yu Dai , Jiajun Chen

Many scholar knowledge mining tasks depend on the representations of different scholar entities and their compositions, including author, publication venue and paper. However, the existing methods always tried to learn different kinds of scholar representations individually. The citation relationships among different types of entities are sometimes ignored. Moreover, the separated learned representations are in separate vector space and hence cannot be operated together. Indeed, representations for different kinds of entities are constructed based on the papers and the citation relationships, which provide the opportunity for developing an unified representation method. In this paper, we propose a novel method for mapping scholar entities and their compositions to a unified distributed vector space. Each paper is firstly defined as a full composition of entities, including title, author, publication venue and so on. Then, with the citation relationships among papers, we train a model that tries to maximize the likelihood of references of papers. After training, the model can map all kinds of entities and their compositions to a unified vector space. We quantitatively evaluate our vectors on two tasks of collaborate prediction and related paper recommendation. The results show our method can learn good representations for scholar entities and their compositions. Since our method allows different types of representations to be operated together, we also show some interesting applications, such as publication venue recommendation and reviewer recommendation.



中文翻译:

代表学者论文中的任何内容

许多学者知识挖掘任务依赖于不同学者实体及其组成的表示,包括作者,出版地和论文。然而,现有方法总是试图单独学习不同类型的学者表示。有时会忽略不同类型实体之间的引用关系。此外,分离的学习表示位于分离的向量空间中,因此不能一起操作。确实,基于论文和引用关系构造了不同种类的实体的表示,这为开发统一的表示方法提供了机会。在本文中,我们提出了一种将学者实体及其组成映射到统一的分布式矢量空间的新方法。首先将每篇论文定义为实体的完整组成,包括标题,作者,出版地点等。然后,利用论文之间的引用关系,我们训练了一个模型,该模型试图最大化论文参考的可能性。训练后,该模型可以将各种实体及其组成映射到统一的向量空间。我们在协作预测和相关论文推荐这两项任务上对向量进行定量评估。结果表明,我们的方法可以学习学者实体及其组成的良好表示形式。由于我们的方法允许将不同类型的表示形式一起使用,因此我们还展示了一些有趣的应用程序,例如出版场所推荐和审阅者推荐。利用论文之间的引用关系,我们训练了一个模型,该模型试图使论文被引用的可能性最大化。训练后,该模型可以将各种实体及其组成映射到统一的向量空间。我们在协作预测和相关论文推荐这两项任务上对向量进行定量评估。结果表明,我们的方法可以学习学者实体及其组成的良好表示形式。由于我们的方法允许将不同类型的表示形式一起使用,因此我们还展示了一些有趣的应用程序,例如出版场所推荐和审阅者推荐。利用论文之间的引用关系,我们训练了一个模型,该模型试图最大程度地引用论文。训练后,该模型可以将各种实体及其组成映射到统一的向量空间。我们在协作预测和相关论文推荐这两项任务上对向量进行定量评估。结果表明,我们的方法可以学习学者实体及其组成的良好表示形式。由于我们的方法允许将不同类型的表示形式一起使用,因此我们还展示了一些有趣的应用程序,例如出版场所推荐和审阅者推荐。该模型可以将各种实体及其组成映射到统一的向量空间。我们在协作预测和相关论文推荐这两项任务上对向量进行定量评估。结果表明,我们的方法可以学习学者实体及其组成的良好表示形式。由于我们的方法允许将不同类型的表示形式一起使用,因此我们还展示了一些有趣的应用程序,例如出版场所推荐和审阅者推荐。该模型可以将各种实体及其组成映射到统一的向量空间。我们在协作预测和相关论文推荐这两项任务上对向量进行定量评估。结果表明,我们的方法可以学习学者实体及其组成的良好表示形式。由于我们的方法允许将不同类型的表示形式一起使用,因此我们还展示了一些有趣的应用程序,例如出版场所推荐和审阅者推荐。

更新日期:2019-04-17
down
wechat
bug