当前位置: X-MOL 学术Scientometrics › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Measuring academic entities’ impact by content-based citation analysis in a heterogeneous academic network
Scientometrics ( IF 3.9 ) Pub Date : 2021-06-23 , DOI: 10.1007/s11192-021-04063-1
Fang Zhang , Shengli Wu

Evaluating the impact of papers, researchers and venues objectively is of great significance to academia and beyond. This may help researchers, research organizations, and government agencies in various ways, such as helping researchers find valuable papers and authoritative venues and helping research organizations identify good researchers. A few studies find that rather than treating citations equally, differentiating them is a promising way for impact evaluation of academic entities. However, most of those methods are metadata-based only and do not consider contents of cited and citing papers; while a few content-based methods are not sophisticated, and further improvement is possible. In this paper, we study the citation relationships between entities by content-based approaches. Especially, an ensemble learning method is used to classify citations into different strength types, and a word-embedding based method is used to estimate topical similarity of the citing and cited papers. A heterogeneous network is constructed with the weighted citation links and several other features. Based on the heterogeneous network that consists of three types of entities, we apply an iterative PageRank-like method to rank the impact of papers, authors and venues at the same time through mutual reinforcement. Experiments are conducted on an ACL dataset, and the results demonstrate that our method greatly outperforms state-of-the art competitors in improving ranking effectiveness of papers, authors and venues, as well as in being robust against malicious manipulation of citations.



中文翻译:

在异构学术网络中通过基于内容的引文分析衡量学术实体的影响

客观地评估论文、研究人员和场地的影响对学术界及其他领域具有重要意义。这可能会以各种方式帮助研究人员、研究组织和政府机构,例如帮助研究人员找到有价值的论文和权威场所,帮助研究组织识别优秀的研究人员。一些研究发现,与其对引文一视同仁,将它们区分开来是对学术实体进行影响评估的一种很有前途的方法。然而,这些方法大多仅基于元数据,并没有考虑被引和施引论文的内容;而一些基于内容的方法并不复杂,有可能进一步改进。在本文中,我们通过基于内容的方法研究实体之间的引用关系。尤其,使用集成学习方法将引文分类为不同强度类型,并使用基于词嵌入的方法估计引文和被引论文的主题相似度。一个异构网络是用加权引用链接和其他几个特征构建的。基于由三类实体组成的异构网络,我们应用迭代的类 PageRank 方法,通过相互强化,同时对论文、作者和场所的影响进行排名。实验是在 ACL 数据集上进行的,结果表明,我们的方法在提高论文、作者和场所的排名效率以及对引用的恶意操纵方面的鲁棒性方面大大优于最先进的竞争对手。并使用基于词嵌入的方法来估计被引论文和被引论文的主题相似度。一个异构网络是用加权引用链接和其他几个特征构建的。基于由三类实体组成的异构网络,我们应用迭代的类 PageRank 方法,通过相互强化,同时对论文、作者和场所的影响进行排名。实验是在 ACL 数据集上进行的,结果表明,我们的方法在提高论文、作者和场所的排名效率以及对引用的恶意操纵方面的鲁棒性方面大大优于最先进的竞争对手。并使用基于词嵌入的方法来估计被引论文和被引论文的主题相似度。一个异构网络是用加权引用链接和其他几个特征构建的。基于由三类实体组成的异构网络,我们应用迭代的类 PageRank 方法,通过相互强化,同时对论文、作者和场地的影响进行排名。实验是在 ACL 数据集上进行的,结果表明,我们的方法在提高论文、作者和场所的排名效率以及对引用的恶意操纵方面的鲁棒性方面大大优于最先进的竞争对手。一个异构网络是用加权引用链接和其他几个特征构建的。基于由三类实体组成的异构网络,我们应用迭代的类 PageRank 方法,通过相互强化,同时对论文、作者和场地的影响进行排名。实验是在 ACL 数据集上进行的,结果表明,我们的方法在提高论文、作者和场所的排名效率以及对引用的恶意操纵方面的鲁棒性方面大大优于最先进的竞争对手。一个异构网络是用加权引用链接和其他几个特征构建的。基于由三类实体组成的异构网络,我们应用迭代的类 PageRank 方法,通过相互强化,同时对论文、作者和场所的影响进行排名。实验是在 ACL 数据集上进行的,结果表明,我们的方法在提高论文、作者和场所的排名效率以及对引用的恶意操纵方面的鲁棒性方面大大优于最先进的竞争对手。

更新日期:2021-07-19
down
wechat
bug