当前位置: X-MOL 学术ACM Trans. Inf. Syst. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Pairwise Link Prediction Model for Out of Vocabulary Knowledge Base Entities
ACM Transactions on Information Systems ( IF 5.4 ) Pub Date : 2020-09-02 , DOI: 10.1145/3406116
Richong Zhang 1 , Samuel Mensah 1 , Fanshuang Kong 2 , Zhiyuan Hu 1 , Yongyi Mao 3 , Xudong Liu 4
Affiliation  

Real-world knowledge bases such as DBPedia, Yago, and Freebase contain sparse linkage connectivity, which poses a severe challenge to link prediction between entities. To cope with such data scarcity issues, recent models have focused on learning interactions between entity pairs by means of relations that exist between them. However promising, some relations are associated with very few tail entities or head entities, resulting in poor estimation of the relation interaction between entities. In this article, we break the sole dependency of modeling relation interactions between entity pairs by associating a triple with pairwise embeddings, i.e., distributed vector representations for pairs of word-based entities and relation of a triple. We capture the interactions that exist between pairwise embeddings by means of a Pairwise Factorization Model that employs a factorization machine with relation attention. This approach allows parameters for related interactions to be estimated efficiently, ensuring that the pairwise embeddings are discriminative, providing strong supervisory signals for the decoding task of link prediction. The Pairwise Factorization Model we propose exploits a neural bag-of-words model as the encoder, which effectively encodes word-based entities into distributed vector representations for the decoder. The proposed model is simple and enjoys efficiency and capability, showing superior link prediction performance over state-of-the-art complex models on benchmark datasets DBPedia50K and FB15K-237.

中文翻译:

词汇表外知识库实体的成对链接预测模型

DBPedia、Yago 和 Freebase 等现实世界的知识库包含稀疏的链接连接,这对实体之间的链接预测提出了严峻的挑战。为了应对此类数据稀缺问题,最近的模型专注于通过实体对之间存在的关系来学习它们之间的交互。无论多么有希望,一些关系与很少的尾部实体或头部实体相关联,导致对实体之间的关系交互作用的估计不佳。在本文中,我们通过将三元组与成对嵌入相关联,即基于词的实体对的分布式向量表示和三元组的关系,打破了实体对之间关系交互建模的唯一依赖关系。我们通过使用具有关系注意的分解机器的成对分解模型来捕获成对嵌入之间存在的交互。这种方法可以有效地估计相关交互的参数,确保成对嵌入具有判别性,为链接预测的解码任务提供强大的监督信号。我们提出的成对分解模型利用神经词袋模型作为编码器,它有效地将基于词的实体编码为解码器的分布式向量表示。所提出的模型简单且具有效率和能力,在基准数据集 DBPedia50K 和 FB15K-237 上显示出优于最先进的复杂模型的链路预测性能。这种方法可以有效地估计相关交互的参数,确保成对嵌入具有判别性,为链接预测的解码任务提供强大的监督信号。我们提出的成对分解模型利用神经词袋模型作为编码器,它有效地将基于词的实体编码为解码器的分布式向量表示。所提出的模型简单且具有效率和能力,在基准数据集 DBPedia50K 和 FB15K-237 上显示出优于最先进的复杂模型的链路预测性能。这种方法可以有效地估计相关交互的参数,确保成对嵌入具有判别性,为链接预测的解码任务提供强大的监督信号。我们提出的成对分解模型利用神经词袋模型作为编码器,它有效地将基于词的实体编码为解码器的分布式向量表示。所提出的模型简单且具有效率和能力,在基准数据集 DBPedia50K 和 FB15K-237 上显示出优于最先进的复杂模型的链路预测性能。我们提出的成对分解模型利用神经词袋模型作为编码器,它有效地将基于词的实体编码为解码器的分布式向量表示。所提出的模型简单且具有效率和能力,在基准数据集 DBPedia50K 和 FB15K-237 上显示出优于最先进的复杂模型的链路预测性能。我们提出的成对分解模型利用神经词袋模型作为编码器,它有效地将基于词的实体编码为解码器的分布式向量表示。所提出的模型简单且具有效率和能力,在基准数据集 DBPedia50K 和 FB15K-237 上显示出优于最先进的复杂模型的链路预测性能。
更新日期:2020-09-02
down
wechat
bug