当前位置: X-MOL 学术J. Comput. Sci. Tech. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Enriching Context Information for Entity Linking with Web Data
Journal of Computer Science and Technology ( IF 1.9 ) Pub Date : 2020-07-01 , DOI: 10.1007/s11390-020-0280-1
Yi-Ting Wang , Jie Shen , Zhi-Xu Li , Qiang Yang , An Liu , Peng-Peng Zhao , Jia-Jie Xu , Lei Zhao , Xun-Jie Yang

Entity linking (EL) is the task of determining the identity of textual entity mentions given a predefined knowledge base (KB). Plenty of existing efforts have been made on this task using either “local” information (contextual information of the mention in the text), or “global” information (relations among candidate entities). However, either local or global information might be insufficient especially when the given text is short. To get richer local and global information for entity linking, we propose to enrich the context information for mentions by getting extra contexts from the web through web search engines (WSE). Based on the intuition above, two novel attempts are made. The first one adds web-searched results into an embedding-based method to expand the mention’s local information, where we try two different methods to help generate high-quality web contexts: one is to apply the attention mechanism and the other is to use the abstract extraction method. The second one uses the web contexts to extend the global information, i.e., finding and utilizing more extra relevant mentions from the web contexts with a graph-based model. Finally, we combine the two models we propose to use both extended local and global information from the extra web contexts. Our empirical study based on six real-world datasets shows that using extra web contexts to extend the local and the global information could effectively improve the F1 score of entity linking.

中文翻译:

为实体链接与 Web 数据丰富上下文信息

实体链接 (EL) 是在给定预定义知识库 (KB) 的情况下确定文本实体提及的身份的任务。已经使用“本地”信息(文本中提及的上下文信息)或“全局”信息(候选实体之间的关系)在此任务上进行了大量现有工作。但是,本地或全局信息可能不足,尤其是当给定的文本很短时。为了获得更丰富的实体链接的本地和全局信息,我们建议通过网络搜索引擎 (WSE) 从网络获取额外的上下文来丰富提及的上下文信息。基于上述直觉,进行了两种新颖的尝试。第一个将网络搜索结果添加到基于嵌入的方法中,以扩展提及的本地信息,我们尝试了两种不同的方法来帮助生成高质量的 Web 上下文:一种是应用注意力机制,另一种是使用抽象提取方法。第二个使用网络上下文来扩展全局信息,即通过基于图形的模型从网络上下文中查找和利用更多额外的相关提及。最后,我们结合了我们建议的两个模型,以使用来自额外网络上下文的扩展本地和全局信息。我们基于六个真实世界数据集的实证研究表明,使用额外的网络上下文来扩展本地和全局信息可以有效提高实体链接的 F1 分数。即,使用基于图形的模型从网络上下文中查找和利用更多额外的相关提及。最后,我们结合了我们建议的两个模型,以使用来自额外网络上下文的扩展本地和全局信息。我们基于六个真实世界数据集的实证研究表明,使用额外的网络上下文来扩展本地和全局信息可以有效提高实体链接的 F1 分数。即,使用基于图形的模型从网络上下文中查找和利用更多额外的相关提及。最后,我们结合了我们建议的两个模型,以使用来自额外网络上下文的扩展本地和全局信息。我们基于六个真实世界数据集的实证研究表明,使用额外的网络上下文来扩展本地和全局信息可以有效提高实体链接的 F1 分数。
更新日期:2020-07-01
down
wechat
bug