当前位置: X-MOL 学术ACM Comput. Surv. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Temporal Relation Extraction in Clinical Texts
ACM Computing Surveys ( IF 23.8 ) Pub Date : 2021-09-17 , DOI: 10.1145/3462475
Yohan Bonescki Gumiel 1 , Lucas Emanuel Silva e Oliveira 1 , Vincent Claveau 2 , Natalia Grabar 3 , Emerson Cabrera Paraiso 4 , Claudia Moro 1 , Deborah Ribeiro Carvalho 5
Affiliation  

Unstructured data in electronic health records, represented by clinical texts, are a vast source of healthcare information because they describe a patient's journey, including clinical findings, procedures, and information about the continuity of care. The publication of several studies on temporal relation extraction from clinical texts during the last decade and the realization of multiple shared tasks highlight the importance of this research theme. Therefore, we propose a review of temporal relation extraction in clinical texts. We analyzed 105 articles and verified that relations between events and document creation time, a coarse temporality type, were addressed with traditional machine learning–based models with few recent initiatives to push the state-of-the-art with deep learning–based models. For temporal relations between entities (event and temporal expressions) in the document, factors such as dataset imbalance because of candidate pair generation and task complexity directly affect the system's performance. The state-of-the-art resides on attention-based models, with contextualized word representations being fine-tuned for temporal relation extraction. However, further experiments and advances in the research topic are required until real-time clinical domain applications are released. Furthermore, most of the publications mainly reside on the same dataset, hindering the need for new annotation projects that provide datasets for different medical specialties, clinical text types, and even languages.

中文翻译:

临床文本中的时间关系提取

以临床文本为代表的电子健康记录中的非结构化数据是医疗保健信息的大量来源,因为它们描述了患者的旅程,包括临床发现、程序和有关护理连续性的信息。在过去十年中发表的几项关于从临床文本中提取时间关系的研究以及多个共享任务的实现凸显了这一研究主题的重要性。因此,我们建议对临床文本中的时间关系提取进行回顾。我们分析了 105 篇文章,并验证了事件与文档创建时间(一种粗略的时间类型)之间的关系是通过传统的基于机器学习的模型得到解决的,而最近很少有举措推动基于深度学习的模型的最新技术。对于文档中实体(事件和时间表达式)之间的时间关系,由于候选对生成和任务复杂性导致的数据集不平衡等因素直接影响系统的性能。最先进的技术基于基于注意力的模型,上下文化的词表示被微调以进行时间关系提取。然而,在实时临床领域应用程序发布之前,还需要进一步的实验和研究课题的进展。此外,大多数出版物主要位于同一数据集上,从而阻碍了对为不同医学专业、临床文本类型甚至语言提供数据集的新注释项目的需求。由于候选对生成和任务复杂性导致的数据集不平衡等因素直接影响系统的性能。最先进的技术基于基于注意力的模型,上下文化的词表示被微调以进行时间关系提取。然而,在实时临床领域应用程序发布之前,还需要进一步的实验和研究课题的进展。此外,大多数出版物主要位于同一数据集上,从而阻碍了对为不同医学专业、临床文本类型甚至语言提供数据集的新注释项目的需求。由于候选对生成和任务复杂性导致的数据集不平衡等因素直接影响系统的性能。最先进的技术基于基于注意力的模型,上下文化的词表示被微调以进行时间关系提取。然而,在实时临床领域应用程序发布之前,还需要进一步的实验和研究课题的进展。此外,大多数出版物主要位于同一数据集上,从而阻碍了对为不同医学专业、临床文本类型甚至语言提供数据集的新注释项目的需求。在发布实时临床领域应用程序之前,需要对该研究主题进行进一步的实验和取得进展。此外,大多数出版物主要位于同一数据集上,从而阻碍了对为不同医学专业、临床文本类型甚至语言提供数据集的新注释项目的需求。在发布实时临床领域应用程序之前,需要对该研究主题进行进一步的实验和取得进展。此外,大多数出版物主要位于同一数据集上,从而阻碍了对为不同医学专业、临床文本类型甚至语言提供数据集的新注释项目的需求。
更新日期:2021-09-17
down
wechat
bug