当前位置: X-MOL 学术J. Biomed. Inform. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Exploiting adversarial transfer learning for adverse drug reaction detection from texts.
Journal of Biomedical informatics ( IF 4.5 ) Pub Date : 2020-04-24 , DOI: 10.1016/j.jbi.2020.103431
Zhiheng Li 1 , Zhihao Yang 1 , Ling Luo 1 , Yang Xiang 2 , Hongfei Lin 1
Affiliation  

Adverse Drug Reactions (ADRs) are extremely hazardous to patients. ADR Detection aims to automatically determine whether a sentence is related to an ADR, which is a fundamental study for public health monitoring tasks, particularly for pharmacovigilance. Benchmark corpora are mostly sampled from biomedical literature or social media, but most of them are on small scales. Correspondingly, existing ADR detection models are either trained with additional corpora that are annotated manually or jointly trained with the ADR detection and the entity mention extraction task. However, directly training a method with additional corpora sampled from different sources may introduce noises and impact the performance of neural networks. Besides, jointly training a method with different tasks requires the annotation for other tasks, which still increases the annotation workload. To address the above issues, we formulate ADR detection as a text classification task and introduce an adversarial transfer learning framework into ADR detection. Our method focuses on exploiting a source corpus to improve the performance on small target corpora which only contain hundreds of training instances. Also, adversarial learning is applied to prevent corpus-specific features from being introduced into shared space so that corpora from different sources can be leveraged with minimum extra noises. Experimental results on three different benchmark corpora show that our proposed method consistently outperforms other state-of-the-art methods, especially on small corpora.

中文翻译:

利用对抗迁移学习来从文本中检测药物不良反应。

药物不良反应(ADR)对患者极为危险。ADR检测旨在自动确定句子是否与ADR相关,这是对公共健康监测任务(尤其是对药物警戒)进行基础研究。基准语料库大部分是从生物医学文献或社交媒体中取样的,但大多数是小规模的。相应地,现有的ADR检测模型要么通过人工标注的其他语料进行训练,要么通过ADR检测和实体提及提取任务进行联合训练。但是,直接使用从不同来源采样的额外语料库来训练方法可能会引入噪声并影响神经网络的性能。此外,联合训练具有不同任务的方法需要对其他任务进行注释,这仍然增加了注释工作量。为了解决上述问题,我们将ADR检测公式化为文本分类任务,并在ADR检测中引入了对抗性迁移学习框架。我们的方法着重于利用源语料库来提高仅包含数百个训练实例的小型目标语料库的性能。此外,还采用对抗性学习来防止将特定于语料库的功能引入共享空间,以便可以利用来自不同来源的语料库,而将额外的噪音降至最低。在三种不同基准语料库上的实验结果表明,我们提出的方法始终优于其他最新方法,尤其是在小型语料库上。我们将ADR检测公式化为文本分类任务,并将对抗性迁移学习框架引入ADR检测。我们的方法着重于利用源语料库来提高仅包含数百个训练实例的小型目标语料库的性能。此外,还采用对抗性学习来防止将特定于语料库的功能引入共享空间,以便可以利用来自不同来源的语料库,而将额外的噪音降至最低。在三种不同基准语料库上的实验结果表明,我们提出的方法始终优于其他最新方法,尤其是在小型语料库上。我们将ADR检测公式化为文本分类任务,并将对抗性迁移学习框架引入ADR检测。我们的方法着重于利用源语料库来提高仅包含数百个训练实例的小型目标语料库的性能。此外,还采用对抗性学习来防止将特定于语料库的功能引入共享空间,以便可以利用来自不同来源的语料库,而将额外的噪音降至最低。在三种不同基准语料库上的实验结果表明,我们提出的方法始终优于其他最新方法,尤其是在小型语料库上。此外,还采用对抗性学习来防止将特定于语料库的功能引入共享空间,以便可以利用来自不同来源的语料库,而将额外的噪音降至最低。在三种不同基准语料库上的实验结果表明,我们提出的方法始终优于其他最新方法,尤其是在小型语料库上。此外,还采用对抗性学习来防止将特定于语料库的功能引入共享空间,以便可以利用来自不同来源的语料库,而将额外的噪音降至最低。在三种不同基准语料库上的实验结果表明,我们提出的方法始终优于其他最新方法,尤其是在小型语料库上。
更新日期:2020-04-24
down
wechat
bug