当前位置: X-MOL 学术arXiv.cs.AI › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
基于短语和神经机器翻译的实证分析
arXiv - CS - Artificial Intelligence Pub Date : 2021-03-04 , DOI: arxiv-2103.03108
Hamidreza Ghader

机器翻译(MT)的两种流行类型是基于短语的翻译系统和神经机器翻译系统。这两种类型的系统都由多个复杂的模型或层组成。这些模型和层中的每一个都学习源语言的不同语言方面。但是,对于其中一些模型和层,尚不清楚学习哪些语言现象或如何学习此信息。对于基于短语的MT系统,通常很清楚每种模型都学习了哪些信息,而问题在于,如何学习此信息,尤其是对于短语重新排序模型而言。对于神经机器翻译系统,情况甚至更为复杂,因为在许多情况下,尚不清楚确切地了解到什么信息以及如何学习。为了阐明MT系统捕获的语言现象,我们分析了基于短语的MT系统和神经MT系统中重要模型的行为。我们考虑基于短语的MT系统中的短语重排序模型,以研究短语内部的哪些单词对定义短语重排序行为的影响最大。此外,为了提高神经MT系统的可解释性,我们研究了注意力模型的行为,该模型是神经MT系统的关键组成部分,并且是与基于短语的系统中的短语重排模型最接近的功能模型。注意模型与编码器隐藏状态表示一起构成对神经MT中的源侧语言信息进行编码的主要组件。为此,我们还将分析在神经MT系统的编码器隐藏状态表示中捕获的信息。



"点击查看英文标题和摘要"

更新日期:2021-03-05
down
wechat
bug