当前位置: X-MOL 学术Russian Linguistics › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Not by chance. Russian aspect in rule-based machine translation
Russian Linguistics ( IF 0.9 ) Pub Date : 2016-10-06 , DOI: 10.1007/s11185-016-9169-6
Barbara Sonnenhauser , Robert Zangenfeind

The aim of this paper is twofold: it illustrates the benefits of rule-based instead of statistical machine translation, and it provides a starting point for the machine translation of the Russian aspect into English. Rule-based machine translation is still promising, from both a computational and theoretical point of view, because by implementing rules on the computer theoretical assumptions concerning linguistic structures can be verified and improved. This will be shown using the example of the category of aspect, which is one of the main challenges for machine translation from Russian to English. A small corpus study on the translation of Russian sentences with verbs in the past tense (perfective and imperfective) by human translators shows that three-quarters of Russian verbs (both imperfective and perfective) are translated by English simple past forms. While this results from language internal markedness relations, the translation of the remaining 25 % requires an in-depth analysis of the various interpretations possible for the Russian aspect. We propose a semantic analysis based on which rules for the interpretation and translation of Russian aspect in a machine translation system can be derived. Their implementation in the machine translation system ĖTAP is shown in this paper using two test cases as examples.АннотацияЦель этой статьи двояка: она иллюстрирует пользу машинного перевода на основе правил по сравнению с машинным переводом на основе статистики и предлагает отправной пункт для машинного перевода русского вида глагола на английский язык. Машинный перевод на основе правил всё ещё имеет свои выгоды, и с вычислительной, и с теоретической точки зрения, поскольку, применив правила на компьютере, теоретические гипотезы, касающиеся лингвистических структур, будут проверены и улучшены. Мы это покажем на примере вида глагола, который является одной из главных сложностей для машинного перевода с русского на английский язык. Исследуя часть параллельного корпуса русского национального корпуса, мы изучаем, как русские предложения с глаголами в прошедшем времени переводятся на английский язык переводчиками-людьми. Эти исследования показывают, что три четверти русских глаголов (как несовершенного, так и совершенного вида) этого корпуса переводятся английскими формами past simple (претерит). В то время как это представляет собой следствие внутренних языковых отношений маркированности, перевод остальных 25 % требует глубокого анализа различных возможностей интерпретации русского аспекта. На основе семантического анализа, который мы предложим, можно получить правила для трактовки и перевода русского аспекта в системе машинного перевода. Их применение в системе машинного перевода (в этом случае ЭТАП) продемонстрировано в данной статье на двух примерах.

中文翻译:

不是偶然。基于规则的机器翻译中的俄语方面

本文的目的有两个:它说明了基于规则而不是统计机器翻译的好处,并为将俄语方面的机器翻译成英语提供了一个起点。从计算和理论的角度来看,基于规则的机器翻译仍然很有希望,因为通过在计算机上实施规则,可以验证和改进有关语言结构的理论假设。这将使用方面类别的例子来展示,这是从俄语到英语的机器翻译的主要挑战之一。一项小型语料库研究显示,四分之三的俄语动词(包括未完成式和完成式)是用英语简单过去时形式翻译的。虽然这是语言内部标记关系的结果,但其余 25% 的翻译需要深入分析俄语方面可能的各种解释。我们提出了一种语义分析,基于哪些规则可以推导出机器翻译系统中俄语方面的解释和翻译规则。本文使用两个测试用例作为示例展示了它们在机器翻译系统 ĖTAP 中的实现。它说明了基于规则的机器翻译与基于统计的机器翻译的优势,并为将俄语动词机器翻译成英语提供了一个起点。基于规则的机器翻译在计算和理论上仍然有好处,因为通过在计算机上应用规则,将测试和改进关于语言结构的理论假设。我们将使用动词形式的例子来展示这一点,这是从俄语到英语的机器翻译的主要困难之一。通过检查俄罗斯国家语料库的部分平行语料库,我们研究了人工翻译人员如何将带有过去时动词的俄语句子翻译成英语。这些研究表明 该语料库中四分之三的俄语动词(包括不完美和完美)是由英语过去简单形式翻译的。虽然这是标记的内部语言关系的结果,但其余 25% 的翻译需要深入分析解释俄语方面的各种可能性。基于我们提出的语义分析,有可能获得机器翻译系统中俄语方面的解释和翻译规则。本文使用两个示例演示了它们在机器翻译系统(在本例中为 ETAP)中的应用。翻译剩余的 25% 需要深入分析解释俄语方面的各种可能性。基于我们提出的语义分析,有可能获得机器翻译系统中俄语方面的解释和翻译规则。本文使用两个示例演示了它们在机器翻译系统(在本例中为 ETAP)中的应用。翻译剩余的 25% 需要深入分析解释俄语方面的各种可能性。基于我们提出的语义分析,有可能获得机器翻译系统中俄语方面的解释和翻译规则。本文使用两个示例演示了它们在机器翻译系统(在本例中为 ETAP)中的应用。
更新日期:2016-10-06
down
wechat
bug