论英汉机器翻译的改进之道(三)

1 人赞同了该文章

机器误译分析

导致机器误译的主要原因对原文句子的理解错误,而对一个句子的理解过程主要包括对词汇语义的确定和对句子结构的把握。因此,我们将机器误译的原因简要分类为:词汇理解错误和结构理解错误。前文例(1)中的机器译文就既有词汇理解错误,“strain”在此处的意思应该是“to strain some-thing means to make it do more than it is able to do.”(使不堪重负),译作“影响”程度太轻,译作“带来”完全错误,译作“变得很紧张”搭配不当。也有结构理解错误,“credibility”( If someone or some-thing has credibility,people believe in them and trust them.)指的是人们相信这个论述的程度,也就是这个论述的可信度,而不是这位总统的可信度、这位总统的声誉,或公众的信誉。另外,为了分类的简洁,我们将少量的逻辑错误归入结构理解错误。当然也有的句子只犯了两种错误中的一种。如:

(3)What is true,however,is that sanctions are failing to produce the desired effect of a check on President Putin’s adventurism.

1.然而,真实的是,制裁未能产生对普京总统的冒险主义的检查所产生的预期效果。(谷歌)

2.然而,事实是,制裁未能对普京总统的冒险主义产生预期的效果。(搜狗)

3.然而,事实是,制裁未能产生对普京总统冒险主义进行检查的预期效果。(必应)

4.然而,事实是,这些制裁措施在制止普京总统的冒险主义方面并没有产生预期的效果。(人工)

很明显,三句机器译文的错误主要源于对“check”的理解错误,应该是“制止”而不是“检查”。

(4)Regulatory changes have made banks less willing to hold or buy large volumes of securities in a way that might function as a shock absorber in a falling market.

1.监管改革使得银行不太愿意持有或购买大量证券,而这种方式可能会在市场下跌的情况下起到减震器的作用。(必应)

2.监管变化使得银行不那么愿意持有或买入大量证券,从而无法在市场下跌时起到缓冲作用。(人工)

3.监管方面的变化使得银行不太愿意以某种方式持有或购买大量证券,而这种方式在衰退的市场中可能起到减震器的作用。(百度)

4.监管变化使得银行不太愿意持有或购买大量证券,这种方式可能会在市场下跌时起到缓冲作用。(搜狗)

很有意思的是,这个句子的机器译文和人工译文正好相反。问题在于“might function as a shock absorber in a falling market”(在市场下跌时起到缓冲作用)的逻辑主语是什么?逻辑分析告诉我们应该是“银行持有或购买大量证券”( to hold or buy large volumes of securities)才能在市场下跌时,对其起到减震/缓冲的作用。

在对40个误译句子进行标记后,我们得出28句子误译的主要原因是词汇理解错误,22个句子是结构/逻辑理解错误,其中10个句子两种错误都很明显。

语用学认为,一个人对文本理解来自于将文本的语言学知识与相应的语境信息相结合的推理过程。对于机器翻译而言,文本的语言学知识并不缺乏,所以误译基本上与语境或推理相关。词汇理解错误多与上下文语境有关,如例(3)中的check与冒险主义( adventurism)搭配,与制裁( sanctions)呼应,所以应取“抑制、阻止”之意。结构/逻辑错误则多与背景知识和推理过程的逻辑性有关。如对例( 1)中credibility和例(4)中in away的理解都和逻辑推理有关。

现有计算机的智能模拟是一种基于符号句法属性的认知模拟行为,这使其在语义理解和学习层面上存在着极大的短板:计算机的符号检索和操作行为本质上并没有涉及语义的逻辑推理,而计算机仅有的“联想”能力是建立在符号规则的有限归纳基础上而实现的。换言之,机器翻译的本质还是停留在符号层面上寻找对应关系,并没有深入到语义层面进行逻辑推理。所以,尽管人工智能取得了突破性进展,机器翻译的准确率有了显著提高,但距离取代人工翻译还为时尚早。因此,译后编辑也就变得非常必要和重要,且译后编辑的重点是词语和词语之间的逻辑联系以及语义的合理性。鉴于新闻文本更新快,读者对细节的要求不是很高,本文提及的译后编辑属于快速译后编译( light post-editing )。快速译后编辑尽量多的采用机器翻译的原始输出,重点是修改错译、文化差异的内容、重新组织句式结构,但不修改译文的风格。

发布于 2022-05-04 22:46:48
还没有评论
    旗渡客服