超过半个世纪后,机器翻译已从科幻演变为现实。机器翻译系统开发者不再因一个问题未得到解决而苦恼,翻译人员也不再担忧“机器的崛起”会剥夺他们的生计。虽然计算机几乎不可能在各个领域取代人工翻译,但机器翻译已得到有效运用,纵使只能完成一系列十分有限的任务。熟悉机器翻译的工作原理、局限性及其应用领域十分重要,从而可了解何时应使用或应避免使用机器翻译,这将极大降低您的失望感。
机器翻译系统类型
机器翻译系统归属于以下三个类别中的一个:基于规则的机器翻译 (RBMT) 系统、统计机器翻译 (SMT) 系统及最具发展前途的“混合系统”,它结合了 RBMT 与 SMT 的优势。RBMT 系统对文本进行分析,使用内置词典及一套适用于特定语言对的规则创建翻译。SMT 系统依据统计分析:将大量源文本(多达数百万字)连同人工输入的目标翻译一起加载到应用程序中。应用程序分析统计语际配对、词语使用及语法结构,并依据这些分析选择适合的翻译。这个过程称为自我训练。该系统还可由编辑生成翻译的翻译人员进行训练。广为人知的谷歌翻译服务即使用这个原理。由于统计及混合机器翻译系统的自我训练能力,它们可在每次完成翻译后积累语言数据,从而提高翻译质量。
机器翻译注意事项
机器翻译的主要优点是,它可快速处理篇幅极大的文本,较之人工翻译有时更具成本效益。前面提到过,人们应时刻牢记,机器翻译的质量永远不会优于人工翻译。因此,只在特定情况下使用机器翻译是不无道理的。
首先,机器翻译适用于内部使用的材料。例如,您需要理解外语网站、文章、信件或国际刊物上特定事件新闻报道的主旨。其次,机器翻译可应用于译后将经该领域专家编辑的技术和高度专业化文本。这种情况下,目标文本用作逐行翻译,技术专家将据此运用学科领域知识生成最终文本。
根据定义,许多类型的材料不适合机器翻译。如若不准确的翻译可能危害人体健康、损坏先进设备或危及重大合同,将不能信任机器翻译。这种情况下,节省时间并不是造成风险的开脱。任何有关法律责任(合同、保修)的文件都须由人工处理。机器翻译不适用于营销材料,事实上这类文本在新的文化背景下意义出现改变,均为重新创造。
翻译极其形式化的技术文本时质量通常尚可,但文学翻译和宣传文本则超出了机器翻译的范畴。
初期的文本准备及译后编辑
文本的初期准备可大幅简化机器翻译系统和编辑修改原始机器翻译的工作。在编排源文本阶段即开始准备工作。为此,应为技术文档工程师制定标准,他们需遵循标准从而使文本对机器和人而言更易于理解及翻译。
以下三条规则对提高英语的机器翻译质量大有帮助:
- 用不定式动词形式代替动名词
- 用主动语态代替被语态
- 避免使用复合句及同类的句子成分
理想情况下,每个句子应传达单一的逻辑思想。这条规则等量适用于所有语言,是三条中最为有效的。
实践已证明,遵循这些简单的规则和正确使用机器翻译系统可大大简化目标文本的译后编辑工作。这将使您了解在机器翻译前形式化及标准化文本的优势,即运用特殊应用程序、文本译前编辑,或仅仅要求文档工程师遵循一套最有效的基本规则管理文本内容创作。
译后编辑指由受过特殊培训及拥有机器翻译文本处理经验的编辑修改原始机器翻译。大多数情况下,机器翻译需进行译后编辑。但有时可省略该步骤,尤其当文本翻译为内部使用或只需掌握大意抑或查找及选择特定材料时。译后编辑所需的时间和劳动量是评估机器翻译成本效益时需考虑的关键因素之一。根据定义不适合机器翻译的文学、宣传及其他文本也不需进行译后编辑:欲将文本质量提高至人工翻译所译出的水平,编辑应重新改写文本,从而抵消使用机器翻译的优势。
数量及经济
采取机器翻译前,不仅应清楚理想的最终结果并意识到该方法的局限性,还应记住另一个要素:机器翻译系统需经过复杂的定制和改良,包括特定学科领域的“训练”,否则将无法达到预期成果。因此只对大量相似文本使用机器翻译是有道理的。只有这种情况下,在使用机器翻译及获取适于译后编辑的文本之前花费一定时间培训系统才具有成本效益。同时,当翻译工作仅涉及数十页时,尝试机器翻译将毫无效果,且最终极其昂贵。
因此,机器翻译与译后编辑只在处理大量相似文本时才具有价值。这是因为大宗翻译由翻译机构处理,而这些机构通常专注于特定学科领域,在这些公司配置极其有效而昂贵的最新一代机器翻译解决方案更为经济,而不论多大的内容提供商抑或自由译员都不可能独自有效使用机器翻译。