MT 中的毒性:原因、挑战和解决方案

2017 年,一名巴勒斯坦建筑工人在 Facebook 上发布了他靠在推土机上的照片,并配文“yusbihuhum”,意思是“早上好”。然而,Facebook 的机器翻译将这个词翻译成英语的“伤害他们”或希伯来语的“攻击他们”。《卫报》报道说,警察第二天就逮捕了他,并审问了他几个小时,直到他们意识到自己的错误。
虽然机器翻译 (MT) 不断进步并产生更准确的翻译,但它仍远非完美。它仍然会犯各种类型的错误,包括具有经济、法律和安全后果的严重错误,称为有毒 MT。
什么是有毒 MT?
毒性是指“由于翻译不正确,翻译可能会激起对个人或群体(宗教、种族、性别等)的仇恨、暴力、亵渎或辱骂的情况,”伦敦帝国理工学院对严重错误的一项研究指出在公吨。
这种毒性错误可能最初出现在源文本中,或者在源文本中没有出现时在翻译中引入,称为“附加毒性”。这种增加的毒性可能是由于翻译错误,例如不正确的词汇选择。或者它也可以是幻觉的形式,当译文中的有毒元素(例如亵渎词)在源句中似乎没有任何对应元素时。
有毒 MT 的成因和挑战
MT 的毒性有多种原因。以下因素的汇合导致了毒性 MT 的发生。
口语
社交媒体、在线论坛和其他数字渠道上的用户生成内容 (UGC) 呈爆炸式增长。准确的 MT 具有挑战性,因为 UGC 经常使用口语或俚语。在社交媒体上发帖的人并不特别在意他们写的内容和方式。拼写错误、非正式缩写、缩写和语法错误很常见,导致通用 MT 引擎难以理解和翻译。
攻击性语言
攻击性语言会增加翻译中发现的严重错误的数量。仇恨言论、种族和性别歧视以及极端主义观点在教资会中很常见。并且需要检测和调节这些不同语言的冒犯性词语。当一个句子有很多脏话和冒犯性的词时,机器翻译可能会产生错误的翻译。MT 引擎使用各种策略,例如直译、音译、省略、随机翻译或替换,这些策略可以混合使用。
符号和特殊字符
使用符号、表情符号和特殊字符(例如星号和主题标签)可以为句子添加上下文或伪装单词。MT 可能会忽略包含符号和特殊字符的单词。这些要么留在源语言中,要么以不正确的含义呈现。因此,翻译内容时,可能会丢失原始情感或意图。
低资源语言
Meta 委托进行的“不让任何语言掉队”研究表明,各种语言的附加毒性范围在 0% 到 5% 之间,并且由于缺乏训练数据,附加毒性最高的语言是资源匮乏的语言。此外,添加最多毒性的内容包括性别和性别、能力和性取向。大规模检测数百种语言的毒性具有挑战性,主要是使用不太广泛的语言。
缺乏人工后期编辑
没有任何人工后期编辑的自动机器翻译很常见,尤其是对于 UGC。用户共享的内容数量庞大,无法手动编辑机器翻译的内容。由于实时发布了如此多的数据,人工翻译或审校人员更正机器翻译的内容变得太昂贵也太晚了。
内置偏差
不幸的是,无论是否有意,人类的偏见都会被纳入 AI 算法中。AI 开发人员容易受到偏见的影响,这些偏见会影响神经机器翻译 (NMT) 系统的设计方式、场景的构建方式以及训练数据的标记方式。这些数据可能会偏向特定群体,从而导致翻译不具有包容性和冒犯性。
操纵
可以使用包含特定单词、短语或字母数字符号的提示来操作 NMT。墨尔本大学的一项研究表明,攻击者可以使用反向翻译从使用“单语言中毒”的 NMT 系统中生成有毒单词。通过在 NMT 系统的训练数据集中插入几个单词或句子,它会引发特定的、有针对性的翻译行为,例如兜售假新闻。
如何解决有毒 MT
为了对抗有毒机器翻译的兴起,语言服务行业和其他利益相关者必须采取多管齐下的方法。
机器翻译素养
流行的 MT 工具,如谷歌翻译,已经变得如此容易访问和易于使用,以至于人们只接受翻译的表面价值。但是,用户需要具备批判性思维并了解机器翻译的局限性。
语言服务行业必须通过面向各种利益相关者的外展计划和促销活动来倡导更广泛的机器翻译素养。其中包括与说外语的人打交道的学生、研究人员、公司和专业人士。
训练数据
由于 NMT 系统的训练数据可能成为毒性来源,因此组织和语言服务提供商 (LSP) 必须改进训练数据集的开发。数据标签对于训练 AI 算法至关重要。标签可以训练模型识别仇恨言论、冒犯性语言和假新闻。
使用元数据,即描述其他信息的信息,LSP 和 AI 开发人员可以使用相关属性标记数据。它提高了使用 AI 翻译时的匹配度,从而使翻译更加准确。元数据可以包括有关源内容的信息,包括目标受众、语言、本地化关键字和内容的目的。描述性元数据还可以识别源内容的正式程度及其阅读水平。
后期编辑机器翻译
NMT 仍然存在局限性,即使有更强大和可靠的训练数据集。这意味着人工翻译人员需要对机器翻译的内容进行后期编辑工作。称为 MT+PE(或 PEMT)的机器翻译加译后编辑对于检测算法遗漏的有毒翻译至关重要。
如果在 LQA 和 MT 质量评估阶段识别出机器翻译质量差的文本,则会自动将其发送给人工编辑以进行翻译质量评估 (TQA)。TQA 用于编辑机器翻译的内容,并通过将正确的翻译合并到训练数据中来改进 NMT 系统。