亚马逊希望进一步自动化字幕翻译的质量检查

在数字娱乐领域运营的公司已经提出了一些有趣的创新来降低生产成本。他们关注的一个领域是配音,这为提高Netflix、HBO和Amazon Prime等流媒体平台的市场份额提供了巨大的潜力。
在这些创新中,Synthesis的唇形同步配音技术还有纸杯合成配音工具在最近的记忆中脱颖而出。当然,还有字幕——这是亚马逊研究人员在2021年4月1日发表的一篇论文的用例。
作者:Prabhakar Gupta,Ridha Juneja,Anil Nelakanti和Tamojit Chatterjee,鈥检测翻译过度/不足[OT/UT]错误以确定人工翻译的充分性提出了一种在字幕翻译质量评价中标记错误的新方法。
研究小组并没有将他们的研究局限于机器翻译(MT)输出,而是专门针对翻译管道中带有专业字幕的实例。他们说:“我们的系统的目标是从高错误召回率的人工翻译视频字幕中识别出OT/UT错误。”。
此外,根据作者的说法,他们的模型能够检测人类翻译中的OT/UT,而不需要任何参考翻译,也就是说,他们根据合成数据训练模型。研究人员补充说,这个综合引入错误的数据集表现良好,在8种语言的高质量人类注释评估数据上,取得了89.3%的准确率
研究人员将翻译质量定义为“既要保证译文的流畅性,又要考虑到译文相对于原文的充分性”,研究人员还提出了通过尽早标记错误来降低生产成本的可能性。
他们写道,翻译后的字幕通常需要人工质量检查,其成本与获取译文的成本一样高[为了降低编辑后的质量检查成本,我们可以在输入译文时标记错误,而QE充当护栏
他们将这个系统与那些动态标记拼写或语法错误的应用程序相比较。当然,作者描述的这种翻译技术并不是什么新鲜事(参见:预测/自适应机器翻译via) 轻快). 然而,并不是所有的机器翻译质量检查都是平等的,比如说,翻译的市场营销副本可能对字幕非常有效。
作者指出,译文在语言上是不完整的,在编辑后是可以接受的。鈥淭这是因为字幕需要遵循一套技术限制条件,限制了翻译中的选择和字数
他们举了一个例子(“公园里有棵绿树”翻译成“公园里有棵绿树”)作为通过subbing质量检查的例子,因为观众可以理解上下文。
亚马逊的研究人员总结说,他们仍然计划通过“通过与人工翻译的紧密耦合来改善错误模式”,并将错误限制在句子中的标记,而不是标记整个句子。