人工智能自动化如何加速语言质量评估
在2024年6月的SlatorCon Remote活动中,Phrase的首席执行官Georg Ell博士与首席产品官Simone Bohnenberger-Rich博士共同向与会者深入介绍了在本地化语言质量评估(LQA)领域,人工智能自动化所带来的显著成果。他们详细回答了关于如何将人工智能有效集成至各类产品,以及通过自动化能够实现的具体优势等问题。
为了深入探讨这一主题,Slator向Ell博士询问了Phrase在帮助客户应对内容生成和本地化方面,尤其是在大规模操作中的变化时所采取的策略。
Ell博士解释说,目前,内容生成方式的演变以及人工智能在推动这些变化中所起的作用,已经引起了人们的广泛关注。他特别指出,这些变化包括在互联网上实时传输的海量数据,以及为每个用户定制的高度个性化内容。据他估计,大约有20%的本地化客户已经开始采用自动化技术,这是因为他们迫切需要应对不断增长的内容量,并最终实现超自动化。
在谈到大规模内容处理时,Bohnenberger-Rich博士提到,当前关于人工智能的炒作正在改变人们对本地化成本的预期,使得人们期望能够以更低的成本完成更多的工作。她警告说:“有时,我们会看到本地化团队的预算被削减,因为他们错误地认为生成式人工智能会自然而然地降低成本。这就是我所说的‘盲目热情’。”
她进一步指出,团队最终会认识到,要实现真正的自动化、降低成本并有效解决实际问题,仅仅依靠生成式人工智能和大型语言模型(LLM)是不够的。
Phrase的首席产品官阐释了公司如何“基于工作流组件和高级分析组件的功能,来实施大型语言模型和人工智能,从而创造最大的价值。这将为用户提供大量关于他们能做什么以及何时进行操作的智能信息。”
针对本地化过程中质量保证(QA)环节的复杂性,Bohnenberger-Rich博士还详细介绍了Phrase在QA方面的关键创新,这些创新有助于简化流程并减少不必要的人工干预。
她强调,要改变决定人工干预QA的方式,就需要从对主题或语言对难度的主观假设,转变为对质量水平的自动化和系统化评估。她解释说,Phrase的质量性能评分(Phrase QPS)正是能够完成这一任务的重要工具之一。
此外,她还谈到了确保自动化QA流程在不同规模上都能保持一致性表现的重要性。她解释说,自动化这样一个高度主观的过程,需要通过严格的一致性来消除主观性。同时,产品还需要透明地展示低质量和高质量的标准,以便客户能够理解人工智能做出特定决策的原因。
在谈到语言服务提供商(LSP)的机遇时,Ell博士指出,翻译公司可以通过实施自动化来增加收入,并帮助客户实现更多内容的本地化。他认为,LSP可以作为技术合作伙伴,因为许多买家在决定人工智能本地化自动化的方向时缺乏必要的知识。
Ell博士强调,需要将语言行业视为一个生态系统的一部分,例如Phrase这样的语言技术公司。在这个生态系统中,LSP所拥有的数据和专家资源可以帮助改进LLM。他认为,“将这两者结合在一起是解锁大型语言模型价值的关键,因为你需要将它们定制到特定的用例中。”
他还补充说,在处理大量数据时,某些商业模式将需要进行调整,以适应在更短时间内完成更多工作的需求,包括确定何时进行人工干预以进行质量检查。同时,他表示,LSP将有多种方式来实现这些变革。
最后,在谈到顺序QA循环的终结时,Bohnenberger-Rich博士解释了如何在众多不同的QA循环中实现多个QA类别的自动化。她提到,在利用高质量翻译记忆库等资源来训练和微调LLM时,人们已经认识到,某些QA类别是可以信赖地实现适当自动化的,但这完全取决于具体的用例。
她补充说,在考虑到每个用例的具体需求时,QA过程的部分环节将实现不同程度的自动化。她将这一过程描述为从用例出发——即需要解决的问题——然后反向工作,以在流程中分配自动化步骤。
她总结道:“客户可以根据他们的用例和需求,来决定他们希望在速度、可扩展性和自动化方面取得多大的进展,以及他们更倾向于为哪种类型的资产设置异常循环。”
在Phrase,团队已经认真考虑了客户反馈,并对QPS模型进行了微调,Ell博士补充道。在他看来,理想情况下——也许就在不久的将来——一个自动化的QA系统将能够为客户提供更多的选择权,使他们能够根据具体的用例和内容类型来选择更加严格或更加灵活的QA方式。