论文翻译

如何确保论文翻译的专业性? 论…

翻译认证盖章

翻译认证盖章服务条款 尊敬的客户感谢…

展会口译

展会口译服务简介:上海迪朗翻译公司是…

视频翻译

为什么要翻译视频字幕翻译视频字幕使您…

双语主持

迪朗上海翻译是一家专业的上海双语主持…

同声传译

迪朗(上海)翻译公司是严格按照ITC…

«
»

内容本地化翻译公司现在可以使用自动配音来缓解增长的需求

对于其他流媒体巨头来说,关于流媒体用户从领先的OTT(OTT)平台上退出的消息可能是煤矿里的金丝雀(或者金矿,如果你愿意的话)。但对于一个充斥着项目的媒体本地化市场来说,在人才严重短缺的情况下,需求依然强劲:内容多,翻译、助理或配音员不足。

在过去的几年里,由Netflix主导的OTT市场的流媒体爆炸性增长了需求,因此也增加了内容支出。然而,翻译资源和相关人才的短缺已经影响到那些同时发布流媒体的地区,这是内容本地化者的一大痛点。

据AppTek营销高级副总裁凯尔·马多克(Kyle Maddock)说,鈥淒伊曼德是鈥檛 问题。人才是鈥 整合合适的工具来增加人才也是如此。有什么可以自动化的吗?能不能加紧研发,以便我们能更快地使用这项技术?这些是市场参与者目前正在考虑的一些事情。鈥

因此,内容本地化目前正在寻找最新一代改变游戏规则的技术,用于大规模的非娱乐、非OTT、视听市场。

在这方面,早期采用者已经在部署新技术,将新闻剪辑、用户生成的内容、企业视频、教育材料、健身视频、纪录片、低成本电影,甚至直接响应视频本地化,以立即扩大产品的全球覆盖范围。

正如马多克指出的,鈥淭这些新兴语言技术,在目前的状态下,可能更适用于一般用途的内容生产市场鈥 即使他们继续发展以满足高端市场更复杂的需求。鈥

据AppTek高级副总裁说,鈥淓合并本地化技术已经可以使用,当然可以减轻本地化工作流程的压力,而本地化工作流程中充斥着来自OTT和其他高级媒体服务的项目。鈥

马多克说,这些新技术也适用于高端市场,当有人在循环时。

6步自动配音流水线

在AppTek,如果不是因为螺旋式增长的需求,那些原本被视为前沿技术的领域(市场牵引力还有几年的时间),研发工作已经如火如荼地进行了一段时间。其中一个领域是自动配音。

该公司的研发团队一直致力于解决语音到语音(S2S)翻译这一复杂的跨学科研究问题,通过构建一条管道,增加一些功能,旨在产生与原始语音输入的语音特征相匹配的媒体输出。明确地说,自动配音是 Synonymous with the buzzwords should be sent to I dubbing and oice cloning Holmium

虽然有很多人工智能配音的例子(例如。,深赝品在这种情况下,嘴唇的运动会发生变化)和声音转换(一个人的声音被另一个人遮住),自动化一个完整的配音管道是一个更复杂和复杂的事情。

管道包括六个步骤

  1. 音频提取与预处理
  2. 语音识别与分割
  3. 说话人分组与特征提取
  4. 机器翻译
  5. 语音合成
  6. 制作最终视频

阿普特克鈥檚 语音翻译首席科学家马蒂亚迪甘吉解释说,鈥淭管道的输入是一个包含单个视频和单个音频流的常规视频文件。管道的输出是一个包含相同视频流的视频文件,添加了一个新的目标语言音频流。鈥

技术是如何工作的

自动配音从音频预处理、转录、分割和特征向量提取开始。

原始音频首先从视频源中提取。接下来,移除残余声音(例如,音乐、背景噪声)以提取语音特征,并在生成最终音频流时添加回来。这对于自动配音过程中稍后发生的扬声器语音自适应步骤特别重要。

一旦音频经过预处理,域自适应语音识别系统将生成每个单词开头和结尾的精确时间戳。

安排一个AppTek自动配音演示

Di Gangi说:“在AppTek,我们利用我们的媒体和娱乐ASR系统,该系统已经接受过大量广播数据的培训。”。为了通知ASR输出的独特术语(例如,魁地奇,哈利波特),还可以使用自定义词典和词典(如果有的话)。

迪甘吉补充道,鈥淎SR包括标点符号系统鈥 它以适当的标点段输出文本鈥 而说话人分片为每个片段分配说话人标签。输出被组合起来,形成结构良好、说话人分段的输入,用于后续的机器翻译步骤。鈥

当然,在特征向量提取之前,可以添加一个人工在环、后编辑步骤来完善片段级的转录和说话人的二级化,这是在合成目标语音时用于说话人自适应的目的。

接下来,一个领域自适应机器翻译(MT)系统,专门研究输出所需的语言类型,将转录的片段翻译成目标语言。

DiGangi指出:“这些机器翻译系统还需要通过额外的参数进行增强,以便对机器翻译输出中必须包含的特定功能进行复录。”。

AppTek的首席科学家列举了自动配音管道的机器翻译部分需要解决的几个问题,例如如何鈥

  • 使用前面的文本和说话人ID信息作为附加上下文,以便更好地自动翻译当前句子;
  • 在源语句和目标语言的自动翻译之间实现相似的字符序列长度,以实现等时性,这是一个关键的配音要求(换句话说,如何实现在与源语句相同的时间内以自然节奏发音的翻译);
  • 选择最佳的翻译长度要考虑到译文的全局约束,而不是一句话的局部约束,这样可以提高阅读体验;
  • 通过显式地模拟说话人的停顿来实现韵律意识(对所有类型的配音同步都至关重要)。

为了给翻译注入一些真实的语境,提高翻译质量,比如性别、语域、翻译长度等等,AppTek一直致力于使用元数据来通知机器翻译的输出,正如AppTek的机器翻译首席科学架构师Evgeny Matusov所说,接受采访时解释道 .

一个手动的后编辑机器翻译(PEMT)步骤可以再次应用来完善输出,然后再继续合成目标语音。在文本被翻译、分割并准备好发声之后,下一步就可以开始了。

一般的文本到语音(TTS)方法是在预先定义的一组语音上训练规则的、单说话人或多说话人模型,这些语音集可以用来生成合成语音。

一种更为复杂的方法被称为“零触发多扬声器TTS”,即构建能够模拟源音频中的声音的TTS模型,而无需对新扬声器上的模型进行微调。取而代之的是,从几秒钟的讲话中提取出的说话人特征作为合成过程的输入。。

TTS模型还必须能够精确地再现源语音的各个方面,例如说话速度和情绪。

根据AppTek的Di Gangi,“我们还可以控制声音的其他方面,比如音调和能量,这种控制可以通过 SSML标记,因此可以根据需要对TTS输出进行更正。鈥

Di Gangi进一步解释说,一旦合成音频准备就绪,从源中提取的剩余音频将与合成音频轨道合并,以生成目标语言的最终音频。如果需要的话,原版对话音轨也可以在背景中以较低的音量加入,就像联合国风格的画外音一样。

近瞬间S2S

那么整个自动配音过程需要多长时间?根据AppTek鈥檚 马多克,鈥淔或者是一个完全自动的过程,没有人在循环后编辑步骤,从开始到结束的持续时间甚至比视频短鈥檚 运行时间!鈥

AppTek高级副总裁补充道,鈥淭目前市场上使用的基于工作室的专业服务可能需要数周的口型配音和几天的配音时间。鈥

因此,这里概述的几乎即时的S2S交付为更多的视听产品、语言和地区打开了自动配音的应用程序。

AppTek的竞争优势在于它将所有这些技术都包含在一个堆栈中。此外,相关的科学团队负责监督和支持这一过程,并可以每天与客户合作。

正如首席科学家迪甘吉指出的,鈥淚不是吗鈥檛 很容易破解S2S,这是自然语言处理中最难解决的问题之一,通过使用筒仓式的第三方组件组合在一起形成S2S管道。


迪朗翻译如何保证翻译质量?

迪朗上海翻译公司是一家正规的上海认证翻译机构,迪朗翻译将质量看做是企业的生命,我们通过以下几方面来保证我们自始至终为客户提供着高质量的翻译服务: 项目资源不仅包括译员,还包括从事翻译校对、页面布局、质量控制、编辑和语料库采编和建立的翻译辅助人员,项目经理是整个翻译团队的负责人,负责项目小组的组建、协调和管控。我们的所有翻译都拥有全国翻译专业资格(水平)证书,同时都具备五年以上的翻译经验。全国翻译专业资格(水平)考试(China Accreditation Test for Translators and Interpreters – CATTI)是受国家人力资源和社会保障部委托,由中国外文出版发行事业局(China Foreign Languages Publishing Administration)负责实施与管理的一项职业资格考试,已经纳入国家职业资格证书制度,是一项在全国实行的、统一的、面向全社会的翻译专业资格(水平)认证,是对参试人员口译或笔译方面双语互译能力和水平的评价与认定。翻译专业资格(水平)考试开设多个语种,包括英、日、俄、德、法、西班牙、阿拉伯等语种,各语种分设四个级别。考试等级划分与专业能力如下:

1 资深翻译:
长期从事翻译工作,具有广博科学文化知识和国内领先水平的双语互译能力,能够解决翻译工作中的重大疑难问题,在理论和实践上对翻译事业的发展和人才培养作出重大贡献。
2 一级口译、笔译翻译:
具有较为丰富的科学文化知识和较高的双语互译能力,能胜任范围较广、难度较大的翻译工作,能够解决翻译工作中的疑难问题,能够担任重要国际会议的口译或译文定稿工作。
3 二级口译、笔译翻译:
具有一定的科学文化知识和良好的双语互译能力,能胜任一定范围、一定难度的翻译工作。
4 三级口译、笔译翻译:
具有基本的科学文化知识和一般的双语互译能力,能完成一般的翻译工作。
人事部翻译专业资格证书三级 人事部翻译专业资格证书二级

 

 

翻译语种