WellSaid实验室与牛津语言合作,研发人工智能语音生成技术
牛津语言,隶属牛津大学出版社,荣幸地宣布与知名美国科技公司WellSaid Labs达成合作。此次合作旨在利用WellSaid Labs的人工智能技术,精细管理发音数据,从而简化人工智能语音生成的复杂性,并为内容创作者提供更为灵活的配音控制选项。
WellSaid Labs,一家备受推崇的人工智能语音平台,通过其文本到语音(TTS)产品,实现了大规模的人工智能语音生成。最近,WellSaid Labs推出了一项创新的重述系统,该系统允许用户根据个人偏好定制特定单词的发音,进而将文本转化为更为真实、人性化的声音。
这一创新系统的研发,旨在解决当前文本到语音翻译平台在用户体验方面所面临的挑战。正如牛津语言的一项案例研究所指出的,文本到语音平台的用户通常需要依赖标准化的发音指南,如国际音标(IPA)。为了提升用户体验,WellSaid Labs开发出了一套更为直观、易于操作的发音系统,并将其无缝集成到其深度学习的TTS模型中。
为了实现这一解决方案,我们需要一个覆盖广泛、发音准确的英语单词语言数据库。在这方面,牛津语言的发音数据集为WellSaid Labs的行业首创Respelling系统提供了强有力的支持。
WellSaid Labs在其博客公告中表示:“我们与全球领先的词典出版商牛津语言合作,超越了传统的单词转录方式,显著丰富了我们的训练数据语料库,并为每个单词提供了更为丰富的上下文信息。这一合作使我们的人工智能声音更加接近人类的自然发声。通过将WellSaid Labs的尖端技术与牛津语言的语言专业知识相结合,我们在人工智能语音生成领域取得了突破性的进展。”