陪同口译

近年来,对于上海陪同口译(Escor…

论文翻译

如何确保论文翻译的专业性? 论…

视频翻译

为什么要翻译视频字幕翻译视频字幕使您…

翻译认证盖章

翻译认证盖章服务条款 尊敬的客户感…

网站本地化

迪朗上海翻译公司是一家专业的上海…

展会口译

展会口译服务简介:上海迪朗翻译公司是…

同声传译

迪朗(上海)翻译公司是严格按照ITC…

«
»

本地化用户体验:印地语音译与拼写变体

印地语,采用天城体书写,与英语并列为印度的两大官方语言。它不仅是印地语带的通用语言,还广泛流行于印度各地。2011年的人口普查数据显示,有高达3.4亿人将印地语视为母语。这种语言的广泛使用导致了拼写上的多样化,一些社区为贴合自身发音和用语习惯,对标准现代印地语进行了简化或变通。

当前,尽管印度政府已制定了标准现代印地语的拼写规范,但全球各地的印地语使用者在实际书写中仍会采用多种广受认可的拼写形式。

随着印度科技使用的急速增长,印地语用户倾向于采用更为高效的方式进行非正式书面交流。我们注意到,印地语手机用户在输入和编写信息时,希望能够同时运用天城体文字和拉丁字母书写形式的印地语单词,而界面也能根据需求同步展示这两种书写形式。

尽管存在官方的拉丁字母书写印地语系统,但在非正式场合下,印地语使用者在罗马化方面展现出更大的灵活性,这主要源于这种罗马化是基于语音的,且印度各地存在多样化的地区发音。

例如,在处理键盘等文本预测模型的自然语言处理(NLP)工具时,必须充分考虑这些拼写上的变体。为了提供更贴合用户需求的体验,这些工具需要更加真实地反映用户的交流方式。因此,我们迫切需要一套能够更精准地代表印地语使用者可能用于音译天城体词形的拼写数据。

为此,牛津语言(Oxford
Languages)研发了一项创新的音译数据功能,该功能能够全面呈现印地语单词所有潜在的拉丁拼写形式。例如,??????这个词就可以被音译为“kyonki”、“kyunki”或“kyuunki”。我们期望在数据解决方案中,能够以非层级结构的方式展示这些拼写变体,从而优化印地语键盘输入和科技写作体验。我们希望能呈现的变体涵盖多个方面,包括anusvara与半字母的拼写、呼格复数形式、nuqta的使用、完整/r/与半/r/:的差异,以及旧式、规范与现代拼写之间的对比。

我们针对印地语等具有丰富变体的语言开发这些词汇数据特征,旨在将其应用于书面自然语言处理和生成式人工智能应用中,以提升印地语母语使用者的整体体验。

在技术为受众打造更本土化解决方案的过程中,必须深入考量语言中的诸多细微差别。因此,在数据研发阶段,语言专家的参与显得至关重要。