德国人工智能研究中心(DFKI)正在支持人类语言项目,这是一项长期和大规模的欧洲研究,开发和创新项目,其雄心勃勃的科学目标是到2030年深度自然语言理解。
预计自然语言处理(NLP)的进展将能够解决欧洲多语言设置的诸多挑战。因此,该项目旨在成为欧盟旗舰项目,这是一项科学驱动的研究计划,运行时间约为10年,总预算约为10亿欧元。
根据欧盟网站,未来与新兴(FET)旗舰项目汇集了大量研究机构,不能由一个委员会或单一成员国承担。
DFKI高级研究员Georg Rehm博士鼓励欧盟各组织为宣传提供支持信。
“发起这种类型和范围的人类语言项目 – 大规模和长期 – 的想法是几年前在欧洲议会欧洲多语种和语言平等研讨会上诞生的,”Rehm告诉Slator。
“那时我们刚刚发布了META-NET白皮书系列的主要发现,即21种欧洲语言面临数字灭绝的危险。这意味着超过20种欧洲语言,大多数扬声器数量较少的语言,无法在线完全使用。并非所有服务都以这些语言提供,并且并非所有服务都能够在内部处理这些语言的内容,“他解释说。
不幸的结局将是我们所谓的“数字语言灭绝”
这意味着支持的语言远远少于使用更多发言者的语言,例如马耳他语,立陶宛语或冰岛语,它们将在线使用更大的语言,英语就是最好的例子。
“不幸的结局将是我们所谓的’数字语言灭绝’,”他进一步解释道。
未来证明我们所有的语言
Rehm澄清说,不仅DFKI正在推动人类语言项目,而且还有许多不同的利益相关者 – 从研究中心到大学,再到受影响语言社区的成员,翻译公司以及越来越大的公司。
“所有这些利益相关者不仅有兴趣实现我们的关键科学目标,到2030年深度自然语言理解,尤其是提供平衡的技术基础,以便我们能够在未来证明我们所有的语言,并确保我们可以在网上使用它们很多年,“他说。
到目前为止,他表示最近发布的关于欧盟项目DFKI的支持信的呼吁得到了前所未有的热情。
“真的很棒。这些信件一直在涌入!“他说。
一个项目成为欧盟FET旗舰项目需要什么?雷姆说,需要政治意愿来推动这样一个大型项目。布鲁塞尔的政治家和行政人员需要确信,这种规模的投资对欧洲社会,欧洲工业和欧洲研究都有意义。
“根据我们于2018年2月20日提交的提案,我们正试图进行预备项目。该准备项目的目标是与整个社区共同开发欧盟旗舰项目的关键组成部分:研究路线图,治理结构,统一愿景,整体设置,“他说。
真的很棒。这些信件一直在涌入!
毫无疑问,这是一个长期的过程。 Rehm表示,DFKI的职责是协调这个准备项目,并确保该联盟提供一个成熟的,经过深思熟虑的,可持续的欧盟旗舰概念,让整个社区赞同并支持。
雄心勃勃的科学目标
Rehm解释说,通过NLP,研究人员可以识别命名实体,汇总文档,并将用一种语言编写的文本翻译成另一种语言。但是,在一天结束时,它仍然只是简单的处理。
“典型的NLP管道或系统缺乏的是对语言的真实,深刻的理解。这不是一个新概念,自然语言理解的概念已经存在了几十年。我们相信,我们的领域现在能够成功地解决下一步,从简单的处理到对人类语言的实际理解,“他说。
“如果我们能够实现这一突破,那么由此产生的语言技术将在大幅提高准确性,覆盖范围,稳健性和质量方面改变游戏规则。这就是我们想要带来的,“他强调说。