论文翻译

如何确保论文翻译的专业性? 论…

翻译认证盖章

翻译认证盖章服务条款 尊敬的客户感谢…

展会口译

展会口译服务简介:上海迪朗翻译公司是…

视频翻译

为什么要翻译视频字幕翻译视频字幕使您…

双语主持

迪朗上海翻译是一家专业的上海双语主持…

同声传译

迪朗(上海)翻译公司是严格按照ITC…

«
»

伟大的语言翻译模型:谷歌的掌上电脑

2022年4月4日,谷歌公布了它的Pathways语言模型(PaLM)拥有5400亿个参数,PaLM继续保持着构建更大语言模型的大技术趋势。

PaLM只是比微软/英伟达稍大一点威震天图灵NLG,几乎是深渊地鼠而且比开放式人工智能要大得多GPT-3(1750亿个参数)。

大型语言模型(llm)已经展示了它们在各种各样的任务中可以做什么。推动这种竞争升级的问题是:语言模型会随着规模的扩大而不断改进吗?

广告

如果你想试试看,这是LLM的配方。

成分

要按照Google的方法创建LLM,需要7800亿个语言片段

  • 社交媒体对话
  • 网页
  • 代码(预过滤,主要使用Java、HTML、JavaScript的混合)
  • 维基百科
  • 新闻

按50%、27%、13%、5%、4%和1%的比例混合。

方向

1.准备好你的装备。以6144个设计用于机器学习的计算机芯片为例。
2.将芯片按蜂巢模式排列,形成“豆荚”重复。
3.选择并应用变压器学习模式
4.在豆荚中添加配料。
5、工艺彻底。(小贴士:先关掉其他电器。)
6.继续折叠原料,允许在豆荚内和豆荚之间进行平行加工。
7.你的变形金刚会仔细观察成分并决定它们之间的关系;然后将这些关系描述为数字(参数)。
8.至少有5400亿个参数时停止。

等你吃完了,盘子!您的大型语言模型现在可以理解和生成语言了。

2022 Language Industry Market Report Cover

斯拉特2022语言产业市场报告

数据和研究,SLATOR报告
100页旗舰报告市场规模,买方细分市场,竞争格局,销售和营销洞察力,语言技术等。
$ EIGHT HUNDRED AND EIGHTY立即购买

技术挑战

缩放手掌大小的模型是一项不小的壮举。谷歌使用其专有的机器学习芯片( TPU)连接到超级计算机上。一个pod每秒可以产生一个exaflop的计算能力。

从长远来看,如果您想匹配一个exaflop在一秒钟内可以完成的任务,则需要每秒执行一次计算-for310亿年 .

谷歌的研究人员使用了它现在的默认值变压器机器学习体系结构路径,这是一个新的系统,它可以并行地协调多个pod的数据处理,从而提高培训效率。

谷歌的长期目标视野是要创建大型的、多人才的模型,以便在专业任务之间轻松切换。例如,这样一个模型可以在诊断疾病、预测洪水如何流过地形或翻译一首诗之前下一盘棋。

SlatorCon Remote June 2022 | Super Early Bird $98

SlatorCon Remote 2022年6月|超级早起鸟98美元

一个丰富的在线会议,汇集了我们的研究和行业领袖网络。

立即注册

作秀者

那么,PaLM的表现如何?谷歌的研究人员在典型的语言任务上测试了这个模型(例如,回答问题,在句子中填充缺失的单词)。他们还想探索可能的前沿,给模型一组150个特别具有挑战性的任务大板凳(或超越模仿游戏基准数据集)。

包含的任务

  • 区分字面句和隐喻句;
  • 区分因果关系;
  • 确定一篇文章是否是一个笑话;和
  • 寻找加强或削弱逻辑论点的陈述。

研究人员专注于“少镜头学习”(相对于零射击)也就是说,模型在特定任务上的表现如何,即使它接受过特定任务的“成分”培训仅向PaLM提供了少量(“少数”)与任务相关的示例(“快照”)。

根据Google的结果:在标准任务中,PaLM在几乎所有情况下都比以前的大型模型做得更好。在困难的任务上,PaLM取得了突破性的能力。

例如,该模型可以查找同义词、区分因果关系、解释笑话以及根据表情符号描述猜测电影标题(用例:Deadpool billboard)。

Slator 2021 Data-for-AI Market Report

人工智能市场报告的Slator 2021数据

数据和研究,SLATOR报告
44页关于LSP如何进入人工智能数据即服务的规模。市场概述、AI用例、平台、案例研究、销售见解。
$ THREE HUNDRED AND EIGHTY立即购买

谷歌在推理方面也取得了新的进展鈥 数学和常识鈥 在一个叫做鈥思维链提示,模型被诱导用一系列短句回答问题。

谷歌说,在解决这些任务的过程中,手掌比一般人做得好 .

此外,当根据PaLM的规模来衡量PaLM的业绩时,谷歌得出的结论是“规模带来的业绩提升尚未停滞”换言之,语言模型随着规模的扩大可能会变得更好。

边上翻译

顺便说一句,PaLM也非常擅长机器翻译和其他多语言任务。

虽然大多数训练数据(78%)是用英语编写的(其余数据由100多种不同的语言组成),而且并行数据没有明确包括在内,但是PaLM与专门的机器翻译模型的性能相当,至少对于包括英语的语言对来说。

在它的纸张,谷歌暗示未来的模型将以更大比例的多语种数据为基础进行训练。

LocJobs.com I Recruit Talent. Find Jobs

本地作业是一个新的语言行业人才中心,在这里求职者可以获得新的机会,雇主也可以在翻译和本地化行业找到最合格的专业人才。立即浏览新工作 .

洛克乔布斯。我招募人才。找工作

评审团

对于PaLM的反应,以及对大科技公司关于LLM的声明,反应不一。

倍力能 首席执行官埃利奥特·特纳,推特, 鈥淭谷歌新推出的540B参数语言模型(PaLM)令人刮目相看。它比鈥榓普通人鈥 150个不同的认知任务。如果模型缩放保持不变,则为50鈥 100万亿个参数(比这个模型大100倍)应该超过鈥榖est人类鈥 .鈥

优优步Yannic杀手也很热情地说,鈥淚t鈥檚 可以说,这些模型正成为瑞士军刀的自然语言处理任务。鈥

其他人的语气更为疲惫。“其他人每周都会因为新的人工智能突破而感到精疲力尽吗?”推特 苏米特·奇纳拉元人工智能。鈥淭想跟上,但它跑得太快了。鈥

尝试联合创始人兼首席技术官格里戈里?萨普诺夫(Grigory Sapunov)告诉Slator,大型车型的趋势可能会持续一段时间。他补充说:“我们发现,增加模型尺寸可以提供更多的功能,其中有些功能是无法预先预测的。因此,值得探索前沿,以了解什么是可能的。”。

然而,Sapunov和一些权威人士指出,尺寸并不是任何模型中最重要的一个方面。研究人员 深渊例如,他的Chinchilla发现训练数据集的相对大小同样重要。适应也证明了良好的性能是可能的更小、优化的模型 .

那么大型模型真的有必要吗?不是根据朱利安·西蒙属于拥抱的脸,一家开源的NLP公司。鈥淎我对威震天图灵NLG 530B和下一个要来的野兽感到兴奋吗?不,我认为(相对较小的)基准改进值得增加成本、复杂性和碳足迹吗?不。鈥

Pro Guide: Language Operations Product

专业指南:语言操作

数据和研究,SLATOR报告
蓬勃发展的LSP如何构建运营、国际化规模、管理供应链、执行项目管理和降低风险。
$ FOUR HUNDRED AND NINETY立即购买

科学界也对谷歌决定不发布PaLM模型或遵循机器学习表示怀疑再现性检查表

强壮。人工智能是加里·马库斯推特, 鈥淭他的一周似乎是人工智能的胜利,但是鈥檚 实际上是退后一步。方法和错误的稀疏披露。仅限于轶事数据。采摘樱桃。没有进入科学界的机会。鈥

神经学家内森·惠特莫尔插嘴说, 鈥淲如果他们鈥檙e从未以可以广泛使用/研究的方式发布过?鈥

圣达菲研究所的梅勒妮·米切尔教授在一份研究报告中解释了法学硕士与人类智力的关系twitter线程. 鈥淰令人印象深刻鈥 但她说,鈥淚 不会把他们误认为是向一般智力的进步。鈥

然而,大型语言模型可以作为一系列语言服务的基础,帮助扩展内容任务,例如用正确的语气重写句子,或生成有用的摘要。

创业公司 抄袭和 其他人使用LLMs作为其文本生成服务的基础。在这方面,打算鈥檚 萨普诺夫指出,鈥淭未来肯定是光明的,许多新产品和新服务将会出现。鈥


迪朗翻译如何保证翻译质量?

迪朗上海翻译公司是一家正规的上海认证翻译机构,迪朗翻译将质量看做是企业的生命,我们通过以下几方面来保证我们自始至终为客户提供着高质量的翻译服务: 项目资源不仅包括译员,还包括从事翻译校对、页面布局、质量控制、编辑和语料库采编和建立的翻译辅助人员,项目经理是整个翻译团队的负责人,负责项目小组的组建、协调和管控。我们的所有翻译都拥有全国翻译专业资格(水平)证书,同时都具备五年以上的翻译经验。全国翻译专业资格(水平)考试(China Accreditation Test for Translators and Interpreters – CATTI)是受国家人力资源和社会保障部委托,由中国外文出版发行事业局(China Foreign Languages Publishing Administration)负责实施与管理的一项职业资格考试,已经纳入国家职业资格证书制度,是一项在全国实行的、统一的、面向全社会的翻译专业资格(水平)认证,是对参试人员口译或笔译方面双语互译能力和水平的评价与认定。翻译专业资格(水平)考试开设多个语种,包括英、日、俄、德、法、西班牙、阿拉伯等语种,各语种分设四个级别。考试等级划分与专业能力如下:

1 资深翻译:
长期从事翻译工作,具有广博科学文化知识和国内领先水平的双语互译能力,能够解决翻译工作中的重大疑难问题,在理论和实践上对翻译事业的发展和人才培养作出重大贡献。
2 一级口译、笔译翻译:
具有较为丰富的科学文化知识和较高的双语互译能力,能胜任范围较广、难度较大的翻译工作,能够解决翻译工作中的疑难问题,能够担任重要国际会议的口译或译文定稿工作。
3 二级口译、笔译翻译:
具有一定的科学文化知识和良好的双语互译能力,能胜任一定范围、一定难度的翻译工作。
4 三级口译、笔译翻译:
具有基本的科学文化知识和一般的双语互译能力,能完成一般的翻译工作。
人事部翻译专业资格证书三级 人事部翻译专业资格证书二级

 

 

翻译语种