范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

并行生成奇点临近!字节跳动GLAT斩获WMT大语种德英自动评估第一

  机器之心专栏
  机器之心编辑部
  在刚刚结束的国际机器翻译大赛(WMT2021)上,字节跳动 AI Lab 的火山翻译提交并行翻译系统 GLAT(Glancing Transformer),一举夺得了德语到英语方向机器翻译自动评估第一。这是并行翻译(非自回归)系统首次参加世界级的比赛,击败一众自回归翻译系统。并行翻译系统的崛起给自然语言生成技术的发展指明了新的方向。
  作为世界顶级的机器翻译比赛,WMT 大赛自 2006 年以来已经举办了 16 届,每年都会吸引来自世界各地的顶级企业、高校和科研机构参赛。历年参赛队伍来自微软、脸书、腾讯、阿里巴巴、百度、华为等。
  在 WMT 的各个翻译任务中,火山翻译团队挑战的德英翻译更是参赛队伍角逐的核心项目。在德语-英语翻译方向上,火山翻译团队仅使用了官方提供的数据(受限资源),成功摘得桂冠。
  引言
  历年的 WMT 比赛中,各个团队大多基于自左向右解码的自回归式生成模型(简称自回归式模型,例如 Transformer)开发自回归式翻译系统。
  相比于自回归式翻译系统自左向右的逐词输出(如下图 1 左边的例子),并行翻译系统则采用了更新颖的并行生成技术,在翻译的过程中同时输出所有的词(如图 1 右边的例子),从而可以获得数倍的翻译加速。
  图 1:自左向右生成(左)和并行生成(右)。
  可惜的是,尽管并行翻译系统在翻译速度上存在优势,但在之前的实践中其翻译质量相对于自回归式系统还落于下风。因此,并行生成仍在学术探索阶段,许多技术尚未成熟,实际应用更是寥寥无几。
  尽管困难重重,在火山翻译团队的技术攻坚下,其自研的 GLAT 模型最终成功击败了自回归式翻译系统,成为历史上首个夺得 WMT 冠军的并行翻译系统,展现出并行生成技术巨大的潜力。
  领先的自研并行生成技术
  在本次大赛中,火山翻译团队使用的并行生成技术完全基于自研的 Glancing Transformer 模型(GLAT)。GLAT 提出了一种为并行生成建模词之间依赖关系的有效训练方式,大幅提升了并行生成的效果。目前,GLAT 的 paper 已被 ACL2021 接收。 论文地址:https://arxiv.org/abs/2008.07905 项目地址:https://github.com/FLC777/GLAT
  具体地,GLAT 会先学习并行输出一些较为简单的语句片段,然后逐渐学习整句话的一次性并行生成。GLAT 的训练示例如下图 2 所示:
  图 2:GLAT 的训练示例。
  在训练中,GLAT 会进行两次解码。在第一次解码中,GLAT 将模型并行生成的结果和目标语句进行对比。根据第一次解码结果和目标语句的差异,GLAT 会决定目标词的采样数量,差异越大采样数量就越多。在第二次解码中,GLAT 将被采样的目标词的向量表示替换到解码器输入中,然后让模型利用新的解码器输入学习预测剩余的目标词。
  在图 2 的例子中,模型的翻译结果「travel to to a world」和目标语句「travel all over the world」仅有两个词在对应位置上相同。因此,GLAT 随机采样了词「over」作为解码器的输入来帮助训练。而随着模型在训练中能更好捕获目标词之间的依赖关系,生成结果与目标语句会更接近。所以在训练后期需要作为解码器输入的目标词数量越来越少,GLAT 会逐渐学习整个语句的并行生成。
  为了进一步提高翻译效果,团队在此基础上对模型结构和训练方式进行了各方面的优化,例如在模型中加入动态线性网络层组合(DLCL),利用多种形式的原始和蒸馏数据,分阶段训练等等。除此之外,通过结合多种结构的 Glancing Transformer 和改进的重排序技术,可以获得更出色的翻译结果。需要强调的是,模型在生成时不使用任何形式的顺序解码或者迭代式解码,只进行一次并行的解码,保持了翻译的高效性。
  除了在世界级大赛中夺冠,GLAT 在实际工业系统的应用中也展现出优势。GLAT 已经在火山翻译的部分语种上线,其并行的生成方式有效地加速了解码过程,缩短了翻译服务的响应时间。

所有工作已准备就绪,天舟发射倒计时3天,全球目光紧盯据北京晚报报道,中国航天部研制的长征七号运载飞船已完成了各项研制任务,并且已完成准备工作抵达了发射现场,后期将协同天舟三号,完成发射任务。如今距离发射只剩倒计时3天,自然也吸引了全航天员,欢迎回家地球之子漫步太空这是诗人的想象而航天员用脚步丈量抒写英雄的浪漫主义诗篇他们承载十四亿人的梦想举重若轻轻轻,链接宇宙轻轻,问候星辰享受静谧曼妙的超凡之美或许,你们会说自己很轻轻如尘埃人类褪毛简史01hr生命科学发展至今,其中的进化生物学和分子遗传学让我们终于明白了人类是如何由古猿演化而来,而今天的黑猩猩和大猩猩都是我们的远亲。可是,即便进化论有大量古人类化石的证据支撑,遗100年后的地球,会是什么样子?不是天堂就是地狱人类的存在,已经深刻改变了这颗星球的面貌。大概在上万年前,人类活动就已经导致许多动物灭绝,进入现代文明之后,人类的现代化城市建设,已经成为了地球最大的陆地活动,一百年前的人类,不会地球漂浮在宇宙中,而且不停地自转,为什么我们感觉不到头晕?地球是一颗行星,在太阳系中有八大行星,每一颗行星都在围绕着太阳公转,行星公转的同时也会飞快地自转,地球也是一样的,地球自转一圈的时间就是我们的一天,地球公转一圈的时间就是一年,地球中山大学天琴计划登上国际顶级期刊北京时间9月16日凌晨,国际最权威的天文刊物之一NatureAstronomy(自然天文)杂志刊登了中科院院士科技部引力波重点专项专家组组长天琴计划首席科学家中山大学校长罗俊教授联为什么是微生物统治了宇宙?在太阳系之外存在着某种生命形式。有专家认为,至少在距离太阳100光年以内围绕恒星运行的少数类地行星上生命是存在的。无论这些猜想是积极的还是消极的,其存在的直接证据将很快被发现,或许太空到底能有多恐怖?看看苏联宇航员的下场,回来时已无生命特征在北京时间2021年9月17日13时34分,我国的三位宇航员英雄,在完成了为期3个月的太空生活和作业,承载着神舟十二号飞船返回舱返回地球并在东风着陆场成功着陆。我们从视频画面上就可嫦娥五号返回舱被烧得几乎成了煤球,它在回来时经历了什么?人类对于天空的想象从文明诞生之初就没有停止过,远古文明壁画上的老鹰鸟类到神话故事传说,天上的众神再到近代莱特兄弟的飞行试验的成功进行。似乎天空绚丽的景色和神秘的面纱一直在吸引着人们万有引力与航天重点规律方法总结一。三种模型1匀速圆周运动模型无论是自然天体(如地球月亮)还是人造天体(如宇宙飞船人造卫星)都可看成质点,围绕中心天体(视为静止)做匀速圆周运动。2双星模型将两颗彼此距离较近的恒星神奇的奥陶纪古生物化石一块化石板上聚集了3种三叶虫和海蛇尾如上图所示三叶虫和海蛇尾聚集在同一块化石上。海洋曾经充满了三叶虫,这一种古老的动物,是最早在化石记录中发现的具有坚硬部分的生物。一块巨大的化石板上保存着许多3种三叶虫和海蛇尾的自然