范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

222222222

  10月15至18日,2021年第十六届全国人机语音通讯学术会议(NCMMSC2021)在江苏徐州举行。作为我国人机语音通讯领域研究中最具有权威性的学术会议之一,NCMMSC受到国内语音领域广大专家、学者和科研工作者的关注。
  其中,百度语音团队对外重磅发布基于历史信息抽象的流式截断conformer建模技术——SMLTA2,解决了Transformer模型用于在线语音识别任务中面临的问题,引发瞩目。
  自2012年以来,百度语音识别技术一直不断深入探索、创新突破,引领着行业发展的技术路径。2018年,百度语音发布的Deep Peak 2模型突破了沿用十几年的传统模型,大幅提升各场景下识别准确率。2019年初,百度语音技术团队公布在线语音领域全球首创的流式多级的截断注意力模型SMLTA(Streaming Multi-Layer Truncated Attention), 相对准确率提升15%。如今,随着SMLTA2的发布,百度语音实现了在线语音识别历史上的又一次重大突破。
  百度语音识别技术发展路线图
  Transformer模型用于在线语音识别领域的三大障碍
  人工智能的终极目标是让机器具备人类智慧,帮助人类实现各种任务的分析和决策。近年来,随着深度学习技术的不断发展,特别是Transformer模型结构的提出,为通用人工智能技术的实现指出了一种可行的方向。OpenAI的研究人员根据Transformer模型的特点,提出了一种预训练语言模型(Generative Pre-trained Transformer,GPT)。通过不断提升模型的容量和数据的规模,GPT模型从GPT-1逐步迭代到GPT-3,模型的能力也在稳定提升。在特定任务上,GPT-3模型的性能已经接近甚至超过了人类的平均水平。Transformer模型在NLP领域的成功应用,显示出Transformer模型结构的建模潜力,激发了研究人员把该模型用于诸如语音识别和图像识别等领域的巨大热情。但是到目前为止,还没有看到Transformer结构在在线语音识别系统的成功应用。
  在线语音识别任务相比文本任务有其独有的特点。从输入数据的长度上看,文本数据的长度一般在几十到几百之间,而语音数据的长度经常是在一千帧以上。对于一些重要的长语音识别任务,音频数据的长度甚至达到了一万帧以上。区别于LSTM模型的逐帧递推机制,Transformer模型的核心采用self-attention(自相关)的机制。由于语音识别任务的语音长度远远长于文本任务的字数,使得以自相关操作为基础的Transformer模型在用于在线语音识别时,存在如下难以逾越的障碍:
  "计算爆炸"问题。由于Transformer模型的Encoder各层都需要做自相关。从理论上说,在中间语音识别结果需要实时展现的场合,这个自相关操作随着每一帧新的语音信息的输入,需要和全部历史输入的语音帧进行自相关运算。面对超长的音频数据,每次输入都循环往复的进行自相关运算,极大地消耗了系统的计算资源。
  "存储爆炸"问题。由于Transformer模型的Encoder的每一层都需要保留整句话的特征编码后,才能进行后续网络层中做自相关操作。为了把网络做的更深更大,通常会引入残差结构。在这种情况下,保留神经网络各层输入就成为训练和解码时候必须的要求。而随着网络层数的加深,网络隐层维度的增大以及语音长度的增加,对训练和解码时的显存消耗造成巨大压力。
  "焦点丢失"问题。超长的音频数据大大增加了Transformer模型的建模难度。区别于NLP任务,语音任务的特点是很短的声音信息夹杂在较长的背景噪音或者静音中。这些语音中的噪音或者静音虽然不包含语言信息,但是会干扰注意力机制,导致注意力难以聚焦到有效的包含语言信息的声音特征上,最终影响系统的建模精度。
  此外,在线语音识别服务还需要流式解码。也就是说在语音输入的同时就要启动音频解码,话音一落立刻就能拿到整句的识别结果。而且在说话的过程中,屏幕上实时显示语音识别的中间文字。如果等音频完全输入后才开始解码,会延长用户的等待时间,而且看不到输入的中间文字,严重影响用户的使用体验。
  百度于2019年初在业界首先提出的流式多级截断注意力SMLTA模型,成功解决了端到端注意力模型的流式建模问题。SMLTA1主要采用的是LSTM模型结构。LSTM模型的时序递推的方式造成了该模型在建模能力和训练效率上都弱于Transformer模型。但是,Transformer模型应用于在线流式语音识别任务时,需要同时解决流式解码和上述 "计算爆炸"、"存储爆炸"以及"焦点丢失"三大问题。
  百度语音新突破:基于历史信息抽象的流式截断conformer建模
  通过对Transformer模型的深入研究,百度的研究人员在SMLTA1的基础上,进一步提出了基于历史特征抽象的流式语音识别建模方法SMLTA2。SMLTA2模型不仅保留了SMLTA1流式、多级、截断的特点,还通过引入基于Attention的历史特征抽象以及从Decoder到Encoder各层的注意力机制,解决了Transformer模型用于在线语音识别任务中面临的问题。其核心结构和历史特征抽象的原理如下图所示。
  SMLTA2 模型结构和历史特征抽象原理
  由于卷积增强(Convolution Augmented)的Conformer模型同时具有Transformer模型的全局建模和卷积模型的局部建模的能力,SMLTA2采用Conformer模型作为其主要结构。从图中可以看到,SMLTA2首先根据CTC模型的尖峰信息对连续语音特征进行截断,然后在截断的特征片段上利用Conformer Encoder对输入特征逐层编码,最后使用Transformer Decoder得到相应的识别结果。在对当前建模单元编码时,历史的语音特征片段被逐层抽象成固定长度的特征向量,然后和当前的语音特征片段一起进行注意力建模。这里的历史特征抽象是指根据Decoder输出的隐含特征对当前语音特征片段的Encoder各层进行相关性建模。
  通过CTC特征截断和历史特征抽象的方式,SMLTA2在保证建模精度的同时,克服了传统Transformer模型在长音频识别上面临的"计算爆炸"和"存储爆炸"问题。并且通过流式动态截断的方式,把注意力缩小到一个合适的范围,进一步解决了Transformer模型在语音识别任务的"焦点丢失"问题。
  为了解决Transformer模型应用于流式语音识别任务的各种问题,其他研究学者采用对Encoder各层进行启发式的截断和抽象。Google的Transformer Transducer模型对Encoder的上下文限制了固定长度范围,可以看作在输入特征上进行加窗截断的方法。Facebook的记忆增广(Augmented Memory)方法把音频特征切分为等长的片段,然后通过平均池化等方法得到固定长度的向量。这种截断和抽象是先验进行的,最终的识别结果无法反馈信息给这种截断和抽象过程。而且在此基础上得到的特征向量只是一种数学上的简化,其本身并没有实际的物理含义。SMLTA2通过特征抽象得到的特征向量对应着一个输出的文字信息。这些特征向量拼接起来组成的历史特征向量,实际上形成了一种声学特征层面的语言模型,进而有效提升SMLTA2模型的建模能力。
  目前几乎所有的基于Encoder-Decoder结构的端到端模型在建模时,Encoder和Decoder之间的关系是Encoder的输出是Decoder的输入,Decoder的解码过程并不和Encoder内部各层的编码信息发生任何联系。Decoder只能在端到端联合建模的训练过程,通过误差传递的方式间接地影响Encoder的编码过程。尽管这种传统的Encoder-Decoder协同工作的方式更简单,但是却存在Decoder对Encoder内部各层信息的反馈和使用不够直接的问题。
  通过前文分析,Transformer模型应用于语音识别领域,必须对历史信息进行必要的截断和近似。如果不引入从Decoder到Encoder各层的反馈机制,而简单武断地对Encoder的各层信息进行截断或者近似,难免发生信息丢失,影响建模能力。SMLTA2通过Decoder到Encoder各层的注意力特征选择机制来引入反馈,使得最外层识别结果信息可以直接作用于编码器内部的每一层的编码过程,通过历史信息抽象充分提取有效特征信息,显著改善了Transformer模型从NLP领域应用到语音识别领域面临的各种问题。SMLTA2的这种全新的端到端建模方法,是对传统Encoder-Decoder结构的端到端建模的结构性创新。
  语音识别模型的迭代和工业化落地
  从基于 LSTM 和 CTC 的上下文无关音素组合建模Deep Peak 2到流式多级截断注意力SMLTA1,再到基于历史特征抽象的流式语音识别建模SMLTA2,百度一直坚持在语音识别模型上的创新迭代。
  多年来,百度语音不仅在技术路线上持续引领行业,还一直坚持在产品上可使用、让用户真正可体验。百度的上一代流式多级的截断注意力模型SMLTA1就成功上线语音输入法全线产品,服务中国数亿用户,是世界范围内已知的第一次大规模部署的用于在线语音输入的注意力模型。
  此次发布的SMLTA2依旧保持了流式识别的特点,具备工业产品落地的能力。目前在实验室内,模拟线上环境进行测试,SMLTA2在同等计算资源消耗的情况下,相对于上一代技术错误率降低大约12%。SMLTA2的提出,是百度在语音识别领域的又一技术突破,也是百度AI技术继续领跑行业的重要技术创新。期待SMLTA2的产品上线应用,实现语音识别准确率的再度提升,给用户带来全新的交互体验。

宋祖儿一袭白色长裙像白天鹅,看着好精致小白裙的魅力能够多大?很多人觉得这是女人一生一定要有的服装,不管是怎样的一种款式,在穿搭上都会体现出一种精致与时尚感,而且针对服装来说,小白裙是不可复刻的经典。就像宋祖儿的穿搭那样让你摆脱选择困难症的多用途运动鞋正式和休闲的界限越来越模糊,一双优质的运动鞋可以让你穿梭于多种场合,Givenchy的这双黑色运动鞋就能让你每天早上不再有选择困难症。这双鞋在鞋舌和鞋跟处装饰以鲜艳的橘黄蓝色块来让你纹身的故事是怎样的呢?我的纹身是一个船。我们寝室的资深纹身大师给我纹的,居然还是歪的。或多或少会有一些和别人与众不同的感觉。如果周围朋友要纹身的话,劝他想清楚再去纹,另外就是一定要告诉他找靠谱的纹身师,现在还有人穿手工编织的毛衣吗?有的,现在的手工毛衣价格都十分的贵,买不起了。记得有个小伙子辞职创业织毛衣成了网红,他的毛衣都上千元。对于工作忙碌的人来说,织毛衣费时耗力,已经不织了,但对于手工爱好者,还有很多作你对女人味的理解是怎样的,你的女性魅力值有几分?女人味,不同的人会对这个词有不同的理解,在你心中什么叫女人味呢?自己的女性魅力值达到百分之几呢?我觉得想要魅力值更高就是要在穿着搭配方面,然后就是多化妆,做美甲等,还有就是要在言行150作为一个南方妹纸身高远不如北方姑娘那么高挑,所以在穿搭上总是显高则高。一般来说身高不够鞋子来凑,不过150160小个子的学生党如果能从穿搭上入手的话,不仅显高而且秒变时尚达人哦。因刘亦菲携妈妈走机场,穿t恤廉价不出众,妈妈气质高贵像阔太刘亦菲是大家心目中的神仙姐姐,很多人都是看过他的仙剑奇侠传和神雕侠侣,感觉她整个人的演技特别好,而且身上的气质也会让人觉得仙气飘飘,这一次她是带着自己的妈妈出现在机场,可以看到刘亦时髦这个词还真有点意思时髦这个事儿还真有点意思时髦,是个褒义词,在中国人已经用了1000多年了,所谓时髦,说白了就是特别美丽洒脱典雅新颖流行,符合潮流的意思。表现在服饰方面比较多。依照群体意识,我们每个牛洋洋最新写真大片释出优雅唯美心动感爆棚近日,青年演员牛洋洋的一组极简时尚大片曝光,牛洋洋一身黑色紧身漏背装,气场十足,呈现沉静冷冽的一面,放大的面部特写也令画面冲击感十足。打破以往大众对她的看法,展现了女演员的多面魅力头发油了,你会怎么办?头发油了我会洗呀捂脸不过认真来说,嗯,对头发的问题,我感觉我也是经历了好多波折。嗯,上高中可能压力大,也可能是因熬夜,就一把一把地掉头发,掉到怀疑人生。当时洗头真的不敢用力,特别害腼腆的人拍照穿什么服装漂亮?人像拍摄题材中,人物的外形气质服装搭配情绪表达等,是人像视觉表达的重点。人物的气质是内在的,服装搭配是外在的,人物的气质类型决定穿什么类型的服装,服装的款式和色彩影响着人物气质的展
BigWelcome丨请查收来自伦敦艺术大学的热烈欢迎经历了不平凡的一年后,伦敦艺术大学即将迎来又一个崭新的开学季!UAL校园内的我们期待着同学们在秋季学期重返校园,期待着同学们以线上或线下的形式开启新学年。为了帮助同学们尽快适应UA坎伯韦尔艺术学院(附详细目录)坎伯韦尔艺术学院(CamberwellCollegeofArts)始建于100多年,具有百年求知和创新精神的优良传统。学院位于伦敦东南部的社区中心,是一所享誉世界的艺术设计学院,他UAL课程线上开放日伦敦传媒学院伦敦艺术大学(UAL)线上开放日来袭!!!伦敦传媒学院(LondonCollegeofCommunication)将于2021年10月开始为大家带来一系列课程线上开放日活动届时将有直播预告丨伦敦艺术大学为你送上全方位介绍世界排名TOP2欧洲最大的艺术类大学世界顶尖的教学研究水准艺术求学者向往的最高学府大师云集英才辈出这些金闪闪的标签都属于伦敦艺术大学(UAL)那么UAL到底是一所怎样的大学?师生们北京2022年冬奥会火的设计,细看都是文化10月20日上午,北京2022年冬奥会火种抵达北京,北京冬奥会火种欢迎仪式在奥林匹克塔隆重举行。工作人员用引火棒从火种灯引火,点燃北京冬奥会火炬。从火炬火种灯火种台的设计,处处都是UAL课程线上开放日Camberwell,ChelseaandWimbledon伦敦艺术大学(UAL)线上开放日十月来袭!我们将陆续公布活动时间坎伯韦尔艺术学院(CamberwellCollegeofArts)切尔西艺术学院(ChelseaCollegeofA重要通知丨伦敦艺术大学202122学年课程表即将公布从8月23日(星期一)开始,所有已经接受录取OFFER并已激活个人UAL邮箱的学生将陆续收到伦敦艺术大学发来的邮件,告诉同学们如何查看属于自己的课程表。随着开学日的临近,由于受到最怎么让女人幸福从细节着手宠她当公主怎么让女人幸福?女人想要的幸福其实很简单,只要男人细心一点,多考虑女人内心的感受,做一些对应的事情就能达到目的。下面就来说说你需要在意的小细节吧!怎么让女人感觉到幸福幸福的含义很深重要提醒UAL优先处理重新申请截止日期公布提醒对象已拿到202122学年伦敦艺术大学录取OFFER,因各种原因未能按期入学,及未申请到延期入学的同学。提醒内容针对已经有202122年伦敦艺术大学录取OFFER,但是未能入学男人永远不要和自己的女朋友讲大道理有这么一对情侣,小茹跟大明吃饭期间,小茹把自己的委屈一吐为快,说她室友的种种不是。例如小丽简直太脏了,我就没见她洗过衣服,夏天整个屋子都弥漫着她的臭脚味儿。说着小茹用胳膊肘捅大明你渴望爱情,可为什么越来越爱不起了?一场恋情,最美好的时光莫过于刚开始的那段时间,因为彼此的了解还不够深入,对方身上的新意还没有被发掘完。就像一杯香醇的美酒,就是闻一下都让人心旷神怡。可是随着时间的推移,过了恋情的甜