范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

击败OpenAI!谷歌公布20亿参数通用语音模型,支持100语种检测翻译

  智东西
  编译 | 吴菲凝
  编辑 | 李水青
  智东西3月7日报道,根据谷歌官网,谷歌的通用语音模型USM目前已实现升级,支持100多个语种内容的自动识别检测。
  去年11月,谷歌曾计划创建一个支持1000个语种的AI模型USM。谷歌将其描述为"最先进的通用语音模型",拥有20亿个参数,经过涵盖1200万小时的语音、280亿个句子和300多个语种数据集的预训练。
  USM的强大效果目前已在Youtube的字幕生成中展现出来,可自动翻译和检测如英语、汉语等主流语种,还能识别出阿萨姆语这种小众语种,可以说"精通方言"。
  根据谷歌博客,与OpenAI的大型通用语音模型Whisper相比,USM的数据训练时长更短,错误率更低。
  一、可自动检测翻译100+语种,USM面临两大挑战
  当微软和谷歌还在为谁家的AI聊天机器人更智能而争论不休时,我们需要清楚,语音模型的用途远不止于此。
  外媒The Verge的记者称,除了相传将在今年的I/O开发者大会中展示的20多款AI驱动产品之外,谷歌目前还在朝着更高目标迈进——构建一个支持1000种语种的机器学习模型。
  在周一发布的更新中,谷歌分享了更多有关USM的信息,谷歌称,这是构建支持1000种语言的通用语音模型的"关键第一步"。
  USM已被YouTube用于生成字幕,它还支持自动语音识别(ASR),可自动检测和翻译语言,不仅包括普通话、英语等广泛使用的语言,还包括阿姆哈拉语、宿务语、阿萨姆语等冷门语言。
  目前,谷歌称USM可支持检测100多个语种,并将作为构建更大的系统的"基础"。不过,这项技术似乎还有些遥远,谷歌在I/O开发者大会期间对阿拉伯语的错误表述就已证明。
  谷歌研究院科学家张宇(Yu Zhang)和软件工程师詹姆斯·秦(James Qin)在谷歌博客上发文称,为了实现USM这个雄心勃勃的目标,他们目前需要解决ASR面临的两个重大挑战。
  一是传统的学习方法的缺乏可扩展性。语音技术扩展到多语种的一个基本挑战是需要足够的数据来训练高质量的模型,使用传统方法时,需要手动将音频数据进行标记,既耗时又价格高昂,对于那些小众冷门的语种而言,也更难找到预先存在的来源收集。因此,研究院后续准备将传统学习方法转变为自我监督学习,利用纯音频来收集数据。
  二是在扩大语言覆盖范围和质量的同时,模型必须以计算效率更高的方法来改进。这就要求学习算法更加灵活、高效、泛化。这些算法需要使用来源广泛的数据,并在不用完全训练的情况下更新模型,再推广到新的语言中。
  二、三个步骤降低识别错误率,击败OpenAI
  据该团队发表的论文称,USM使用的是标准的编码器-解码器架构,其中解码器是CTC、RNN-T和LAS,编码器使用的是Conformer或卷积增强变换器。其中,Conformer使用的关键组件是Conformer块,由注意力模块、前馈模块和卷积模块组成,应用一系列Conformer块和投影层以最终嵌入。
  据论文显示,对于USM的训练共分为三个步骤。
  第一步是使用BEST-RQ来对涵盖数百种语种的语音音频进行自我监督学习,已经在多语言任务上展示了最先进的结果,在使用了大量的无监督音频数据后的证明结果是有效的。
  第二步需要使用多目标监督预训练来整合来自于其他文本数据的信息。该模型引入了一个额外的编码器模块来输入文本,并引入额外层来组合语音编码器和文本编码器的输出,并在未标记语音、标记语音和文本数据上联合训练模型。
  最后一步需要USM对下游任务进行微调,包括ASR(自动语音识别)和AST(自动语音翻译)。
  USM的整体培训渠道
  对于USM的有效性,团队通过Youtube Caption的多语言语音数据进行微调来验证。
  受监督的Youtube数据包括有73种语种,每个语种的数据不到3000小时。尽管监督的数据有限,但USM在73个语种当中实现了平均低于30%的单词容错率(WER),与当前内部最先进的模型相比降低了6%。与进行了近40万小时数据训练的大型模型Whisper相比,USM的错误率更低,它在18个语种中的解码错误率仅有32.7%,而Whisper有40%。
  在WER低于40%的情况下,USM在其支持的语言上优于Whisper
  在公开可用的数据上,与Whisper相比,USM在CORAAL(非裔美国人使用的英语)、SpeechStew和FLEURS这三个语言数据集上都显示出了更低的单词容错率。
  在ASR基准上比较USM(有或没有域内数据)和Whisper的结果。
  对于语音翻译,团队在CoVoST数据集上微调USM,在有限的监督数据上实现了最好的性能。为了评估模型性能的广度,他们根据资源可用性将CoVoST数据集中的语言分为高、中、低三类,并计算每个部分中的BLEU分数(机器翻译评价指标),根据最终展示出的结果,USM在所有细分市场上的表现都优于Whisper。
  他们认为,谷歌若想实现连接全球信息并使每个人都能自由访问的愿景,USM的开发将会是关键的一步,USM的基础模型框架和训练通道已经打下了一个基础,他们要做的就是在此基础上将语音模型扩展至1000种语言。
  结语:AI突破语言障碍,助全球打破信息茧房
  目前,USM已支持100多个语种,未来将持续扩展到1000多个,届时将会吸引到更大一部分用户进行体验,真正实现将信息分发到全球各个角落。
  信息时代,科技进步将会进一步帮助各个国家地区的语言和文化突破地域的限制,很大程度上解决信息茧房带来的困扰。

今年流行的烟管无痕裤,比阔腿裤百搭比鲨鱼裤显瘦,你有吗好多小姐妹担心自己的身材不如其他女生苗条,颜值没有其他人精致,所以在平时生活中就会把目光放在穿搭上,只要你学会了穿搭,就可以弥补你颜值或者是身材上的不足,像腿粗和腿型不好看的姐妹,2022仅剩100天清零整理更新累了就睡一觉,醒来继续微笑。作者洞见Leyla岁月匆匆,流光一瞬,年初心怀的憧憬与期盼,仿佛还在昨日一般。猛然间,2022年仅剩下100天了。回首来时的路,有过风光明媚,也有坎坷泥2022年绿汀文学社天天诗刊229期七律清秋文莫尚喜清晨静寂沐斜阳,陋室悠然笔墨凉。浅浅枝荷茎渐瘦,翩翩莲蕊子犹香。风吹红叶相思寄,雁破青天掠影长。秋染人间多少色,又撩岁月鬓添霜。七律咏秋文左书谔(青岛)桑田五谷挂金以前打扰了,以后不会了以前打扰了,以后不会了!如果我的关心是一种打扰如果,我的关心是多余,我的主动式打扰,我的微笑是讨好。那么,我退出便是。如果,我的主动在你那里变成了骚扰,我无动于衷便是。如果,我的关又见深秋,世事轮回一场,唯不是幕幕深情依然如芳中秋过后,又入深秋了。岁月流逝如水,那些来了的,走了的,握住的,丢失的,若隐若现,似彩排在眼前闪现又逝去。诗有情意,秋有画意,人间处处皆有情,逢花开花落,云开雾散,才尘埃落定。我有7080年代小学语文课本,看一张哭一张,看到小猫钓鱼时泪崩了那时候的课本现在看来依然很美!恍惚回到了四十年前的课堂上,闻到了新课本的油墨香,感受到了快要从记忆中消失的童年那些童年的时光再也回不去了,看到这些课本上熟悉的图片感觉如同隔了一个世新西兰全球存在感很低,比英国大也比英国富,但总是被人忽略纵观全球的发达国家,美国和英国名列前茅,因为美英是老牌的资本主义国家,在发达国家行列中,自然首屈一指。可是,另有一个国家,国土面积超过英国,经济上也比英国富有,却总是被人忽略。这个北京公布旅游行政处罚典型案例提示十一假期安全出游中新网北京9月23日电十一国庆假期临近,为进一步规范和优化首都旅游市场秩序,保护旅游者合法权益,北京市文化市场综合执法总队(简称总队)节前公布了一批旅游行政处罚典型案例,并作出案例凤阳看看小岗村参观完凤阳古城,已是夕阳西下。在凤阳县城汽车站乘长途汽车,到东边60多公里外的小岗村。车开前,司机告诉我们这些乘客这班车这已是末班车了。我明白,今晚我只能落宿小岗村了。在凤阳车站留世纪最危险的游乐园,骨折伤亡年年都有,为何还有人去?你玩过最刺激的游乐设施是什么?垂直过山车?蹦极?这些刺激的游乐设施固然刺激,但是他们都有防护措施保护着游客的安全。但有个游乐园你可能无法想象。它以危险是真为理念而建立,没有任何安全趁省内这个神仙海岛没火前,还不快去朋友们,要说我今年夏天的遗憾,大概就是没能去一次海岛吧。每每想到海岛,脑子里就会蹦出自己骑着电瓶车环岛疾驰的画面,感觉下一秒咸湿的海风就会扑在脸上,一个转弯眼前可能便是浩瀚无垠的大
市场预期LPR调降外资继续加仓,持股过年值得期待?随着地产支持政策接连祭出,年初又处于经济复苏的最初期,市场对于20日LPR(贷款市场报价利率)进一步调降的预期加强。与此同时,经济重启的预期继续吸引外资加仓,1月17日,北向资金流年后小麦价格是涨是跌?节后国内小麦行情展望摘要预计节后随着国内小麦购销逐步恢复,在终端需求难有明显改观的情况下,各级储备小麦轮出国家政策性小麦投放市场以及持粮主体销售库存粮源将导致流通市场粮源供给总量较为充足,国内麦价走势告别巨额奖金?信托人年终奖分化明显部分延迟发放,行业转型阵痛仍在随着春节脚步的临近,打工人最关注的话题便是年终奖了!在信托投资吸引力减弱业绩经营承压的形势下,信托打工人年终奖表现如何?对此,北京商报记者采访了多位信托业人士,试图得到答案。从调查冒险游戏改编剧最后的生还者获得HBO十年来收视率第二高首播HBO的最后的生还者(TheLastofUS)获得了自2010年以来的第二大首播,仅次于去年的龙之屋。据Deadline报道,周日在美国,有470万观众收看了该剧的第一集。我们仍在韩国恐怖游戏白色情人节2谎言之花Steam页面上线支持中文由韩国公司Rootnstudio开发发行的恐怖游戏白色情人节2谎言之花Steam页面现已上线,发售日期待定,页面显示支持中文,可加入愿望单。Steam商店页面白色情人节2谎言之花是V观财报由盈转亏!蒙娜丽莎2022年净利预降超200中新经纬1月18日电18日盘后,蒙娜丽莎发布2022年度业绩预告。预计2022年由盈转亏,亏损3。20亿元至4。60亿元,上年为盈利3。15亿元,同比下降201。64至246。103秒钟8个镜头,到现在张艺谋周星驰都在模仿他,他真的被低估了岁末交替之际,Sir并不感到轻松。就连期待过年的愉悦,也比之前减少了许多。毕竟,这冬天。是一直在说再见的冬天。前些天我们刚刚哀悼完顾嘉煇。紧接着就听到了导演何平去世的消息。接着,又在华为一次年终述职会上,任正非直接怒批高管还过个屁年!2016年底,在华为召开各部门的座谈会上,任正非听取了各个分管高管的发言之后,直接爆粗口还过个屁年!为什么平时看上去很儒雅的任正非直接在会上开骂呢?原来,华为部分高管在这次座谈会上春节菜单纷纷上线,沪郊游玩法推荐来了远离喧嚣,回归田园!春节假期,来一场沪郊游,是个不错的选择。所有人,首波沪郊游玩法现已上线,来看看宝山松江嘉定三区的推荐吧!宝山漫步古镇老街,探寻罗店年味小桥流水人家,江南小镇的古吉祥春秋航空率先恢复泰国定期客运航班1月18日,吉祥航空率先恢复上海浦东至泰国清迈普吉航线的定期国际客运航班运营。当天,春秋航空也复航了上海至普吉的航线。记者了解到,这些复航的航线上座率都超过95,甚至达到了97。1春节自驾游可以安排了!油价迎来今年首降1月17日晚,在南宁市北湖路一家加油站内,不少车辆在加油。南国早报记者卢盈摄根据国家成品油价格形成机制,结合近一段时期国际市场油价变化情况,国家发展改革委决定1月17日24时起下调