范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

Meta为ARVR宣布实时语音语言翻译计划基于AI的通用语言翻译器

  ( 映维网Nweon 2022年02月24日 )Facebook、Instagram、WhatsApp和VR社交平台Horizon的母公司Meta日前宣布了一个雄心勃勃的全新AI研究项目:创建一个适用于"世界每个人"的通用语言翻译器。Meta首席执行官马克·扎克伯格表示:"用任何语言来与任何人交流的能力是一种梦寐以求的超能力,而人工智能将在我们的有生之年实现这一点。"
  Meta日前举办了一个名为"Meta AI: Inside the Lab"的人工智能实验室揭秘活动。除了演示人工智能团队所取得的最新突破外,Meta同时希望进一步说明人工智能将如何赋能公司的元宇宙未来。
  对于前述的通用语言翻译器计划,Meta撰文进行了详细的介绍,下面是映维网的具体整理:
  对于母语为英文、中文或西班牙文等的不同人士,今天的应用程序和网络工具似乎已经提供了我们所需要的翻译技术。但目前依然数十亿人排除在外,他们无法轻松访问互联网的信息,同时无法用母语与大多数网络世界联系。今天的机器翻译(Machine Translation;MT)系统正在迅速进化,但它们严重依赖于从大量文本数据中学习,所以通常不适用于低资源语言(即缺乏训练数据的语言),以及没有标准化写作系统的语言。
  消除语言障碍将是一项意义深远的工作:它将能帮助数十亿人以自己的母语或首选语言获取网络海洋的信息。机器翻译的进步不仅会帮助不懂当今主导互联网的语言的人士,它们将从根本上改变人们联系和分享想法的方式。
  请想象一下,操着不同语言的人士能够通过电话、手表或眼镜实时相互交流,或者能够自由以自己喜欢的语言访问网络的多媒体内容。在不久的将来,当虚拟现实和增强现实等新兴技术将数字世界和物理世界结合在一起时,翻译工具将能帮助你与任何人交流,并在任何地方进行日常活动,例如举办读书俱乐部或合作开展工作项目等等。
  所以,Meta AI日前宣布了一项旨在构建支持世界大多数语言的机器翻译工具的长期努力。这包括两个新项目: 第一个是No Language Left Behind(不落下任何语言)。团队正在构建一个可以从较少示例语言中学习的全新高级人工智能模型,并将其用于实现数百种语言的专家级翻译,例如阿斯图里安语,卢甘达语和乌尔都语。 第二个是Universal Speech Translator(通用语言翻译)。团队正在设计新的方法来实时将一种语言的语音翻译成另一种语言,从而支持没有标准书写系统的语言,以及既有书面语言又有口头语言的语言。
  要为全世界所有人提供真正通用的翻译工具需要大量的努力。但Meta认为,这里描述的一切是向前迈出的重要一步。团队进一步指出,未来将分享开源相关的代码和模型细节。通过借助社区的力量,我们将能更接近实现这一重要目标。
  1. 翻译每一种语言的挑战
  当今的人工智能翻译系统并不是为了服务于世界各地使用的数千种语言,同时不是为了提供实时的语音到语音翻译。为了真正服务于每一个人,机器翻译研究业界需要克服三个重要挑战: 我们需要获取更多语言的更多训练数据,并找到利用现有数据的新方法,从而克服数据匮乏的问题。 我们需要克服随着模型向服务更多语言的方向发展而出现的建模挑战。 我们需要找到新的方法来评估和改进结果。
  数据匮乏依然是跨更多语言扩展翻译工具的最大障碍之一。文本翻译的机器翻译系统通常依赖于从数百万个句子的注释数据中学习。所以,能够进行高质量翻译的机器翻译系统目前只为少数主导网络的语言开发。扩展到其他语言意味着为缺少网络存在感的语言寻找一种获取和使用训练示例的方法。
  对于直接的语音到语音翻译,获取数据的挑战更为严峻。大多数语音机器翻译系统使用文本作为中间步骤,这意味着语音首先转换为文本,然后翻译为目标语言中的文本,最后再将其输入到文本到语音系统以生成音频。所以语音对语音的翻译依赖于文本,从而限制了其效率,使其难以扩展到主要是口语的语言。
  直接语音到语音翻译模型可以为没有标准化写作系统的语言进行翻译。这种基于语音的方法可以带来更快速、更高效的翻译系统,因为它们不需要额外的步骤。
  除了需要数千种语言的合适训练数据外,今天的机器翻译系统设计根本不能满足全球所有人的需求。大多数机器翻译系统都是双语,这意味着每个语言对都是一个单独的模式,例如日英语-俄语或日语-西班牙语。这种方法很难扩展到几十个语言对,更不用说全世界范围内的所有语言。想象一下,从泰语言,老挝语,再到尼泊尔语,每种组合都需要创建和维护数千种不同的模型。
  一系列的专家建议多语言系统会有所帮助。但要将多种语言整合到一个高效、高性能、能够代表所有语言的多语言模型中非常困难。
  实时语音对语音机器翻译模型面临一系列与基于文本的模型相同的挑战,并且需要克服延迟问题,然后才能有效地用于实现实时翻译。
  主要的挑战基于这样一个事实:一个句子可以在不同的语言中以不同的语序表达。即便是专业的同声传译员都会落后于原始演讲约三秒中。例如,德语"Ich möchte alle Sprachen übersetzen"和对等的西班牙语"Quisiera traducir todos los idiomas"。两者的英文都是"I would like to translate all languages(我想翻译所有的语言)。"相较于西班牙语和英语(词序相似),从德语到英语的实时翻译将更具挑战性,因为对应于英语动词"translate(翻译)"的德语动词"übersetzen(翻译)"出现在句子的末尾。
  最后,随着扩展到越来越多的语言,我们需要开发新的方法来评估机器翻译模型产生的结果。业界已经有资源来评估从英语到俄语的翻译质量,但从阿姆哈拉语到哈萨克语呢?
  随着我们扩大机器翻译模型可以翻译的语言数量,我们同时必须开发新的方法来训练数据和测量结果。除了评估机器翻译系统的准确性外,确保负责人地翻译负责任同样重要。我们需要确保机器翻译系统保持文化敏感性,不制造或加剧偏见。
  2. 训练低资源和直接语音翻译系统
  为了实现低资源语言的翻译,并为未来更多语言的翻译创建构建模块,Meta正在扩展自动数据集创建技术。其中一种技术是开源工具包LASER,它现在包含了用28种不同脚本编写的125多种语言。
  LASER可以将各种语言的句子转换成单一的多语言表达。然后,团队使用大规模多语言相似性搜索来识别具有相似表示的句子,即在不同语言中可能具有相同含义的句子。Meta已经利用LASET开发了在互联网中寻找平行文本的ccMatrix和ccAligned。由于低资源语言几乎没有可用的数据,团队创建了一种新的teacher-student训练方法,以便LASER能够专注于特定的语言亚组,并用更小的数据集进行学习。这使得LASER能够跨语言大规模有效运行。随着团队不断改进和扩展语言,并最终支持每种具有书写系统的语言,任何进步都将能帮助我们覆盖更多的语言。
  Meta最近已经将LASER扩展成支持语音。:通过在同一个多语言空间中构建语音和文本的表示,其能够在一种语言的语音和另一种语言的文本之间提取翻译,甚至可以直接进行语音到语音的翻译。通过这种方法,团队已经识别了近1400小时的法语、德语、西班牙语和英语对齐语音。
  文本数据非常重要,但不足以构建满足所有人需求的翻译工具。语音翻译基准数据以前可用于少数几种语言,所以团队创建了: CoVoST 2:涵盖22种语言和36个不同资源条件的语言方向 VoxPopuli:包含23种语言的40万小时语音,可用于语音识别和语音翻译等语音应用的大规模半监督和自监督学习。
  3. 构建跨多种语言和不同模式的模型
  除了为机器翻译系统的训练提供更多数据,并将其提供给其他研究人员之外,Meta同时在努力提高模型的能力,从而能够处理更广泛语言之间的翻译。如今,机器翻译系统通常在单一模态中工作。如果模型太小,无法代表多种语言,其性能可能会受到影响,从而导致文本和语音翻译的不准确。建模方面的创新将帮助我们创造这样一个未来:翻译将能快速、无缝地支持多种语言的不同模式,例如语音到文本,文本到语音,文本到文本或语音到语音。
  为了提高机器翻译模型的性能,Meta投入巨资创建了能够在大容量情况下高效训练的模型。为了将基于文本的机器翻译扩展到101种语言,团队创建了第一个非以英语为中心的多语言文本翻译系统。
  双语系统通常是先从源语言翻译成英语,然后再从英语翻译成目标语言。为了令系统更高效、更高质量,团队取消了英语作为媒介,这样语言就可以直接翻译成其他语言,无需通过英语。当然,尽管消除英语提高了模型的容量,但多语言模型无法达到定制双语系统的质量水平。然而,随着性能的提升,Meta的多语言翻译系统赢得了Workshop on Machine Translation competition,甚至超过最好的双语模特。
  Meta的目标是提高技术的包容性:它应该支持书面语言和没有标准书写系统的语言。考虑到这一点,团队正在开发一个语音到语音,不依赖于在推理过程中生成中间文本表示的翻译系统。这种方法已证明比传统的级联系统更快。凭借更高的效率和更简单的架构,直接语音翻译可以为未来的设备开启实时翻译。最后,为了创建能够保留每个人讲话中的表达能力和特点的口语翻译,团队正在努力在生成的音频翻译中包括输入音频的特定方面,例如语调。
  4. 衡量数百种语言的成功
  开发能够在多种语言之间转换的模型带来了一个重要的问题:如何确定是否开发出了一个更好的模型呢?评估一个大规模、多语言模型的性能是一件棘手的事情,尤其是因为它要求我们具备模型所涵盖的所有语言的专业知识。这是一项耗时、资源密集且往往不切实际的挑战。
  针对这一点,Meta开发了第一个涵盖101种语言的多语言翻译评估数据集 FLORES-101,以便研究人员能够快速测试和改进多语言翻译模型。与现有的数据集不同,FLORES-101允许研究人员通过任何语言方向量化系统的性能,不仅仅只是翻译成英语和从英语翻译成其他语言。对于操着几十种官方语言的全球范围而言,这将能够创建满足重要现实世界需求的翻译系统。
  利用FLORES-101,Meta正在与人工智能研究业界合作,并期待着继续将FLORES扩展到数百种语言。
  Meta进一步指出,未来将致力于负责任地开展这项工作。团队正在与语言学家合作,以理解创造准确数据集所面临的挑战。团队同时与评估人员网络合作,以确保翻译的准确性。这家公司表示,实现长期的翻译目标不仅需要人工智能方面的专业知识,同时需要来自世界各地的众多专家、研究人员和个人的持续投入。
  5. 未来
  如果No Language Left Behind(不落下任何语言)和Universal Speech Translator能够成功,再加上机器翻译研究业界的努力,这将能以前所未有的方式融合数字世界和物理世界。
  Meta最后总结道:"在我们努力建设一个更包容、更互联的世界时,更重要的是要打破现有的信息和机会障碍,允许人们能够使用自己所选择的语言。"

吴亦凡被拘能否触及流量经济的核心?作者杨丹旭中国官媒在警方通报后,第一时间密集发声。北京师范大学政府管理研究院院长唐任伍指出,娱乐圈一些乱象已突破伦理道德和法律底线,吴亦凡案受舆论关注后,执法机关快速侦查公之于众,日本单日新病例首次超9000例周三,日本全国单日新增冠病病例首次超9000起。虽然人们警觉性进一步提高了,东京人搭地铁大多戴口罩。德尔塔毒株肆虐下,疫情仍在迅速蔓延。东京单日新增病例也首次达3000起以上,东京新加坡接种率9月达到八成后边境将有序重开作者李思敏新加坡的全国疫苗接种率在9月份达到八成后会逐步重开边境,完成接种者回新加坡时的居家通知可缩短至七天,一些人能以检测取代居家通知。新加坡联合领导抗疫跨部门工作小组的财政部长辉瑞总裁施打第三针加强剂足以抵御德尔塔毒株辉瑞总裁布尔拉周三引述研究结果指,人们在施打第三针加强剂情况下,有信心抵御德尔塔变种病毒。(路透社)(华盛顿综合电)辉瑞公司总裁布尔拉周三引述最新研究结果指出,完全接种两剂辉瑞冠病新加坡四旬男子楼梯间欲性侵15岁少年被警察当场抓获文罗妙婷两名警察接获报案,指楼梯间有可疑人物,前往调查,在踹开楼梯间的门时,见一名少年和男子都拉下了裤子。男子与少年惊慌闪避,忙着穿好裤子,当男子被警察问话时,他答非所问,只反问你韩国年轻独居人口为何一年暴增95万?韩国统计厅2日发布的2020年人口住房调查显示,去年独居人口共计664万3000人,比前一年增加8。1,占家庭总户数的31。7,从年龄层看,20岁至39岁独居人口的增加趋势最明显。相信是全球出生最轻存活者住院13个月早产儿回家了视频加载中作者黄贝盈14个月大的早产儿郭玉媗出生时体重仅212克,体长24公分,大约一瓶矿泉水的高度。小小身躯在加护病房奋战一年多,上个月健康出院,相信是全球出生时最轻且顺利存活的从酒吧驻唱到乐队主唱,和恋人相爱20年,张淇凭啥能这么火?说到最近火爆的综艺节目,披荆斩棘的哥哥必有一席之地。作为乘风破浪的姐姐兄弟篇,上线后就引发大家的追捧。33位平均年龄40岁的艺人们鱼贯登场,其中有不少熟悉的面孔赵文卓陈小春张智霖黄酸豆壳变汽车能源?看新加坡研究团队如何做到作者王嬿婷新加坡南洋理工大学领导国际研究团队成功将酸豆壳转化为汽车能源,有望减少垃圾量及对垃圾埋置厂的空间需求。酸豆(Tamarind,也称罗望子或亚参)是世界各地常食用的热带果实新加坡强制女佣每月至少休一日雇主为难作者刘钰铃10年前为了照顾生病的姐姐,七旬妇女开始聘请女佣。约一年前,姐姐突然患上帕金森症,甚至出现吞咽困难的问题,全天必须有人看顾,无论这个妹妹或女佣每天都不敢长时间外出。这样的袖珍国梵蒂冈在世界各地有5000处房产(梵蒂冈路透电)梵蒂冈首次披露其持有的房地产,这个全球最小的主权国在世界各地拥有房地产超过5000处。梵蒂冈著名地标之一的圣彼得广场。(路透社档案照)负责管理梵蒂冈房地产与投资的宗
强化学习到底是什么,它如何运作?强化学习属于机器学习中的一个子集,它使代理能够理解在特定环境中执行特定操作的相应结果。目前,相当一部分机器人就在使用强化学习掌握种种新能力。强化学习是一种行为学习模型,由算法提供数加快中风的诊断和治疗AI来了深度学习属于人工智能的一种,在医疗领域,它可以准确地利用CT扫描图像找到大脑供血动脉的阻塞,由于这种阻塞导致的中风占比很大,所以深度学习的使用,将有助于帮医生更快地诊断和治疗中风患真大力水手菠菜有望成为可再生燃料电池的关键催化剂在制造高效燃料电池方面,寻找好的催化剂已经成为一大核心议题。强大的催化剂,能够带来更快更高效的化学反应,从而增加能量输出。目前的燃料电池,通常依赖于铂基催化剂,但美国大学的科学家们道奇队夺冠!是AI主导了棒球世界大赛的决策流程道奇队的球迷苦苦等待了32年才见证这支队伍重新拿下世界大赛冠军。这32年之间,棒球运动无疑发生了巨大的变化。随着大量数据的涌现先进的计算机与分析技术,如今基于数字的策略制定已经成为iPhone12评测又一个里程碑的iPhoneiPhone12与12Pro已经正式亮相,标志着新一代iPhone的全面来临。支持5G新的硬件设计以及更强大的相机,让苹果在iPhoneX之后又迈进了一大步。当然,升级是正常的,毕2021年,AI有潜力改善农业的十种路径普华永道指出,基于物联网的农业(IoTAg)监控已经成为联网智能农业领域发展最快的技术领域,市场总额到2025年预计将增长至45亿美元。根据BIIntelligenceResear说他是九亿少女的梦,不过分吧?作为一个统一了7090年代人的审美,粉丝跨越老中青三代,数十年如一日奔赴在演艺圈的一线的全民偶像,如今快60岁了,还在荧幕上散发着那该死的只增不减的魅力。这个人是谁,相信答案显而易高通如何重新定义汽车?作者周雅在超过120年的时间里,汽车从来都是从一个地方到另一个地方的代步工具。直到近10年,一个新理念反复被提及智能汽车。当百年汽车工业拥抱技术,我们或许很难想象出,未来的智能汽车天神镇妖兽应对方法介绍天神镇中的妖兽是游戏里非常麻烦的怪物,经常会偷袭,但是很多玩家都不太清楚妖兽应该怎么防备应对比较好,其实要防备妖兽一定要知道,妖兽的第一仇恨目标就是仓库,在仓库的必经之地放上箭塔就日本奥运会,球员入场从希腊开始开幕式球员入场从希腊开始来自205个国家和地区的运动员参赛。日本将出现在最后。奥运会的发源地希腊位居榜首。难民队紧随其后。首次组建于2016年里约奥运会,这次聚集于叙利亚伊朗和南苏缅甸蟒在美国泛滥,大量蟒蛇难逢敌手,全职猎人依旧无能为力前言蟒蛇在我国一直属于濒危物种,根据野生动物保护条例第170章规定,在香港缅甸蟒属于受保护物种,同时缅甸蟒也是中国国家二级保护动物。但正是在我国受保护的物种,在近些年来却在美国佛罗