范文健康探索娱乐情感热点
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

Meta发布支持128种语言的新语音模型指向元宇宙跨语种交流,可在线试玩

  Facebook AI,更准确地说是 Meta AI,刚刚发布了自监督语音处理模型 XLS-R,共支持 128 种语言。
  这项技术与 Meta 公司最新"元宇宙"愿景紧密相关。
  相互交谈是人们互动的一种自然方式,随着语音技术的发展,未来的虚拟世界可以使用我们技术进行互动,虚拟体验将与物理世界融为一体。
  说人话,就是让母语不同的人在元宇宙里社交:一位说着英语,一位说着汉语,两人可以靠 XLS-R 在元宇宙中无障碍对话 。
  实际效果如何呢?
  MetaAI 在 HuggingFace 上发布了试用版语音直译模型,支持从 22 种语言转换到 16 种语言 ,我们先来试试它的英译中效果。
  (虽然翻译腔较浓,但仍算准确,7 秒钟的句子完成翻译仅 1.53 秒)
  我们知道,世界上的语言有上千种,要用 AI 实现这些语言的互通并非易事。
  一般语料库的丰富程度决定了语言翻译模型的质量,语音翻译一般集中于几个资源多大语种之间。但是由于小语种往往语料匮乏,使用这类母语的人往往很难获得较高的 AI 翻译质量。
  XLS-R 通过自监督技术对 10 倍的语音数据进行训练,大大改善了以前的多语言模型,尤其是小语种的处理。XLS-R 的原理
  XLS-R 基于 Facebook 去年发布的 wav2vec 2.0 技术。
  wav2vec 2.0 与 BERT 类似,是通过预测音频 mask 部分的语音单元来训练的。它们的区别是,语音音频是一种连续的信号,不能轻易清晰地分割成单词或其他单位。
  wav2vec 2.0 通过学习 25 毫秒长的基本单元来解决这个问题,以便能够学习高级上下文表示。
  在仅拥有一小时的标记训练数据的情况下,wav2vec 2.0 能通过后续无监督的训练数据,在 LibreSpeech 测试基准的 100 小时子集上达到 SOTA 水平。
  之后,Facebook 又推出了完全无监督的高性能语音识别模型 wav2vec-U,它纯粹从录制的语音音频和未配对的文本中学习。
  为了 wav2vec-U 让学习识别音频录音中的单词,Facebook 训练了一个 GAN。生成器根据嵌入在自监督表示中的每个音频段,预测与语言中的声音对应的音素。
  而鉴别器负责评估预测的音素序列是否真实。最初,转录非常糟糕,但随着时间的推移,随着鉴别器的反馈,转录变得准确。
  通过这种方式,它学会了区分生成器的语音识别输出和真实文本。
  Facebook 在此基础上推出了包含 53 种语言的 XLSR。
  而最新发布的 XLS-R 有 128 种语言之多,语种数量是 XLSR 的两倍多,数据量更是后者 10 倍 —— 共计长达 43.6 万小时的语音。
  XLS-R 共有 20 亿参数,它在测试的 37 种语言中,表现优于大多数语种先前的工作。甚至在老挝语等小语种识别上,也能低于之前的错误率。
  此外 XLS-R 也让低资源语言与英语之间的翻译大幅改进,例如从印度尼西亚语到英语的翻译,其中 BLEU(双语互译质量评估)的准确性平均翻了一番。
  CoVoST-2 语音翻译基准测试中,XLS-R 在 21 个英语翻译方向上比之前技术平均提高了 7.4 BLEU。
  从下图中可以看出,XLS-R 对低资源语种的提升尤为明显。
  微调 XLS-R
  XLS-R 只是一个预训练模型,为了能更好的服务于具体任务,还需要对模型进行微调。
  Hugging Face 官方提供了详细的微调教程。
  此外官方还提供不同参数规模的语音识别模型,以及 15 种语言与英语之间的互译模型,供用户下载。传送门
  官方博客:
  https://ai.facebook.com/blog/xls-r-self-supervised-speech-processing-for-128-languages/
  GitHub 页:
  https://github.com/pytorch/fairseq/tree/main/examples/wav2vec/xlsr
  论文地址:
  https://arxiv.org/abs/2111.09296v1
  试用网页地址:
  https://huggingface.co/spaces/facebook/XLS-R-2B-22-16
  微调方法简介:
  https://huggingface.co/blog/fine-tune-xlsr-wav2vec2

2021年春晚的拓荒牛机器人体重60kg,涉及申请专利超2500件IT之家2月12日消息在央视2021牛年春晚上,红色身躯搭载祥云图案的四足机器人拓荒牛,与刘德华王一博关晓彤等一起呈现了科技感十足的创意表演牛起来。该机器人结构上类似波士顿动力研发IDC预计2021年中国智能家居设备市场出货量2。5亿台,增长21。1IT之家6月17日消息研究机构IDC今日发布了中国智能家居设备市场季度跟踪报告,2021年第一季度。报告显示,2021年第一季度中国智能家居设备市场出货量为4699万台,同比增长2IT之家开箱vivoWATCH2独立通信智能手表原力黑图赏IT之家12月22日消息,今天,vivoWATCH2正式发布,支持eSIM独立通信,售价1299元。IT之家已经拿到这款产品的原力黑配色,并为大家带来了新鲜的开箱图赏。vivoWA14。5亿大单,中国移动采购4400台人工智能通用计算设备从中国移动官网获悉,中国移动于昨日启动人工智能通用计算设备集采,采购规模为4400台,采购满足期为1年。据采购公告显示,本次采购的人工智能通用计算设备包括推理型和训练型,项目总预算刘慈欣称赞小米CyberDog铁蛋机器人,首批400台众测报名开启IT之家8月11日消息在小米8月10晚举办的发布会上,雷军带来了小米自研的CyberDog四足机器人,外号铁蛋。这款机器人搭载高精度环境感知系统,全身11个高精度传感器向AI大脑实OPPOARGlass2021正式发布全新分体式设计,等效3米外观看90寸巨幕IT之家11月17日消息今日下午,OPPO在深圳举办OPPO未来科技大会2020(OPPOINNODAY2020),正式发布了第二款AR眼镜概念产品OPPOARGlass2021。小米全自动智能门锁等四款新品今日10点开售IT之家9月25日消息据小米商城官方介绍,今天小米全自动智能门锁米家智能宠物饮水机米家智能宠物喂食器米家踢脚线电暖气E将于今早10点发售。其中小米全自动智能门锁售价1799元米家智外卖小哥上神装!紫光展锐推出全球首款芯片级智能头盔解决方案IT之家9月17日消息今天,紫光展锐正式推出全球首款芯片级智能头盔解决方案,据IT之家了解,展锐打造的全球首款芯片级智能头盔解决方案,将蓝牙WiFiLTEGPSAI等功能模块集成在淘宝还有这玩法?自动写文案的AI黑科技这几年AI应用越来越广泛,以往机器人只是取代人类进行体力劳动,现在小编这样的脑力劳动者,也不得不开始忧心忡忡了。毕竟谷歌的AlphaGo都已经将人类脑力运动的佼佼者斩于马下,像文字小米米家空调伴侣Pro万能遥控版发布新增红外遥控等功能,售价129元感谢IT之家网友拈花一笑oO的线索投递!IT之家6月11日消息小米官方昨日推出了最新的米家空调伴侣Pro万能遥控版,该设备除了具有米家空调伴侣2原有的功能外(比如远程控制空调小爱声三星GalaxyWatch4手表现身数据库支持5W无线充电IT之家6月15日消息据外媒GSMArena报道,三星即将推出的新款GalaxyWatch4智能手表近日出现在FCC的数据库中,该手表将有WiFi版和LTE版两个版本。其中,WiF
IT之家评测华为WATCHFIT评测如影随形的健康私教12月23日,华为在nova8新品发布会上正式发布了全新华为WATCHFIT,这是华为首款方形形态的轻智能运动手表,主要面向年轻人女性和活力轻健身爱好者,主打轻巧机身和腕上运动私教2020年Q1全球智能穿戴设备出货7260万部,华为华米手表涨幅最快IT之家5月30日消息近日,IDC发布2020年第一季度全球智能穿戴设备市场销售数据,全球智能穿戴设备出货量7260万部,同比增长29。7。根据IDC的数据,2020年第一季度智能运动新选择酷玩潮搭华为WatchGT2e亮相nova7发布会随着5G时代越来越近,IoT产业的市场潜力正在逐渐显山露水。而作为消费级IoT的一个重要终端类型,智能手表也正受到更多人的重视。近期国内科技厂商纷纷将智能手表作为自身的重要产品线之华为公开新款智能手表外观设计专利与华为手环B6十分类似IT之家2月5日消息企查查App显示,近日,华为技术有限公司公开一种手表外观设计专利,公开号为CN306301963S。专利摘要显示,本外观设计产品的用途主要用于计时计步体征数据测荣耀手表GS3真机亮相不支持无线充电感谢IT之家网友络世的线索投递!IT之家1月3日消息,荣耀手表GS3于2021年8月12日正式发布,但当时没有公布售价和上市时间。12月24日,这款手表已经在荣耀社区开启众测。据博CanalysQ3全球可穿戴腕带设备市场苹果重回第一,小米华为分列二三位IT之家11月26日消息,今日,Canalys发布报告称,2021年第三季度,全球可穿戴腕带设备出货量达到4782万台,同比下降11。其中,苹果以733万台的销量重回第一,市场份额华为WATCHGT3RunnerVR套装等新品将于26日零点开售IT之家11月25日消息,华为于11月17日举办了全场景智慧生活新品发布会,正式推出了WATCHGT3系列智能手表,以及专门针对跑步用户开发的WATCHGTRunner。这几款产品教科书式的双赢三星GalaxyWatch4系列改用WearOS,两者市占率大幅提升11月23日消息,三星GalaxyWatch4系列转向WearOS阵营之后,市场占比从上一年同期的10增长到14,而WearOS的季度市场份额更是从4一跃提升到17。CounterIT之家开箱石头扫拖机器人T8Plus智能集尘版图赏IT之家5月6日消息,近期,石头扫拖机器人T8系列的升级版T8Plus发布。IT家带来了这款扫拖机器人的开箱图赏。石头扫拖机器人T8Plus重量为4。6kg,体积为353mmx35教AI逐帧搓招玩铁拳通关最高难度,现在的街机游戏爱好者有点东西现在的AI都开始学着逐帧搓招打街机了?拳皇98街头霸王死或生一干童年回忆全都玩了个遍,其中还有号称要打5000场才能入门的3D格斗游戏铁拳没错,就是那个对新手极不友好的铁拳,随便拉亚马逊Echo智能音箱将支持超声波探测,能识别房间是否有人IT之家11月15日消息,根据外媒TheVerge消息,亚马逊Echo四代以及EchoDot智能音箱,现已超声波探测技术,用于检测周围环境的物体,来决定是否开启家中的电灯等其它家用