范文健康探索娱乐情感热点
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

谷歌推出全能扒谱AI只要听一遍歌曲,钢琴小提琴的乐谱全有了

  听一遍曲子,就能知道乐谱,还能马上演奏,而且还掌握"十八般乐器",钢琴、小提琴、吉他等都不在话下。这就不是人类音乐大师,而是谷歌推出的"多任务多音轨"音乐转音符模型 MT3 。
  首先需要解释一下什么是多任务多音轨。通常一首曲子是有多种乐器合奏而来,每个乐曲就是一个音轨,而多任务就是同时将不同音轨的乐谱同时还原出来。
  事实上,谷歌 MT3 在还原多音轨乐谱这件事上,达到了 SOTA 的结果。谷歌已将该论文投给 ICLR 2022。还原多音轨乐谱
  相比与自动语音识别(ASR),自动音乐转录(AMT)的难度要大得多,因为后者既要同时转录多个乐器,还要保留精细的音高和时间信息。
  多音轨的自动音乐转录数据集更是"低资源"的。现有的开源音乐转录数据集一般只包含一到几百小时的音频,相比语音数据集动辄几千上万小时的市场,算是很少了。
  先前的音乐转录主要集中在特定于任务的架构上,针对每个任务的各种乐器量身定制。因此,作者受到低资源 NLP 任务迁移学习的启发,证明了通用 Transformer 模型可以执行多任务 AMT,并显著提高了低资源乐器的性能。作者使用单一的通用 Transformer 架构 T5,而且是 T5"小"模型,其中包含大约 6000 万个参数。
  该模型在编码器和解码器中使用了一系列标准的 Transformer 自注意力"块"。为了产生输出标记序列,该模型使用贪婪自回归解码:输入一个输入序列,将预测出下一个出现概率最高的输出标记附加到该序列中,并重复该过程直到结束。
  MT3 使用梅尔频谱图作为输入。对于输出,作者构建了一个受 MIDI 规范启发的 token 词汇,称为"类 MIDI"。
  生成的乐谱通过开源软件 FluidSynth 渲染成音频。此外,还要解决不同乐曲数据集不平衡和架构不同问题。
  作者定义的通用输出 token 还允许模型同时在多个数据集的混合上进行训练,类似于用多语言翻译模型同时训练几种语言。这种方法不仅简化了模型设计和训练,而且增加了模型可用训练数据的数量和多样性。实际效果
  在所有指标和所有数据集上,MT3 始终优于基线。训练期间的数据集混合,相比单个数据集训练有很大的性能提升,特别是对于 GuitarSet、MusicNet 和 URMP 等"低资源"数据集。
  最近,谷歌团队也放出了 MT3 的源代码,并在 Hugging Face 上放出了试玩 Demo。
  不过由于转换音频需要 GPU 资源,在 Hugging Face 上,建议各位将在 Colab 上运行 Jupyter Notebook。
  论文地址:
  https://arxiv.org/abs/2111.03017
  源代码:
  https://github.com/magenta/mt3
  Demo 地址:
  https://huggingface.co/spaces/akhaliq/MT3

华为开启智慧语音新一期众测支持识别山东话感谢IT之家网友乄弈枫灬的线索投递!IT之家12月18日消息,昨日,华为智慧语音应用市场版本开启了新一期众测活动,活动时间为12月17日至12月20日。IT之家了解到,升级后的华为米家免洗扫拖机器人Pro今晚开售2499起,LDS激光导航IT之家10月31日消息,小米于10月15日发布了米家免洗扫拖一体机器人以及Pro版本。这两款产品集成了拖地吸尘功能,自动识别地毯,能够自动洗拖布。机器人零售价2999元起,将于今小米智能门锁系列双11限时优惠E型号799元,1S999元IT之家10月31日消息,小米智能门锁系列将在双11期间开启大促活动,限时开抢。小米此前表示,将在2021年提供20亿补贴,为500款产品提供降价优惠。具体来看,小米智能门锁E型号华为WATCHGT211。0。14。75版固件更新新增日出日落显示,运动时屏幕常亮感谢IT之家网友乄弈枫灬的线索投递!IT之家10月24日消息,根据IT之家网友木易丩巾投稿,华为WATCHGT2智能手表目前已经推送了11。0。14。75版固件更新,大小为219M中英文最大AI模型世界纪录先后产生,大模型竞赛新阶段来了10月15日消息,超大AI模型训练成本太高hold不住?连市值万亿的公司都开始寻求合作了。本周,英伟达与微软联合发布了5300亿参数的威震天图灵(MegatronTuring),成李开复未来15年AI将接管人类一半工作IT之家10月13日消息,李开复近日在樊登读书节目中表示,未来15年,人工智能会接管我们现在一半的工作和工作里的任务。李开复称,至少一半人的工作,其实是单一领域重复性的工作。人工智华米Amazfit中文名定为跃我寓意向上而生,超越自我IT之家10月12日消息今天下午1430华米科技正式召开Amazfit2021全球年度新品发布会,会上华米公布了Amazfit的新品牌Logo,还公布了Amazfit的全新中文名称爆改100多元卡西欧,可测速测温测海拔,不输智能运动表卡西欧F91W手表,可谓经典中的经典。但全球那么多人都佩戴同款,是有点不那么时尚了。怎么破?改它!这不,最近国外一位硬核玩家JoeyCastillo,直接把卡西欧F91W改造成了一749元,华为WatchFITnew智能手表正式开售10天续航,支持血氧心率监测IT之家9月29日消息今日,华为WatchFITnew智能手表正式开售,采用1。64英寸全彩大屏,搭配2。5D镜片,售价799元,首发到手价749元。华为WatchFITnew拥有IT之家开箱OPPOWatchFree图赏轻巧大屏,全场景睡眠监测IT之家9月26日消息今日OPPO正式发布了OPPOWatchFree智能手表,提供标准版以及NFC版可选,零售价549元起。这款手表采用了轻量化设计,整机仅重33g,其特点是提供小米小爱同学官方将逐步适配协同唤醒家庭传声等功能,提高唤醒准确率IT之家9月24日消息小米社区于9月22日举办了负责人在线专场活动,本期由小米小爱同学的负责人与米粉互动,回答了80问题。官方表示,针对小爱同学出现莫名被唤醒的问题,团队已经将这一
IDC三季度全球腕上穿戴设备出货量苹果华为并列第一感谢IT之家网友络世的线索投递!IT之家12月18日消息,IDC2021年第三季度全球可穿戴设备出货量报告指出,华为在腕上穿戴设备细分领域,2021年Q3的出货量与苹果并列全球第一谷歌又买算法送手机了,最新方法让背景虚化细节到头发丝当真是买算法送手机!这不,谷歌又给亲儿子Pixel6塞福利了,让手机抠图也能细节到头发丝。看这效果,原本模糊的头发轮廓,咻地一下,就变成了纤毫毕现的样子!连发丝之间的缝隙也能精准抠OPPO智能指环专利获授权,显示屏可拉伸感谢IT之家网友詹姆斯肖战割割的线索投递!IT之家4月7日消息,国家知识产权局信息显示,4月5日,OPPO广东移动通信有限公司智能指环专利获得授权,授权公告号为CN21621091realme国内首款智能手表将至,官方已注册微博账号IT之家10月16日消息,realme真我将于10月19日1400举办发布会,正式发布realmeQ3s手机。官方近期注册了realme手表官方微博账号并发布首条微博,预示着该品牌华米黄汪与手机厂商做手表出发点不同,自研OS已向第三方开放手机厂商都在做智能手表,华米科技有什么优势?华米科技创始人董事长兼CEO黄汪直言,从2014年做可穿戴设备开始,自己已经被这个问题问了七年。在他看来,这期间不断有手机厂商入局,但华华米AmazfitGTR3Pro智能手表预热搭载6通道生物追踪光学传感器IT之家10月7日消息华米科技将于10月12日举办Amazfit2021全球年度新品发布会。正式发布AmazfitGTR3Pro智能手表。今日官方发布海报进行预热,表示新品将搭载6京东方获ARVR隐形眼镜专利授权,可消除镜框给眼睛的压迫感IT之家11月5日消息,京东方近日获得了一项ARVR隐形眼镜相关专利授权。企查查App显示,11月5日,京东方科技集团股份有限公司获得ARVR隐形眼镜及其制作方法和电子设备专利授权IT之家开箱米家智能显示器挂灯1S图赏专属蓝牙遥控器,可接入米家AppIT之家11月5日消息,小米于10月20日推出了米家智能显示器挂灯1S。新品支持接入米家App,目前已正式开售,售价249元。IT之家现已拿到米家智能显示器挂灯1S,并为大家拍摄了小米米兔儿童学习手表5Pro发布3D楼层定位NFC,1199起IT之家11月4日消息,今日小米正式发布了米兔儿童学习手表5Pro。这款产品作为该品牌的旗舰型号,搭载双摄像头,支持NFC3D楼层定位等功能,售价1299元。产品将于今晚8时开启预佳能推出PowerShotPX智能监控摄像机1080P60fps,支持变焦IT之家11月1日消息,根据外媒techpowerup报道,佳能于10月29日在欧洲市场推出了PowerShotPX智能监控摄像机。该产品适用于家庭用户,云台可以横向纵向旋转,可以可穿戴设备市场复燃,但智能手表手环不是最终答案?可穿戴智能设备,已经逐渐成为人们日常生活中不可缺少的电子产品。根据央视财经报道,国内可穿戴设备市场正处于蓬勃发展的时期,尤其是价格在一两千元的智能手表最受消费者欢迎。据IDC最新发