范文健康探索娱乐情感热点
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

DeepMind两年研究一朝公开,通用人工智能最新突破一个模型一套权重通吃600视觉文本和决策任务

  感谢IT之家网友 Sancu 的线索投递!
  通用人工智能,还得看 DeepMind。这回,只一个模型,使用相同的权重,不仅把看家本领雅达利游戏玩得飞起。
  和人类聊聊天、看图写话也不在话下。甚至还能在现实环境里控制机械臂,让其听从指令完成任务!
  模型名为 Gato ,西班牙语中的"猫"。
  按照 DeepMind 的说法,这只猫猫可以使用具有相同权重的同一个神经网络 ,适应各种不同的环境。
  具体而言,DeepMind 让它在 604 个不同的任务 上接受了训练,这些任务模式完全不同,需要观察的元素和行为规则也不同。
  而 Gato 不仅在 450 个任务中都超过了专家水平的 50%,在 23 个雅达利游戏上表现还超过人类平均分。
  DeepMind CEO 哈萨比斯直接说:
  这是我们目前最通用的智能体。
  这一最新成果一发布,当即就在 AI 圈子里掀起热议。
  有 AI 研究者指出:Gato 令人印象深刻。只需要在云上花费 5 万美元,就能完成对它的训练。
  这点钱只是 PaLM 训练费用 1100 万美元的一个零头。用 PaLM 的预算完全可以将 Gato 扩展 100 倍,而这很可能是行之有效的。
  PaLM 是谷歌发布的 5400 亿参数语言模型。
  有人直接祭出了 AlphaStar 架构和 Gato 架构的对比:
  Zoom AI 杰出科学家 Awni Hannun 则直接感叹起过去 5 周以来,谷歌 / DeepMind 释出成果之密集。
  所以这只来自 DeepMind 的"猫猫",究竟怎么一回事?一个 Transformer 搞定一切
  对于研究方法,DeepMind 只用一句话就解释明白了:
  我们受到语言大模型的启发,用类似的方法把模型能力拓展到文本之外的领域。
  没错,这次立功的又是语言大模型中常用的 Transformer 架构。
  Transformer 的本质就是把一个序列转换 (transform) 成另一个序列。
  所以要想让它掌握各种不同任务,首先就需要把各类数据都编码成序列。
  文本 自不必说,天然就是序列信息,可用经典的 SentencePiece 编码。
  图像 ,ViT 已经打好样,先按 16x16 像素分割,再给每个像素编上号处理成序列。
  玩游戏时的按键输入 同样是序列,属于离散值,比如懂得都懂的"上上下下左右左右 BABA"。
  操纵机器人时的传感器信号和关节力矩 属于连续值,也通过一系列采样和编码处理成离散序列。
  最终,所有序列数据都交给同一个 Transformer 处理。
  整个 Gato 模型使用的训练数据总体上偏向游戏和机器人控制任务 ,596 个任务占了 85.3%。视觉和自然语言任务只占 14.7%。
  模型架构上,为了简洁和可扩展性,就在最经典的原版 Transformer 基础上小改,具体参数如下:
  24 层 11.8 亿参数版的 Gato,在谷歌 16x16 Cloud TPUv3 切片上训练了大约 4 天。
  到了部署阶段,Gato 对于视觉和语言任务就像传统 Transformer 和 ViT 那样运行。
  对于游戏和机器人控制的行为模式则可以理解为"走一步看一步 "。
  首先给出一个任务提示,比如游戏操作或机器人动作,作为输出序列的开头。
  接下来 Gato 会观察当前的环境,对动作向量进行一次自回归采样,执行动作后环境发生变化,再重复这个过程……
  那么这样训练出来的 Gato,在各项任务中到底表现如何?仅靠 12 亿参数成为多面手
  玩游戏方面,Gato 的表现可以用一张图来总结。
  x 轴是训练集之中专家水平的百分比,其中 0 代表一个随机参数模型的水平。
  y 轴是 Gato 超过或达到对应专家水平的任务数量。
  最终结果,Gato 在 604 个任务中,有 450 个超过了专家水平的 50% 。
  更详细的结果如下:
  雅达利游戏测试中,Gato 在 23 个游戏上表现超过人类平均分 ,11 个游戏上比人类得分高一倍。
  这些游戏包括经典的乒乓球、赛车,也包括射击、格斗等多种类型。
  在 Bengio 团队推出的 BabyAI 测试上,Gato 几乎在所有关卡达到了专家水平的 80%,最难的几个 Boss 关达到 75%。与之前 BabyAI 榜单上的两个模型水平相当(分别为 77% 和 90%),但这两个模型都针对性的用了上百万个演示来训练。
  ▲BabyAI 关卡示例
  在 Meta-World 上(虚拟环境中操作机械臂),Gato 在全部 45 个任务中,有 44 个超过专家水平的 50%,35 个超过 80%,3 个超过 90% 。
  ▲Meta-World 任务示例
  操纵真实机器人方面,与之前模型对比也不遑多让。
  至于视觉和文本任务 DeepMind 这次至少为了验证通用模型的可行性,没有做跑分,而是给了一些示例。
  △ 描述图像
  ▲聊天对话
  最后,DeepMind 还对 Gato 模型的可扩展性做了评估。
  虽然当前 Gato 在每一个单独任务上都还比不上 SOTA 结果,但实验结果表明,随着参数、数据和硬件的增加,Gato 模型的性能还有成比例上涨 的空间。
  另外,Gato 在少样本学习 上也表现出一定潜力。
  DeepMind 认为,这样一个通用模型将来可通过提示或微调迅速学习新的任务,再也不用为每个任务都重头训练一个大模型了。通用人工智能还有多远?
  看完 Gato 如此表现,网友们的"大受震撼"也就不奇怪了。
  甚至还有人认为,AGI(通用人工智能)近在眼前。
  当然,反对 / 质疑的声音也不小。
  比如始终冲在给人工智能泼冷水一线的马库斯,这次也第一时间开了炮:
  仔细看看第 10 页。无论模型有多大,大型语言模型标志性的不靠谱和错误信息仍然存在。
  但不管怎么说,DeepMind 在通用人工智能方向上的努力都在不断涌现出新成果。
  事实上,无论是 2013 年惊艳了谷歌的雅达利游戏 AI,还是名满全球的 AlphaGo、AlphaStar,DeepMind 透过这些阶段性成果想要达成的终极目标,一直都通向通用人工智能 这个关键词。
  去年,DeepMind 首席研究科学家、伦敦大学学院教授 David Silver 还领衔发布了一篇同样引起不少讨论的文章:Reward is Enough。
  论文认为,强化学习作为基于奖励最大化的人工智能分支,足以推动通用人工智能的发展。
  而据 Gato 团队成员透露,这只"猫猫"已经在 DeepMind 内部孕育了 2 年时间。
  此次 Gato 是以有监督方式进行离线训练的,但论文也强调,原则上,同样可以采用离线或在线强化学习的方式对其进行训练。
  而就在一周前,DeepMind 发布了一个新视频,其中说到:
  我们接下来要做一件大事(the next big thing),那意味着需要去尝试很多人们认为过于困难的事情。但我们一定要去尝试一下。
  现在看来,这个 next big thing 就是指 AGI 了。
  论文地址:
  https://www.deepmind.com/publications/a-generalist-agent

韩国AI创企打造逼真虚拟人,能化身教师或银行职员据外媒VentureBeat报道,韩国AI初创公司Deepbrain获得由韩国产业银行(KoreaDevelopmentBank)领投的B轮4400万美元(约人民币2。85亿元)融京东数科自主研发AI仿生手,依大脑反馈执行指令6月5日晚间消息,京东数科透露其自主研发的可穿戴AI仿生手可在0。5秒之内快速识别和响应肌电信号,且准确率接近100,基于此助力特种人群劳动效率大幅提升50。清华大学人工智能研究院江苏扬中公园现智能充电座椅,采用光伏发电能够提供WiFiIT之家12月18日消息据微博中新视频消息,江苏镇江扬中市的滨江零碳公园内,出现了一种覆盖有大面积太阳能电池板的长凳。长凳侧面具备按钮,边缘黑色部分是无线充电模块,可以给支持Qi等小米小爱音箱Art电池版明日0点开售黑金配色大容量电池,399元IT之家10月31日消息小米小爱音箱Art电池版将于明日0点正式开售,内置4850mAh大容量电池,售价399元。外观方面,小爱音箱Art电池版采用了全新黑金配色,搭配经典机身设计阿里AI实现首个实时翻译直播,将大规模用于双11IT之家10月21日消息10月21日,阿里完成全球首个多语言实时翻译的电商直播,通过AI实现环境降噪,解决口音不标准及口语化语言风格等问题,可实时将中文直播内容精准翻译成英语俄语西米家直流变频塔扇开启众筹小米首款塔扇,299元IT之家4月29日消息今日,米家直流变频塔扇在小米商城上线众筹,众筹价为299元。这也是小米发布的首款塔扇。与落地扇相比,塔扇拥有立体广角送风,更加节省空间的特点同时,塔扇由于重心IT之家开箱米家空调伴侣Pro万能遥控版图赏拓展插槽,红外遥控IT之家6月11日消息小米于6月10日发布了米家空调伴侣Pro万能遥控版。这款产品采用16A插头输入,具有16A10A两个输出插座,方便连接空调的同时连接其它电气。该产品最大的特点出门问问TicWatchE3智能手表曝光骁龙4100,2。5D玻璃IT之家6月14日消息据外媒9to5Google报道,据本周Instagram上的一段视频显示,俄罗斯的一位用户在出门问问公司(英文名为Mobvoi,是谷歌投资的一家中国人工智能公OPPO发布全球首款一键联手机壳套装搭载UWB技术,可操控智能家居IT之家5月13日消息OPPO今日正式发布全球首个搭载UWB技术的手机配件OPPO一键联手机壳套装。这套配件可以让FindX3Pro获得更强大的空间感知能力,精准地知道智能家居设备强迫症福音AI对应配音改演员口型,汤姆汉克斯也能流利说日语近日,英国AI创企Flawless使用Deepfake(深度伪造技术)调整演员面部表情,让他们改变口型说外语,解决观众观看外国电影时演员口型与字幕或配音不同步的问题。该公司将这一可AI赢得填字游戏冠军,打败1000多名人类选手在上周举行的美国填字游戏锦标赛(AmericanCrosswordPuzzleTournament,ACPT)上,一位人工智能选手从1000多名参赛者中脱颖而出,获得胜利,它就是填
开启预约,3期免息HonorWatch荣耀智能手表9元预定IT之家10月23日消息荣耀智能手表HonorWatch已在今日开启预约,10月31日正式发布,售价尚未公布。预售定金9元抵59元,支持白条3期免息,11月1日付尾款并发货时尚款经苹果watchOS7发布睡眠监测来了IT之家6月23日消息在今天的WWDC20开发者大会上,苹果正式推出了watchOS7,活动结束后,苹果已经向开发者发布了watchOS7更新的首个开发者测试版。watchOS7引一条曲线看懂5G自动驾驶AI都到什么阶段了近期,全球最具权威的IT市场研究与咨询公司Gartner,发布了2019年度新科技的技术成熟度曲线(HypeCycle,以下简称Gartner曲线)。简单来说,这是一条描述新技术产小米发布米家智能窗帘小爱同学控制自动开合,众筹价699元感谢IT之家网友游胖子123的线索投递!IT之家6月8日消息在家居行业越走越远的小米今天又发一款新品米家智能窗帘,新品将于6月10日早10点开启众筹,零售价799元,众筹价699元人工智能不只能看平面世界,还能观察四维时空一物理学理念正帮助计算机学习在比二维更高的维度中进行观察。新的人工智能技术不仅能够在二维图像中发现模式,还能够在球体和其他曲面上发现模式,从而将人工智能从平面世界中跳脱出来。新的深小米米家台灯Pro发布立体光照,349元感谢IT之家网友飞天面条神的线索投递!IT之家1月8日消息小米今天发布了米家台灯Pro,支持全桌面立体光照,售价349元。米家台灯Pro采用三级转轴1。2立体光照设计,双臂可调节,全球首款165英寸可折叠电视cSEEDM1发布,售价高达近260万人民币IT之家3月5日消息cSEED是一家于2009年创立于奥地利的公司,主营室内室外的大型电视,近期这家公司发布了一台设计夸张的室内电视可从地面升降的巨屏折叠电视M1。IT之家了解到,图森未来下周四登陆纳斯达克,或成全球自动驾驶第一股IT之家4月8日消息据IPO早知道消息,图森未来(TuSimple)于美东时间4月7日向美国证券交易委员会(SEC)更新S1文件,计划于4月15日正式以TSP为证券代码在纳斯达克挂小爱同学与小冰解锁三人逛三园技能,挑战碳基人类IT之家1月15日消息今天,小冰与小爱同学推出了第二个组团技能三人逛三园,对着小爱同学或小冰说逛三园就能启动。本次活动的时间为2020年1月15日到2月3日,对着手机或小爱音箱说逛一图看懂华为WatchGT2一体化3D玻璃麒麟A1芯片IT之家9月19日消息今天,华为在德国正式推出了华为WatchGT2系列智能手表,该款智能手表采用了全新的3D玻璃屏幕,同时搭载麒麟A1芯片。全新的华为WatchGT2智能手表共有无人驾驶烧钱无尽,汽车厂商不得不合作搞研发10月23日消息,据美国媒体报道,100多年前,英国首相巴麦尊曾说过没有永恒的朋友,也没有永恒的敌人,只有永恒的利益。而最近汽车行业也验证了这句话。上周福特宣布,计划扩大与印度最大