范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

2000亿次开放学习后,DeepMind的智能体成精了

  有这样一批智能体,在完全没有见过的游戏任务里,也学会了游刃有余地解决目标。
  譬如面对下面这样一个高地,它们要取到上面的紫色金字塔。
  没有跳跃功能的它们,看似开始"焦躁"地乱扔起东西来,实则其中一块板子正好被"扔"成了楼梯,这不就巧了,目标完成!
  你可能会说这只是"瞎猫撞死耗子"罢了,但多次实验发现,该智能体可以复现该方法的!
  而且它还会不止一种方法,"我不上去,你下来"—— 直接借助板子把目标扒拉下来了!
  这也行?
  而这些成精了的智能体来自 DeepMind。
  现在,为了让 AI 更加多才多艺、举一反三,他们专门给智能体打造了一个包含了数十亿游戏任务的"元宇宙"XLand:让智能体在不断扩展、升级的开放世界中通过上亿次的训练练就了不俗的泛化能力。
  最终效果就像前面看到的,无需在新游戏中从头训练,它们就能自主解决任务!
  DeepMind 也因此发表了一篇论文,就叫做:《从开放学习走出来的通用智能体》。
  如何做到的呢?"元宇宙"XLand
  最功不可没之一的就是这个庞大的"元宇宙"模拟空间。
  这是一个"游戏星系",里面有无数个"游戏星球",每个星球上的游戏按竞争性、平衡性、可选项、探索难度四个纬度进行区分。
  比如图左上介绍的"抢方块"游戏:蓝色智能体需要把黄色的立方体放到白色区域,红色智能体需要把同一个立方体放在蓝色区域。
  啊想想就头大,所以这个游戏的竞争性值都拉满了,而由于双方的条件/目标都一样,所以平衡性值也很高,因为需要定位目标区域,所以探索难度并不小。
  再比如图右上的"将球体和立方体配对":蓝色/红色智能体要将几何体按颜色归类到一起,完成任意一组配对就行。这个游戏的可选性值就拉满了,但竞争性就没那么强。
  ps. 蓝色游戏代表是完全竞争性的,粉色为完全合作性的。
  不管是哪种游戏任务,这批智能体都从最简单的开始(比如仅"靠近紫色立方体"这种),一步步解锁复杂度升级的游戏(比如和另一个智能体"捉迷藏"),其中每一项游戏都有奖励,智能体们的目标就是将拿到的奖励最大化。
  而智能体"玩家"们是通过阅读收到的目标的文字描述、观察 RGB 图像来感知周围环境来完成任务。生成的新任务要基于旧任务,且难度要刚刚好
  除了上面这个开放式的学习环境,训练方法也很重要。
  研究人员使用的神经网络训练架构提供了一种针对智能体内部循环状态的注意力机制 —— 通过估计所玩游戏的子目标,来持续引导智能体的注意力。
  这种策略让智能体学习到更具普遍能力的策略。
  还有一个问题:如此广阔的游戏环境,什么样的游戏任务分布能产出最善于泛化的智能体呢?
  研究人员通过持续调整每个智能体的游戏分布发现,每个新任务都要基于通关的旧任务生成,不能太难,也不能太容易。
  这个也基本符合一般认知。
  它们先经历了四次迭代:
  每个任务由多个智能体参与竞争,在旧任务上适应得好的智能体,会带着权重、瞬时任务分布、超参数等参与到新一轮任务中继续学习。此时也会加入新的智能体让竞争"活"起来。
  智能体表现出明显的零样本学习能力
  最后生成的第五代智能体,在 XLand 4000 多个"星球"里玩了大约 70 万个游戏,每一个智能体都经历了 2000 亿次训练,完成了 340 万个独特任务。
  到了这个时候,这些智能体已经能够顺利完成每一项评估任务(除了少数即使是人类也不可能完成的)。
  整个实验也最终表明,通过开发像 XLand 这样的环境和这样开放式地训练方法,一些基于 RL 的智能体已表现出明显的零样本学习能力(0-shot)。
  比如使用工具、打拦(ridge-fencing)、"捉迷藏"、找立方体、数数、合作或竞争等。
  研究人员也观察到智能体们面对新任务时不知道"什么是最好的解决办法",但它们会不断地试验直到达到目标。
  这个过程中出现的有趣的"紧急启发式行为",除了开头提到的搭梯子,还有这个临时更换更简易目标的例子 ——
  在一个游戏中该智能体需要从 3 个目标中任选一个完成:
  1、将黑色金字塔放到黄色球体旁边;
  2、将紫色球体放到黄色金字塔旁边;
  3、将黑色金字塔放到橙色区域。
  它一开始找到了一个黑色金字塔,想去完成目标 3,但在搬运过程中看到了黄色球体,于是它就在 1 秒内改变了主意,选择直接将金字塔放在黄色球体旁边完成目标 1。(整个过程一共耗时 6 秒)
  最后,看完了 DeepMind 的研究,再抛给大家一个问题:我们离真正的通用人工智能还有多远?
  (ps. 你发现了吗,文章最开头高台取金字塔任务中的小红智障体就不行,一直打转,面对小蓝搭好的梯子甚至直接毁掉)
  论文地址:
  https://arxiv.org/abs/2107.12808
  参考链接:
  https://deepmind.com/blog/article/generally-capable-agents-emerge-from-open-ended-play

IT之家开箱小米米家直流变频塔扇图赏拥抱温柔自然风IT之家5月15日消息此前,米家直流变频塔扇在小米商城上线众筹,众筹价为299元。这也是小米发布的首款塔扇。米家直流变频塔扇小米官网售价349元,将在5月18日正式发售。现在IT之官宣!小米手环5支持上百款表盘切换新增柯南EVA初音未来海绵宝宝等IP感谢IT之家网友Summerleaf的线索投递!IT之家6月10日消息今日上午,小米官方宣布,小米手环5支持切换上百款表盘,新增了大家耳熟能详的超级IP,包括名侦探柯南EVA初音未米家智能电压力锅开启预约售价299元,支持火锅模式IT之家1月16日消息米家智能电压力锅2。5L版于2020年末众筹成功,昨天该产品正式开启预约。产品预约价299元,将于1月19日1000正式开售。米家智能电压力锅2。5L体积小巧小米米家智能墙壁插座开启众筹小爱同学语音控制,49元包邮IT之家1月13日消息米家智能墙壁插座今日在小米商城开启新品众筹,众筹价49元(包邮),未来零售价59元。小米米家智能墙壁插座可以直接替换传统插座,实现全屋智能。小米米家智能墙壁插vivoWATCH系统升级30多项功能更新和优化,松针表带上新IT之家12月29日消息今晚,除了vivoX60和vivoX60Pro两款新机发布之外,vivoWATCH也即将推出全新系统升级,另外官方还带来了2021SPRING全新配色表带松苹果高管回应为何AppleWatchSeries6不带充电器IT之家9月16日消息苹果刚刚推出了全新的AppleWatchSeries6和价格亲民的AppleWatchSE,同时还推出了两款新的iPad2020年的iPadAir和iPad第波士顿动力开售Spot机器人售价约52万元6月17日消息,据外媒报道,美国当地时间周二,波士顿动力公司宣布开始向美国公司出售四足机器人Spot,这种机器人可以爬楼梯,穿越崎岖的地形。企业可以在shop。bostondyna波士顿动力机器狗又添新技能Spot变身牧羊犬北京时间5月20日下午消息,据外媒报道,放牧这个古老的技艺,并非人类和犬类所独有的能力。BostonDynamics公司的四足机器狗Spot似乎也能像真正的牧羊犬一样,做好放羊这个新款三星GalaxyWatch细节曝光不锈钢材质,电池大增IT之家2月8日消息根据外媒SamMobile的独家爆料,三星将发布一款新GalaxyWatch智能手表,可能会在2020年下半年与三星的Note20一起正式亮相。三星Galaxy小米手表今天推送OTA灰度升级解决充电配对等重点问题IT之家12月2日消息根据小米生态链总经理屈恒的消息,今天开始会有少数小米手表用户收到灰度升级,明天开始到5号,小米手表就会陆续收到推送OTA升级。屈恒表示,这次小米手表OTA主要一图看懂GENTLEMONSTERX华为EYEWEAR智能眼镜IT之家8月22日消息今年三月,在巴黎举办的华为P30系列发布会上,华为对外展示了一款同韩国眼镜公司GENTLEMONSTER合作研发的智能眼镜。Eyewear智能眼镜是华为与GE
人工智能的下一步是什么?我们应如何定义生命?北京时间5月16日消息,据国外媒体报道,凯斯西储大学的研究人员们正在致力于打造具有出色情绪智能的机器人。他们正在对人工智能进行改进,力图创造出能够实时读取人类情绪的下一代个性化机器360连发6款智能硬件产品安全路由器售价179元起感谢IT之家网友汪小汪的线索投递!今天,360在北京举行智能硬件新品发布会,发布了360智能门铃360安全路由360扫地机器人360智能门锁360儿童手表等六款产品。在360智能门GENTLEMONSTERX华为EYEWEAR智能眼镜8月21日预售,9月13日开卖IT之家8月16日消息,今年三月,在巴黎举办的华为P30系列发布会上,华为对外展示了一款同韩国眼镜公司GENTLEMONSTER合作研发的智能眼镜。当时GENTLEMONSTER的沈义人明示全新OPPO智能手表很期待IT之家10月28日消息去年年底,OPPOCEO陈明永表示2019年的研发资金将投入100亿,并且宣布OPPO将布局多智能终端,包括智能手表和智能家居。今年初,OPPO正式成立新兴时隔三年后,谷歌地图重新登陆苹果AppleWatchIT之家8月11日消息谷歌周一表示,将把谷歌地图重新带回AppleWatch。谷歌曾在2017年悄悄地从AppleWatch中删除了该应用,但表示预计将在未来重新推出该服务。当时,苹果AppleWatchSeries6的电池现身监管机构IT之家8月1日消息据推特网友yabhishekhd爆料,苹果AppleWatchSeries6的电池已在韩国监管机构KTR完成备案,信息显示该电池容量为303。8mAh,型号为A三星申请QBIX商标,或将用于QLED电视上的语音助手IT之家3月17日消息三星官网最近已经上架了QLED8K电视,在最新的QLED电视上,三星配备了自家的Bixby虚拟语音助手。据LetsGoDigital消息,三星最近申请了一个名马斯克的脑机接口设备真的来了,最早明年人体试验感谢IT之家网友wy7689的线索投递!美国创业家埃隆马斯克(ElonMusk)创办的初创企业Neuralink是一家秘密开发脑机接口的公司,它日前向公众首次展示了过去两年开发的多小米电视5Pro真机抢先曝光支持HDR10,细节真实丰富IT之家11月1日消息小米电视5系列将于11月5日亮相,昨天有科技博主科技犬建哥称已经提前体验到了小米电视5Pro,并且曝光了真机照片。据该博主称,小米电视(空调)部李肖爽表示小米399元,米家智能电暖器正式开售居浴两用,可联动小爱音箱IT之家11月1日消息今日,米家智能电暖器正式开售,可居浴两用,额定功率为2200W,支持IPX4防溅水与过热保护,售价399元。米家智能电暖器产品尺寸为780526216mm,支智能音箱如何做?天猫精灵给出了答案4月18日,阿里在北京举行了天猫精灵2019春季新品发布会,本次发布的主题是ConnectampCare(连接和关爱),发布会上,阿里一口气发布了三款重磅天猫精灵新品,分别是天猫精