范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

2000亿次开放学习后,DeepMind的智能体成精了

  有这样一批智能体,在完全没有见过的游戏任务里,也学会了游刃有余地解决目标。
  譬如面对下面这样一个高地,它们要取到上面的紫色金字塔。
  没有跳跃功能的它们,看似开始"焦躁"地乱扔起东西来,实则其中一块板子正好被"扔"成了楼梯,这不就巧了,目标完成!
  你可能会说这只是"瞎猫撞死耗子"罢了,但多次实验发现,该智能体可以复现该方法的!
  而且它还会不止一种方法,"我不上去,你下来"—— 直接借助板子把目标扒拉下来了!
  这也行?
  而这些成精了的智能体来自 DeepMind。
  现在,为了让 AI 更加多才多艺、举一反三,他们专门给智能体打造了一个包含了数十亿游戏任务的"元宇宙"XLand:让智能体在不断扩展、升级的开放世界中通过上亿次的训练练就了不俗的泛化能力。
  最终效果就像前面看到的,无需在新游戏中从头训练,它们就能自主解决任务!
  DeepMind 也因此发表了一篇论文,就叫做:《从开放学习走出来的通用智能体》。
  如何做到的呢?"元宇宙"XLand
  最功不可没之一的就是这个庞大的"元宇宙"模拟空间。
  这是一个"游戏星系",里面有无数个"游戏星球",每个星球上的游戏按竞争性、平衡性、可选项、探索难度四个纬度进行区分。
  比如图左上介绍的"抢方块"游戏:蓝色智能体需要把黄色的立方体放到白色区域,红色智能体需要把同一个立方体放在蓝色区域。
  啊想想就头大,所以这个游戏的竞争性值都拉满了,而由于双方的条件/目标都一样,所以平衡性值也很高,因为需要定位目标区域,所以探索难度并不小。
  再比如图右上的"将球体和立方体配对":蓝色/红色智能体要将几何体按颜色归类到一起,完成任意一组配对就行。这个游戏的可选性值就拉满了,但竞争性就没那么强。
  ps. 蓝色游戏代表是完全竞争性的,粉色为完全合作性的。
  不管是哪种游戏任务,这批智能体都从最简单的开始(比如仅"靠近紫色立方体"这种),一步步解锁复杂度升级的游戏(比如和另一个智能体"捉迷藏"),其中每一项游戏都有奖励,智能体们的目标就是将拿到的奖励最大化。
  而智能体"玩家"们是通过阅读收到的目标的文字描述、观察 RGB 图像来感知周围环境来完成任务。生成的新任务要基于旧任务,且难度要刚刚好
  除了上面这个开放式的学习环境,训练方法也很重要。
  研究人员使用的神经网络训练架构提供了一种针对智能体内部循环状态的注意力机制 —— 通过估计所玩游戏的子目标,来持续引导智能体的注意力。
  这种策略让智能体学习到更具普遍能力的策略。
  还有一个问题:如此广阔的游戏环境,什么样的游戏任务分布能产出最善于泛化的智能体呢?
  研究人员通过持续调整每个智能体的游戏分布发现,每个新任务都要基于通关的旧任务生成,不能太难,也不能太容易。
  这个也基本符合一般认知。
  它们先经历了四次迭代:
  每个任务由多个智能体参与竞争,在旧任务上适应得好的智能体,会带着权重、瞬时任务分布、超参数等参与到新一轮任务中继续学习。此时也会加入新的智能体让竞争"活"起来。
  智能体表现出明显的零样本学习能力
  最后生成的第五代智能体,在 XLand 4000 多个"星球"里玩了大约 70 万个游戏,每一个智能体都经历了 2000 亿次训练,完成了 340 万个独特任务。
  到了这个时候,这些智能体已经能够顺利完成每一项评估任务(除了少数即使是人类也不可能完成的)。
  整个实验也最终表明,通过开发像 XLand 这样的环境和这样开放式地训练方法,一些基于 RL 的智能体已表现出明显的零样本学习能力(0-shot)。
  比如使用工具、打拦(ridge-fencing)、"捉迷藏"、找立方体、数数、合作或竞争等。
  研究人员也观察到智能体们面对新任务时不知道"什么是最好的解决办法",但它们会不断地试验直到达到目标。
  这个过程中出现的有趣的"紧急启发式行为",除了开头提到的搭梯子,还有这个临时更换更简易目标的例子 ——
  在一个游戏中该智能体需要从 3 个目标中任选一个完成:
  1、将黑色金字塔放到黄色球体旁边;
  2、将紫色球体放到黄色金字塔旁边;
  3、将黑色金字塔放到橙色区域。
  它一开始找到了一个黑色金字塔,想去完成目标 3,但在搬运过程中看到了黄色球体,于是它就在 1 秒内改变了主意,选择直接将金字塔放在黄色球体旁边完成目标 1。(整个过程一共耗时 6 秒)
  最后,看完了 DeepMind 的研究,再抛给大家一个问题:我们离真正的通用人工智能还有多远?
  (ps. 你发现了吗,文章最开头高台取金字塔任务中的小红智障体就不行,一直打转,面对小蓝搭好的梯子甚至直接毁掉)
  论文地址:
  https://arxiv.org/abs/2107.12808
  参考链接:
  https://deepmind.com/blog/article/generally-capable-agents-emerge-from-open-ended-play

苏宁极物小Biu空调开售,前1万台秒售罄IT之家3月6日消息今日上午10点,苏宁极物小Biu空调正式开售,主打互联网智能体验,1。5匹一级能效全直流变频智能操控,前10000台售价1999元。根据苏宁公布的数据,享受19苏宁极物小Biu空调价格曝光前1万台尝鲜价1999元IT之家2月25日消息今日凌晨,苏宁极物小Biu空调开启0元预约活动,最终销售价2499元,预约用户可在3月6日上午1000开始付款抢购,前10000台到手价1999元。据介绍,苏全球首个中性AI声音推出不是男性也不是女性IT之家3月17日消息几乎所有的虚拟助手都有一个共同之处默认声音为女性。据TechCrunch消息,Vice传媒旗下的创意机构Virtue推出了一种无性别的AI语音,定名为Q。ViAI种黄瓜大赛微软第一,腾讯第二IT之家12月17日消息此前在荷兰瓦赫宁根大学及研究中心举行的一场黄瓜种植比赛中,微软研究院成员与荷兰和丹麦的大学生共同赢得这场比赛。据了解,这场比赛的选手包括腾讯英特尔园艺专家微人工智能乌托邦迪拜认为未来人类应该这样生活不同于硅谷老牌的科技力量,迪拜一直是独特的存在。他们日益崛起的科技实力正在被验证,无论是全面AI化的基础建设和城市治安力量,还是频频登上全球科技头条的机器人警察和空中出租车,迪拜试日本推3DCG美少女导航系统还会说中文IT之家10月18日消息上周NTTDoCoMo官方发布了一个Demo,展示了使用3DCG制作的女子高中生形象的导航系统。官方将这位少女命名为沙耶(Saya)。得益于精良的3DCG技唐沐小爱触屏音箱应该在米粉节正式开售IT之家3月13日消息今日,小米智能硬件部总经理唐沐thomas表示,小爱触屏音箱应该会在米粉节正式开售(4月6日)。在小米9发布会的最后,雷军发布了小爱触屏音箱,官方称4英寸屏迷出门问问发布TicWatchPro4G版智能手表1799元IT之家11月28日消息今天,出门问问发布了TicWatchPro4G版智能手表,TicWatchPro4G版售价1799元,12月1日正式通过出门问问官网天猫京东及全国各地线下小小米电视销量公布2018年第四季度稳居中国第一感谢IT之家网友学士的线索投递!IT之家3月1日消息根据群智咨询最新发布的数据显示,小米电视在2018年第四季度中国市场出货量达300万台,中国市场第一,同比增长112。更早之前,用户亚马逊智能音箱Alexa出bug,收到陌生人1700条语音北京时间12月20日晚间消息,据德国媒体报道,由于亚马逊的人为错误,导致德国一位Alexa智能音箱用户听到了另一名用户的1000多条录音。该报道称,一名德国用户要求回听Alexa智迷你版索菲娅机器人亮相,能教编程1月31日消息,据VentureBeat报道,超逼真的机器人索菲娅(Sophia)曾在许多场合露面,引发巨大轰动。如今,索菲娅的开发公司HansonRobotics推出了迷你版索菲
三星目标明年销售200万台MiniLED电视4K分辨率,四款机型IT之家10月2日消息虽然三星目前的高端电视系列使用了QLED技术,但该公司正在为其未来的电视研发多种技术。三星已经推出了一些使用microLED技术的电视,而且还在研发基于Min三星NEON人工智人细节曝光酷似人类的虚拟人IT之家1月6日消息最近一段时间,三星官方频繁为NEON预热,此前官方也提到该技术和人工智人有关近日,三星NEON的更多细节曝光。viaPranavMistry1月4日一网友称在源苹果watchOS9正式发布更多个性化表盘,适用于AppleWatchS4及后续表款(附官方解读)IT之家6月7日消息,今日凌晨,苹果召开WWDC22全球开发者大会,正式发布了全新watchOS9系统。watchOS9拥有更多的表盘选择,增强了个性化体验。四款新表盘包括描绘阳历三款谷歌PixelWatch智能手表获得蓝牙认证IT之家4月28日消息,近期出现了很多关于谷歌PixelWatch智能手表的传闻,真机图此前也已经泄露,图片显示其显示屏是圆形的,边缘也比较圆润。现在,三款新型号分别为GWT9RGDeepMind两年研究一朝公开,通用人工智能最新突破一个模型一套权重通吃600视觉文本和决策任务感谢IT之家网友Sancu的线索投递!通用人工智能,还得看DeepMind。这回,只一个模型,使用相同的权重,不仅把看家本领雅达利游戏玩得飞起。和人类聊聊天看图写话也不在话下。甚至AI齿科成像技术在加拿大获批,可识别三十余种齿科疾病齿科AI企业Diagnocat研发的一款面向齿科专业人士的人工智能软件,近日在加拿大获批,该软件可通过X光和锥束计算机断层扫描(CBCT)识别30多种常见的齿科疾病,包括龋齿牙石根AI律师,在线诈骗TechTalks创始人,软件工程师BenDickson近来遭遇了一场诈骗。一位律师NicolePalmer称他侵犯了自己客户的知识产权,要求他在发布的内容里为客户署名并加上链接,华为昇思MindSpore蛋白质结构预测模型超越AlphaFold2,拿下全球竞赛第一IT之家4月23日消息,据华为官网,基于全场景AI框架昇思MindSpore开发的蛋白质结构预测模型近期在全球持续蛋白质结构预测竞赛CAMEO(ContinousAutomatedMeta开始为元宇宙测试赚钱工具,助用户出售数字资产北京时间4月12日消息,Facebook母公司Meta周一在一份声明中表示,该公司将开始测试在其虚拟现实(VR)社交平台HorizonWorlds中出售数字资产的商业工具。Hori郭明錤VR顶流产品MetaQuest2头显将推出Pro版本,配备两块miniLED屏IT之家4月11日消息,根据天风国际分析师郭明錤的消息,Meta公司的OculusQuest2头显似乎要推出Pro版本,而不是下一代OculusQuest3。郭明錤表示,Oculu发力头戴式AR,高通骁龙Spaces面向全球开发者开放下载IT之家6月2日消息,昨日,高通技术公司宣布面向全球开发者开放SnapdragonSpacesXR开发者平台下载。IT之家了解到,高通SnapdragonSpaces于2021年1