范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

2000亿次训练,只为能让AI自学新游戏

  据外媒报道,Open-Ended Learning Team(开放式学习小组)在 Deepmind 的 Blog 上发表了一篇关于训练一个无需与人类交互数据就能玩不同游戏的 AI 智能体(AI agents)的文章。
  一般来说,需要先给智能体提供一部分新游戏的数据,再让它自我进行游戏训练,从而在该游戏中取得更好的成绩。但目前的智能体,如果不从头开始学习,它就无法完成新游戏或新任务。团队的目的是省略前面的步骤,创造出的智能体能直接在新游戏中自我探索,并在复杂的游戏环境中取得好成绩。
  ▲ AI agents
  团队希望该文章能提供给其他研究人员另一条新思路,以创造更具适应性(more adaptive)、普遍能力(generally capable)更强的 AI 智能体。同时,他们邀请感兴趣的人士一同加入研究。一、专门为训练 AI 造了个游戏场地
  当 AI 智能体在训练游戏时,缺乏数据(每个游戏的数据都是单独的)是导致强化学习(reinforcement learning,RL) 效果不佳的主要原因。这就意味着如果想让智能体可以完成所有任务,就需要让它把每一款游戏(任务)都训练了,否则它们在遇到新游戏的时候就只能"干瞪眼"。
  团队创建了一个 3D 游戏环境,称之为"XLand",该环境能够容纳多位玩家共同游戏。这种环境使得团队能够制定新的学习算法,而这种算法能动态地控制一个智能体进行游戏训练。
  ▲ Xland
  因为 XLand 可以通过编程指定(programmatically specified),所以该游戏空间能够以自动和算法(automated and algorithmic)的方式生成数据(该数据可以训练智能体)。同时,XLand 中的任务涉及多个玩家,其他玩家的行为会加大 AI 智能体所面临的挑战。这些复杂的非线性交互(随机性)为训练提供了理想的数据源,因为有时训练环境中的微小变化可能会给智能体带来不一样的挑战。二、任务难度要"刚刚好"
  团队研究的核心是深度强化学习在神经网络中的作用(尤其是在智能体的训练中)。团队使用的神经网络结构(neural network architecture)提供了一种关注智能体内部循环状态(internal recurrent state)的机制,通过预测智能体所玩游戏的子目标(subgoals)来帮助引导智能体的注意力(预测游戏任务并引导智能体前往)。团队发现这个目标关注智能体 (goal-attentive agent,GOAT) 有学习了一般能力的政策的能力(GOAT 方案使得智能体更具适应性)。
  ▲ 预测智能体的子目标
  团队还预测任务训练的难度会影响智能体的总体能力。因此,他们使用动态任务生成(dynamic task generation)对智能体的训练任务分配进行更改,并不断优化,生成的每个任务既不是太难也不是太容易,而是刚好适合训练。在这之后,他们使用基于群体的训练 (population based training,PBT) 来调整动态任务的生成参数,以提高智能体的总体能力。最后,团队将多个训练运行串联在一起,这样每一代智能体都可以从上一代智能体中启动(智能体迭代)。三、智能体有启发式行为?
  团队在对智能体进行了五代训练后,发现其学习能力和性能都在持续提升。在 XLand 的 4,000 个世界中玩过大约 700,000 个游戏后,最后一代的每个智能体都经历了 2000 亿次(200 billion)训练步骤,得到了 340 万(3.4 million)个任务的结果。
  目前,团队的智能体已经能够顺利完成每次程序生成的测试任务,而且测试数据显示,智能体的能力(相比于上一代)有了整体的提高。
  除此之外,团队还发现智能体表现出一般的启发式行为(heuristic behaviours),如实验(experimentation),该行为出现在于许多任务中,而不是专门针对单个任务的行为。团队有观察到智能体在游戏中使用不同的工具,包括利用障碍物来遮挡自己、利用物品创建坡道。随着训练的进展,智能体还偶尔会出现与其他玩家合作的行为,但目前团队还不能确认这是否是有意识的行为。结语:"自学"让 AI 更智能
  Open-Ended Learning Team 正在训练一个新的智能体,它不需要从头开始训练数据,就能适应新的游戏。这个智能体将比仅使用强化学习方法的智能体更加"智能"。
  大量的数据训练一直以来是人工智能发展绕不开的难题,此次如果能大量减少训练数据,并使其获得跨领域的自主学习能力,那么人工智能的能力将能得到进一步的提升。

灵明光子发布国内首款采用3D堆叠技术的dToF传感芯片IT之家7月13日消息深圳市灵明光子科技有限公司今日发布了国内首款采用全球先进背照式3D堆叠工艺技术的dToF单光子成像传感器(SPADimagesensor,SPADIS),综合399元,小米发布小爱音箱Art电池版全新黑金配色大容量电池,1600万种渐变流光灯效IT之家10月29日消息今日,小米正式推出了小爱音箱Art电池版,内置4850mAh大容量电池,售价399元,将于11月1日全渠道开售。IT之家了解到,音质方面,小爱音箱Art电池小米手环5固件曝产品外观没有挖孔屏,支持血氧检测IT之家5月26日消息今天XDA报道称,他们从小米穿戴APP的APK文件解密了一组疑似小米手环5的渲染图。从曝光的图片看,小米手环5与上一代产品整体外观非常相似,并没发现此前传闻的小米手环6微信支付功能正式上线IT之家8月18日消息今日小米手环6系列发布了V1。0。4。38版本新固件,正式带来了微信支付功能。该功能通过在手环上显示二维码条形码进行支付,可以设置每日扣款限额,并支持添加快捷小米运动小米穿戴小米健康App未来将合并成一个,新品已在路上IT之家7月23日消息小米于7月21日在小米社区平台举办了负责人在线活动,小米智能穿戴的四名负责人在线解答米粉的问题。小米可穿戴部总经理高原表示,团队正在打通小米运动和小米穿戴的数华为手环6将于27日零点再次开售,269元起IT之家4月26日消息华为手环6国行版于4月8日正式发布。这款产品搭载1。47英寸AMOLED大屏,支持心率血氧监测功能。这款产品将于4月27日零点再次开售,标准版269元,NFCFitbitLuxe智能手环渲染图曝光颜值更高,不锈钢外壳IT之家4月17日消息根据德国媒体爆料,FitbitLuxe智能手环的一组渲染图近日得到曝光。这款产品相比上一代Ace3手环颜值有了巨大提升,外观更加简洁,采用不锈钢外壳制造,搭载Amazfit快乐鸭儿童健康手表今日开售4G视频通话自研芯片,749元IT之家8月18日消息华米科技近日正式发布了Amazfit快乐鸭儿童健康手表。这款产品搭载华米自研的黄山1号芯片,支持4G全网通,正面搭载摄像头支持视频通话。今日该产品正式开售,首AppleWatch新专利随身监测你的身体是否缺水8月19日消息,本周二,苹果一项用于AppleWatch的新专利获得美国专利商标局授权。该技术可以使用AppleWatch追踪用户身体的水分情况,帮助用户更好的管理水分的摄入量。以华为联合40余家合作伙伴发布昇腾智造等四大行业解决方案IT之家7月11日消息在2021世界人工智能大会(WAIC)昇腾人工智能高峰论坛上,华为联合40余家合作伙伴发布了昇腾智造昇腾智城昇腾智行昇腾智巡四大行业人工智能解决方案。IT之家华为手环6正式发布全天候血氧监测,269元起IT之家4月8日消息华为手环6此前于海外发布,今晚该产品国行版正式发布。这款产品采用类似华为WatchFit的外观设计,搭载1。47英寸方形AMOLED全面屏,相比上一代产品显示面
IBM推出AutoAI允许企业人工智能模型开发自动化由于IBMWatsonStudio(之前的DataScienceExperience)等产品,部署AI应用和服务并不像以前那样具有挑战性。于2017年首次亮相的WatsonStud小爱蓝牙音箱随身版开启预约售价49元IT之家11月19日消息小爱蓝牙音箱随身版现已在小米商城开启开启预约,售价为49元。小爱蓝牙音箱随身版整机重量为52g,和一枚鸡蛋的重量相似。长按或者短按机身底部的语音激活按钮可以讯飞同声字幕功能上线,追剧自带中英双语实时字幕IT之家5月26日消息根据讯飞官方的消息,讯飞翻译机3。0针对线上跨语言交流场景,新增同声字幕功能,官方称可以实现追剧自带中英双语实时字幕。IT之家了解到,讯飞称讯飞翻译机3。0既讯飞推两款语音转写新品识别率达98,299元起IT之家5月25日消息今天,科大讯飞智能录音转写赛道正式发布2款新品讯飞智能录音笔A1讯飞会议宝S8,预售价格分别为299元和589元,这是自2019年5月讯飞首款智能录音笔上市后小米有品上架众筹新品水槽净洗机与AI录音笔IT之家8月13日消息日前,小米有品相继上架了多款众筹新品,包括墨案AI录音笔与美仕杰水槽净洗机。墨案AI录音笔墨案AI录音笔支持蓝牙BLE5。0,内置300mAh电池,配备16G智能音箱大混战赔本的买卖何时盈利?天猫精灵,把空调关了小度小度,今天天气如何小爱同学,打开窗帘如今,智能音箱不再是一个边缘化的产品,随着产品价格越来越低内容越来越丰富功能越来越智能,琳琅满目的智能音箱产品逐渐进入大RealmeTV仓库谍照曝光证实屏幕规格为43英寸IT之家5月14日消息Realme即将推出的电视产品已经被多次曝光,早在二月份的时候,我们就已经在BIS认证平台上看到了它的身影。最近,这款电视也获得了谷歌和蓝牙SIG平台的必要认小米自研超级拟人技术,雷军喊出了180000米粉的名字IT之家8月14日消息在小米手机十周年之际,小米将3。7亿元返还给小米手机1首批用户,每人赠送1999元无门槛红包。据小米公司公众号消息,雷军还为初代小米手机用户录了一段话,而实际苹果HomePod上季度出货量仅为160万台,市占率不增反降IT之家2月21日消息外媒StrategyAnalytics近日一份智能音响报告指出,苹果在去年2月推出的智能音响HomePod第四季出货量较上一季增长45,为160万台。不过市占相约跨年12月31日起,小米小爱音箱将支持召唤微软小冰IT之家12月26日消息微软小冰大家都不陌生,作为小娜的妹妹,小冰一直以精灵古怪的形象示众。不久前小爱同学更新3。5版本之后,新增支持QQ音乐,召唤小冰尝鲜版上线,但是小米官方并没报告AppleWatch继续引领可穿戴市场,本季度出货1620万台IT之家3月5日消息外媒appleinsider引用IDC数据,表示苹果继续领跑可穿戴设备市场,AppleWatch,AirPods和Beats耳机的销售帮助苹果保持其在2018年