范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

2000亿次训练,只为能让AI自学新游戏

  据外媒报道,Open-Ended Learning Team(开放式学习小组)在 Deepmind 的 Blog 上发表了一篇关于训练一个无需与人类交互数据就能玩不同游戏的 AI 智能体(AI agents)的文章。
  一般来说,需要先给智能体提供一部分新游戏的数据,再让它自我进行游戏训练,从而在该游戏中取得更好的成绩。但目前的智能体,如果不从头开始学习,它就无法完成新游戏或新任务。团队的目的是省略前面的步骤,创造出的智能体能直接在新游戏中自我探索,并在复杂的游戏环境中取得好成绩。
  ▲ AI agents
  团队希望该文章能提供给其他研究人员另一条新思路,以创造更具适应性(more adaptive)、普遍能力(generally capable)更强的 AI 智能体。同时,他们邀请感兴趣的人士一同加入研究。一、专门为训练 AI 造了个游戏场地
  当 AI 智能体在训练游戏时,缺乏数据(每个游戏的数据都是单独的)是导致强化学习(reinforcement learning,RL) 效果不佳的主要原因。这就意味着如果想让智能体可以完成所有任务,就需要让它把每一款游戏(任务)都训练了,否则它们在遇到新游戏的时候就只能"干瞪眼"。
  团队创建了一个 3D 游戏环境,称之为"XLand",该环境能够容纳多位玩家共同游戏。这种环境使得团队能够制定新的学习算法,而这种算法能动态地控制一个智能体进行游戏训练。
  ▲ Xland
  因为 XLand 可以通过编程指定(programmatically specified),所以该游戏空间能够以自动和算法(automated and algorithmic)的方式生成数据(该数据可以训练智能体)。同时,XLand 中的任务涉及多个玩家,其他玩家的行为会加大 AI 智能体所面临的挑战。这些复杂的非线性交互(随机性)为训练提供了理想的数据源,因为有时训练环境中的微小变化可能会给智能体带来不一样的挑战。二、任务难度要"刚刚好"
  团队研究的核心是深度强化学习在神经网络中的作用(尤其是在智能体的训练中)。团队使用的神经网络结构(neural network architecture)提供了一种关注智能体内部循环状态(internal recurrent state)的机制,通过预测智能体所玩游戏的子目标(subgoals)来帮助引导智能体的注意力(预测游戏任务并引导智能体前往)。团队发现这个目标关注智能体 (goal-attentive agent,GOAT) 有学习了一般能力的政策的能力(GOAT 方案使得智能体更具适应性)。
  ▲ 预测智能体的子目标
  团队还预测任务训练的难度会影响智能体的总体能力。因此,他们使用动态任务生成(dynamic task generation)对智能体的训练任务分配进行更改,并不断优化,生成的每个任务既不是太难也不是太容易,而是刚好适合训练。在这之后,他们使用基于群体的训练 (population based training,PBT) 来调整动态任务的生成参数,以提高智能体的总体能力。最后,团队将多个训练运行串联在一起,这样每一代智能体都可以从上一代智能体中启动(智能体迭代)。三、智能体有启发式行为?
  团队在对智能体进行了五代训练后,发现其学习能力和性能都在持续提升。在 XLand 的 4,000 个世界中玩过大约 700,000 个游戏后,最后一代的每个智能体都经历了 2000 亿次(200 billion)训练步骤,得到了 340 万(3.4 million)个任务的结果。
  目前,团队的智能体已经能够顺利完成每次程序生成的测试任务,而且测试数据显示,智能体的能力(相比于上一代)有了整体的提高。
  除此之外,团队还发现智能体表现出一般的启发式行为(heuristic behaviours),如实验(experimentation),该行为出现在于许多任务中,而不是专门针对单个任务的行为。团队有观察到智能体在游戏中使用不同的工具,包括利用障碍物来遮挡自己、利用物品创建坡道。随着训练的进展,智能体还偶尔会出现与其他玩家合作的行为,但目前团队还不能确认这是否是有意识的行为。结语:"自学"让 AI 更智能
  Open-Ended Learning Team 正在训练一个新的智能体,它不需要从头开始训练数据,就能适应新的游戏。这个智能体将比仅使用强化学习方法的智能体更加"智能"。
  大量的数据训练一直以来是人工智能发展绕不开的难题,此次如果能大量减少训练数据,并使其获得跨领域的自主学习能力,那么人工智能的能力将能得到进一步的提升。

谷歌TensorFlow新模块推出几行代码,提高AI模型隐私性北京时间3月7日晚间消息,据美国科技媒体TheVerge报道,谷歌今日为其机器学习框架TensorFlow发布了最新的模块,开发者只需添加几行额外的代码,就能提高其AI模型的隐私性报告欧洲40的人工智能创业公司实际上没用人工智能人工智能是当今技术中最被滥用的术语之一,而一项新的研究证实了该技术的炒作方式。TheVerge援引了伦敦风险投资公司MMC的调查,40被归类为人工智能公司的欧洲初创公司实际上并没有换脸视频后AI又出偏门应用用算法脱掉女性衣服北京时间6月27日早间消息,据美国科技媒体Motherboard报道,一名程序员最近开发出一款名叫DeepNude的应用,只要给DeepNude一张女性照片,借助神经网络技术,Ap美国机器人产业的倒悬之急在2017全球最有影响力的50家机器人公司中,美国公司占据多数。但是,当前美国机器人产业正面临诸多不利,其增长将受到负面影响。苹果首席执行官蒂姆库克和美国总统特朗普2018年7月曾李世石解释退役原因输给AI打击太大IT之家11月29日消息11月19日,36岁的李世石向韩国职业棋院提交辞呈,结束了职业棋手生涯。11月25日,李世石接受韩媒采访,称AI无法超越人类的同时,也表示实力越来越强的AI1699元,小米推出米家智能门锁联动全屋智能家居设备IT之家6月11日消息今天下午小米在北京举行了小米手环4暨米家智能新品发布会。会上,小米发布了小米米家智能门锁,推拉结构一步开门,联动全屋智能家居设备,6月28日10点开售,售价1Waymo自动驾驶出租车体验据国外媒体报道,谷歌母公司Alphabet旗下的自动驾驶汽车公司Waymo目前在加州凤凰城以及硅谷地区运营其自动驾驶出租车。近日有媒体对最近两个月期间10500次出行的乘客反馈进行凭什么天猫精灵CC这么受欢迎作为一款智能音箱设备,天猫精灵CC自发布以来便备受消费者追捧,来自天猫精灵官方的战报显示,截止6月2日24点,天猫精灵618累计销量已经达到了113万台,天猫精灵CC斩获天猫消费电如何将天猫精灵方糖R玩的更潮酷?今年4月份,阿里巴巴人工智能实验室正式发布了天猫精灵CC天猫精灵方糖R等多款人工智能语音音箱设备,在618来临之际,天猫精灵也开启了促销活动,其中天猫精灵CC最高直降200元,而天从魔岩灰到波普设计,天猫精灵方糖的调性之路人们什么都挂,几乎是到了接受任何湿淋淋的画布的地步,而人们也习惯于这种做法,其中他们都恨的是商业艺术。这是上世纪60年代美国艺术家罗伊利希滕斯坦在描述自己所践行的事业时所说的话。湿天猫精灵CC方糖R已发售,最高立减200元4月18日,阿里巴巴人工智能实验室正式发布了天猫精灵CC天猫精灵方糖R两款产品,目前均已经开售,临近618期间,两款产品也开启了不同程度的限时降价促销活动,其中天猫精灵CC最高直降
小米预热高端无线吸尘器,今晚发布会见IT之家3月30日消息小米春季新品发布会第二场将于3月30日晚1930准时召开,今日小米智能生活发布海报,预了全新的小米米家高端无线吸尘器。从海报中可以看出,吸尘器采用滚筒吸头,透realme真我小夜灯发布甜甜圈造型,首发价49元IT之家5月25日消息在正在举行的真我心跳618发布会上,realme发布了一款realme真我小夜灯,采用甜甜圈造型,十分可爱,首发价49元。IT之家了解到,realme真我小夜首次超越人类读图会意这件事,AI比你眼睛更毒辣在超越人类这件事上,AI又拿下一分。就在最近,国际权威机器视觉问答榜单VQALeaderboard,更新了一项数据AI在读图会意任务中,准确率达到了81。26。要知道,我们人类在这AI读图会意首超人类,阿里巴巴达摩院刷新全球VQA纪录IT之家8月13日消息据财联社,国际权威机器视觉问答榜单VQALeaderboard在近日出现关键突破,阿里巴巴达摩院的AliceMind以81。26的准确率创造了新纪录,让AI在央视揭秘中国乒乓球队强大背后的科技力量大数据分析出伊藤美诚受身高限制IT之家8月11日消息据央视财经报道,在孙颖莎与伊藤美诚进行半决赛的争夺时,有一个部署在东京的人工智能平台正监视着这场比赛。IT之家了解到,日本女子乒乓球队选手伊藤美诚的每一次发球小米米家充气宝1S今日开售5种充气模式,199元IT之家7月6日消息小米在近日新推出了米家充气宝1S,该产品内置5种充气模式,可为球类自行车摩托车轿车等充气。米家充气宝1S售价为199元,已在今日开售。IT之家了解到,小米米家充欧盟拟收紧AI应用监管规则违规公司或面临相当于营收6的罚款北京时间4月21日早间消息,据报道,欧盟委员会定于周三公布的一份修订文件显示,如有公司违反欧盟规则使用被禁止的人工智能(AI)应用,则可能面临最多相当于其全球营业额6的罚款,高于此realme电视印度爆火10分钟卖15000台IT之家6月7日消息Realme最近在印度推出了两款智能产品RealmeSmartTV和RealmeWatch,两款产品销售火爆,其中RealmeSmartTV在短短10分钟内售出小米有品众筹云米互联网浴霸类空调暖风方式,售价599元IT之家4月1日消息小米有品平台今日起正式开始众筹云米互联网浴霸。这款产品安装在吊顶内部,采用类似空调暖风的方式进行供热,功率可达2488W,众筹价599元。云米互联网浴霸相比传统韩国现代在工厂中测试波士顿动力公司机器狗,负责安全巡逻9月17日消息,韩国现代汽车集团周五表示,该公司已经启动了一个试点项目,在其工厂部署美国机器人初创公司波士顿动力(BostonDynamics)的机器狗帮助检查安全,这是双方的首次北大正式成立智能学院,AI视觉大牛朱松纯任院长AI大牛朱松纯回国后的动向备受关注,最近又有一则新消息据消息人士透露,朱松纯将担任新成立的北京大学智能学院院长一职。朱松纯3次获得计算机视觉领域的最高奖项马尔奖,可以说是CV领域的