教AI逐帧搓招玩铁拳通关最高难度,现在的街机游戏爱好者有点东西
现在的 AI 都开始学着逐帧搓招打街机了?《拳皇 98》《街头霸王》《死或生》…… 一干童年回忆全都玩了个遍,其中还有号称要打 5000 场才能入门的 3D 格斗游戏《铁拳》:
没错,就是那个对新手极不友好的《铁拳》,随便拉一张角色的搓招表感受一下这个复杂度:(没错,各种压帧判定的 JF 技就是其特色之一)
▲铁拳 TT2 出招表
但 AI 偏偏就能在入坑没多久就通关了最高难度:
▲左侧为 AI
这款 AI 的背后是一位个人开发者,也是一位骨灰级的街机游戏爱好者。他训练出来的新手"铁匠"在 Reddit 的"比赛录播"已经有近 500 的热度 :
强化学习训练框架
这位 AI 铁匠的背后,是一个叫做 DIAMBRA Arena 的强化学习交互框架。DIAMBRA Arena 提供了多个强化学习研究和实验环境,具有情节性的强化学习任务,由离散的动作(如游戏手柄按钮)和屏幕中的像素和数据(如人物血条)组成。
在这一框架中,智能体会向环境发送一个动作,环境对其进行处理,并相应地将一个起始状态转换为新状态,再将观察和奖励返回给智能体,以此交互循环:
要实现上述循环的代码也非常简单:importdiambraArena #Mandatorysettings settings={} settings["gameId"]="do"#Gameselection settings["romsPath"]="/path/to/roms/"#Pathtoromsfolder env=diambraArena.make("TestEnv",settings) observation=env.reset() whileTrue: actions=env.action_space.sample() observation,reward,done,info=env.step(actions) ifdone: observation=env.reset() break env.close()
这一框架目前支持 Linux、Windows、MacOS 等主流的操作系统。而这款 AI 的"实战场"为早期的 Tekken Tag Tournament,当然,搓招复杂度完全不逊色于之后的新版本……
开发者选择了风间仁(Jin)和吉光(Yoshimitsu)两名具有代表性的角色作为主要操作对象。输入分别为:从 RGB 转换为灰度,并缩小到 128 x 128px 的游戏屏幕像素值、对战局数(Stage)、人物血条、游戏界面的一侧。
训练中的奖励是一个基于生命值的函数,如果对方生命值损伤则得到正面奖励,己方控制的角色生命值损失则得到负面惩罚。
同时,AI 的动作速率也被限定为最大速率的 1/10,即游戏中每 6 步发送一个动作。由于框架使用的是一种离散的动作空间,因此,智能体在训练中的同一时间只能选择一个移动动作 9 向上,向下等)或攻击动作(冲击,踢,出拳)。
因此,虽然一个连击组合的实战能力更强,但由于 AI 无法同时点击两个动作,在真实的对战中,便会出现 AI 频繁使用踢(Kick)和更换角色(swap)两个动作的情况:
评论区有资深 PVP 爱好者表示,想要看到这种顶级 AI 选手互虐的激烈场景,而开发者本人对此非常赞同:
我们正在创建一个平台,在这个平台上,程序员将提交他们训练有素的 AI 并互相对抗,并在我们的频道上播放比赛。
AI 锦标赛
现在,开发者团队已经开始正式筹备这个"AI 游戏锦标赛",背后的程序员和开发者们相当于是"教练"或者"选手家长",最终的获胜者可获得 1400 瑞士法郎(折合人民币 9261 元)。
"比赛项目"也不止是铁拳一种,开发者表示,这些格斗游戏的底层机制都比较类似,只需要修改一下组合技、人物血条数值等游戏的差异性属性。
所以,他们的 DIAMBRA Arena 框架面向各类街机视频游戏提供完全符合 OpenAI Gym 标准的 Python API。像死或生、街头霸王等多个流行的街机游戏都被囊括其中:
GitHub 链接:
https://github.com/diambra/diambraArena
视频链接:
https://www.youtube.com/watch?v=9HAKEjhIfJY
参考链接:
[1]https://www.reddit.com/r/reinforcementlearning/comments/sq1s3f/deep_reinforcement_learning_algorithm_completing/
[2]https://www.reddit.com/r/MachineLearning/comments/sqra1n/p_deep_reinforcement_learning_algorithm/
天猫精灵Queen,是将它背后的万千女性当做Queen今天下午,天猫精灵在北京举行了2019年春季新品发布会,天猫精灵正式推出了旗下首款带屏音箱天猫精灵CC,以及首款智能语音美妆镜天猫精灵Queen,这两款产品在发布会之前其实相信不少
一张图看懂小米电视分类IT之家12月3日消息小米电视已经出到了第五代,各种型号繁杂,有很多用户可能傻傻分不清,今天小米电视官方给出了选购指南,让你一图了解各型号小米电视的主要区别。根据官方的分类,小米电
随着谷歌的领先,苹果的人工智能战略在哪里?北京时间6月6日消息,谷歌在上个月举行的IO大会上展示了下一代谷歌助理(GoogleAssistant)强大而流畅的处理功能,吸引了众多与会者的关注。苹果则在日前举行的开发者大会上
荣耀智慧屏还没上市,创维三星海信已在电商占位智慧屏关键词IT之家7月17日消息7月15日,荣耀总裁赵明正式宣布荣耀将推出第一款荣耀新品类荣耀智慧屏,这也意味着华为正式进军电视机领域。现在,创维和三星分别在京东的商品描述里加入了智慧屏的关
Echolac京东618超级旅行日日式智能拉杆箱券后低至951元Echolac京东618超级旅行日,领全场6。8折优惠券,日式智能拉杆箱券后低至951元点此前往京东618神券汇集有你所需点此领取红包。京东618京喜红包每天抽3次点此领红包。(可
刘作虎用AndroidTV重新定义流畅IT之家8月29日消息今日,一加CEO刘作虎在一加社区海外版发文称,自从宣布将推出OnePlusTV以来,许多人都问我会使用什么操作系统,经过长时间的讨论和研究,我们决定使用And
成精了MIT迷你猎豹机器人竟会做后空翻IT之家3月3日消息麻省理工学院近日展示了最新版本的迷你猎豹四足机器人MiniCheetah,带来了一个新的技巧后空翻。机器人做后空翻并不是什么新鲜事,波士顿动力公司的大得多的阿特
MIT投资10亿美元开设AI学院发力人工智能,明年秋季开学10月16日消息,当地时间周一,麻省理工学院宣布投资10亿美元开设一所新的人工智能学院,其根据主要捐赠者的名字被命名为苏世民计算学院,主要目标是推进人工智能在各个学科领域的广泛应用
MIT新研究AI让每个人设计衣服成为现实据国外媒体报道,3D打印机的日益普及以及Thingiverse和Shapeways等公司的出现,给了制造商前所未有的力量,让它们能够创造出从角色扮演配饰到替换零件的各种东西。但是,
德国拟用人工智能打击儿童色情犯罪IT之家8月6日消息据新华社报道,昨日,德国北莱茵威斯特法伦州(简称北威州)宣布,他们正在与微软合作,开发新的人工智能技术,可以自动检测互联网上的儿童色情内容。据悉,打击儿童色情犯
日本现AI竞争恐慌情绪,面向全球招揽人才8月5日消息,由于日本担心没有足够的人工智能人才,大金创建了自己的项目。日本公司和政府内部弥漫着一种恐慌感这个世界第三大经济体没有足够的人工智能人才。是时候采取行动了。软银集团(S