范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

1亿用户在王者荣耀,为腾讯AI打工

  (图片来源:腾讯开悟平台官网)
  文/Renee
  编辑/Emma
  要是知道马斯克的自动驾驶系统可能是基于赛车游戏打造的,你是否会感到意外?
  2017年,OpenAI 宣布旗下的开源人工智能测试环境 Universe 加入了游戏大作《侠盗猎车手5》,让AI能够在短时间内获得准确识别各种物体和突发情况的能力。
  原因在于,现实生活中,无人车摄像头感知到的其实也就是一张二维图片。游戏场景里的物体如果和现实非常相似,就能通用。
  我们无法知晓特斯拉自动驾驶系统"含游戏量"有多少,不过主要靠着游戏锻炼AI的Deepmind已成功为游戏"正名": 2016.7,DeepMind团队的AlphaGo经过大量的棋牌策略类游戏数据训练,击败了世界围棋冠军柯洁; 2022.10,DeepMind团队的AlphaTensor在没有任何现有矩阵乘法算法的知识的情况下,在团队给出的游戏场景中反复练习,从而重新演化对于矩阵乘法的算法探索,在一个有限域中改进了Strassen(历史最快算法)的二阶算法。
  由此,DeepMind团队成功将游戏的触角伸到了学术界。
  目前,腾讯也有此意:2022.11,腾讯"开悟"平台宣布正式开放"王者荣耀AI开放研究环境"申请。它将面向非商业用途的机器学习算法研究,提供业界独有的高复杂度MOBA训练环境,助力相关学术领域的前沿探索。
  也就是说,你天天休闲打的王者荣耀游戏,未来很有可能会为学术领域的前沿探索贡献一份力量。
  这,就不得不去思考,为何游戏能够成为AI的"训练场"?你打的王者荣耀要怎么为学术贡献力量?
  01  AI工作娱乐两不误
  目前,"AI+游戏"已经成为腾讯、网易等国内头部游戏企业发力的核心方向,三七、盛趣、完美、B站等,也都在探索AI+游戏的可能。
  为何大家都将游戏成为AI的主要测试平台?
  我们都知道,AI的终极目标是打造一个以假乱真的"真人",这就意味着,AI要有"性格、偏好"。也就是说,研究者们需要"摸透"AI的风格,并将其打造成自己想要的模样。
  DeepMind基于此,引入了联盟(League)训练概念(让AI模仿某真人打法与自己进行对抗),通过博弈对战的方式了解AI的"性情",各个大厂也都采取该路线。
  这就需要一定的指标去衡量AI或者真人的风格,也需要真人大量的数据展现自己的风格,让AI在某些方面增强,某些方面减弱,从而让AI完美复刻他人。
  游戏就成为了最佳"训练场"。
  第一,游戏能够提供多个指标去衡量AI表现情况,并塑造AI。
  每场比赛结束,提供的游戏时间、胜负、金钱、击杀时间、击杀个数等数据能够作为模型的特征,反应智能体AI的偏好:
  比如通过击杀个数可以判断其是否具有很强的战斗能力,通过短时间内的连杀数据可以判断其是否激进。基于此人们可以知道AI是个什么样的"人",从而进行改进。
  长此以往之后,玩家就能够通过配合度、激进度、防守能力等指标去"调整"AI的个性,也就是说AI能够"拥有"独特的性格。
  (AI多样化和个性化在游戏中的应用 图源:腾讯游戏学堂作者Yaqing)
  腾讯AI Lab游戏AI研发中心负责人付强在2021年的TGDC会议上也表明,所有的竞技游戏都是有明确的胜负指标,包括中间的核心指标,这些明确的指标会便于我们去测试和迭代,去塑造AI。
  第二,游戏环境能够提供丰富的场景及任务,锻炼AI做决策的能力,并从中得到海量数据。
  王者荣耀中就有对抗路、打野区、中路、游走、发育路五种发展场景,每个场景中的人都有自己的使命,例如打野区的人就需要疯狂打怪,从而为团队提升经济水平,游走的人就需要及时到达残血的队友身边为他"保驾护航",其他区域的人就需要高强度输出伤害,守好自己的"路"。
  在这场比赛中,玩家除了需要"各司其职",也需要和团队及时沟通战略,例如何时去打怪,何时去集体推搭,是打野怪和平发育还是抢人头激进发育,这都是需要短时间内根据现状做出最优决策。
  同时付强表示,游戏世界能够不管说是获取人类自己的数据,还是通过AI自己对战去生成的数据,从这个角度来说,虚拟世界比现实去获取这些数据的成本、其迭代的效率会高很多。
  除此之外,游戏世界试错成本要低得多。
  我们不妨设想一下,某公司的AI产品直接在你家门口道路上尝试自动驾驶,出事故的概率很难把握。而在游戏世界中试错几万次都无所谓。所以,通过构建虚实交融的环境,我们可以建设模拟城市交通的虚拟世界,将在虚拟世界中试错出来的最优策略迁移到现实世界。
  目前,游戏赋能AI不再是在游戏圈里"自嗨",也踏入了学术圈。
  今年10月,DeepMind团队的AlphaTensor在没有任何现有矩阵乘法算法的知识的情况下,在团队给出的游戏场景中反复练习,从而重新演化对于矩阵乘法的算法探索,在一个有限域中改进了Strassen(历史最快算法)的二阶算法。
  在该项成就的突破背后,游戏成为了它的"法宝"——据DeepMind团队透露,AlphaTensor便是从游戏系统设计中寻找灵感,通过树形搜索的方式,将矩阵乘法高效算法的问题转换为在单人游戏中寻求数学结果,而AlphaTensor的原型也是游戏出身的Alpha Go。
  腾讯也在积极布局之中,目前与北京大学、清华大学、电子科技大学、中国科学技术大学四所国内高校合作开发了创新课程,希望更多学者在游戏环境中探讨和研究AI落地难题,并寻找AI新技术覆盖更多场景的可能性,服务医疗、工业、农业、交通等行业。
  02  DeepMind,不只是AI游戏王
  从AlphaGo到AlphaTensor,DeepMind一直走在AI的前线。那么,DeepMind为何能够开创游戏哺育AI的先河?
  面对前所未有的领域,团队设立了重重门槛,去判断该AI项目是否值得研究。
  在开启项目前,DeepMind团队内部重点考核了三个问题: 这个AI项目能不能被归纳为某一大型组合化的状态空间(即所有可行方案的集)?如果不能的话,则难以使用专家系统来预设解决方案,而要使用"蛮力"来穷尽所有可行解决方案,将困难重重。 这个AI项目有没有清晰可量化的衡量标准,能让我们根据这个目标来逐步优化学习系统?比如,游戏的目标就是分数。 这个AI项目有没有充足的数据可供系统学习?
  游戏环境能够满足第2、3个问题,棋牌策略类游戏的解法能够满足第1个问题(所有的走法都是可以归纳的)。
  基于此,经过大量的棋牌策略类游戏数据训练,2016年AlphaGo击败了世界围棋冠军,同时发展出能够自我对弈的AlphaZero。
  但团队的野心不止于此——成为游戏的"王者"只能证明其把某个模型玩透了,而将游戏积累的经验数据去处理真实世界的问题,才是"诗和远方"。据团队创始人透露,最开始的 AlphaGo 和 AlphaZero 都是与游戏相关,但最终目标不仅仅是破解游戏,而是使用它们来引导通用学习系统,并应对现实世界的挑战。
  所以,DeepMind团队在做棋牌策略类的游戏之外,也在寻找"更具现实意义"的游戏。
  一款由华盛顿大学等机构联合开发蛋白质折叠游戏Foldit进入到DeepMind的视野。该游戏能够集中所有玩家的动力和精力,为蛋白质折叠研究做贡献。
  游戏的结果出乎意料:游戏玩得最好的往往不是生物学家,而是普通玩家,他们很可能比科学家更快破解出某种蛋白质的真实结构。一些由Foldit玩家破解出的重要蛋白质结构还发表到《Nature》杂志上。DeepMind团队给出的解释是,有些玩家有着非常出色的直觉。
  基于此,在2016年,DeepMind团队启动AlphaFold项目,人工构建系统模拟这些玩家的"直觉"。
  在今年的7月28日,欧洲生物信息学研究所(EMBL-EBI)通过 AlphaFold 成功预测了超过 100 万种生物的 2.14 亿个蛋白质的三维空间结构,涵盖了地球上几乎所有已知的蛋白质,再次突破了AI界的边界。
  有了AlphaGo、AlphaFold这样"明星"产品后,DeepMind野心就藏不住了,这两个产品还不够优秀——只能是某一个领域的佼佼者,其他领域就是个小白,而DeepMind需要的是会举一反三的AI智能体。
  于是在2021年,DeepMind发布了包含数十亿任务的游戏"元宇宙"XLand平台。
  (DeepMind游戏元宇宙框架 图源:DeepMind官网)
  在这个游戏"元宇宙"中,无数的"游戏星球"组成了"游戏星系",每个星球上的游戏按竞争性、平衡性、可选择性、探索难度四个纬度进行区分。
  比如下图,左边的游戏双方需要将小球赶到自己的区域才算获胜,"不是你死就是我亡",一点合作的机会都没有,所以它的竞争性指标直接被拉满了;而右图的游戏,则是要求将几何体按颜色归类到一起,多个智能体合作完成任意一组配对就可以,所以竞争性很低,但是可选择性很强。
  (DeepMind游戏元宇宙模块详情 图源:DeepMind官网)
  在锻炼竞争性、平衡性、可选择性、探索难度的综合实力的同时,为了让智能体获得更加泛化的能力,研究人员设定在学习时,每个新任务都要基于通关的旧任务生成,保持学习的连续性。
  目前该项目还在苦苦内测中——第五代智能体在XLand 4000多个"星球"中共玩了70万个游戏,经历了2000亿次训练,完成了340万个独特任务。
  DeepMind从一开始,就为自己的AI研究设立了明确的标准,从可行性最高的游戏开始做起,防止陷入"超前"的漩涡;同时有着更为长远、现实的目标:游戏AI并非只为了让AI更会玩,而是为了更好赋能现实世界,对医疗、交通、工业机器人等领域有所帮助。
  如今,能够找到"数理化"相通性的泛化机器人,成为DeepMind下一个发展目标。
  03  腾讯,跟着DeepMind过河?
  与DeepMind相同,腾讯也从游戏出发,企图用AI来玩一些复杂多变的策略性游戏,以训练出接近人类智力水平的智能体,目前都在往医疗方向发展。
  (腾讯AI lab构想 腾讯2021年的TGDC会议)
  在2021年的TGDC会议上,腾讯AI Lab公布其具体的战略布局:
  基于棋牌策略类游戏的"绝艺"平台更多从单一个体、场景,复杂博弈的角度去探索AI单独作战的能力;
  基于王者荣耀打造的"绝悟"平台是从多智能体、复杂场景的角度去探索AI团队协作的能力;
  "开悟"是把前两者锻炼出的能力向学术界开放,以期获得实质性的落地成果。
  该布局已然明朗,"绝艺"、"绝悟"平台锻炼AI各个能力,而"开悟"是集成这两个平台的技术,与多方合作,加快AI落地。
  据《王者荣耀》项目执行制作人黄蓝枭所说,开悟平台将基于《王者荣耀》游戏,集成标准接口、核心算法、脱敏的测试数据、评估工具和计算集群等,为高校老师和同学进行多智能体的机器学习算法研究提供了应用场景和验证环境。
  目前,在第一个应用场景医疗上,已有"开悟"的身影。
  在药物研发上,为解决制药流程耗时过长痛点(包括基础研究、药物发现、临床前沿研究、临床研究等),腾讯AI团队选择在药物发现、临床前沿研究两个环节赋能,即缩减药物发现和临床前沿研究所花费的时间。比如在药物发现环节,以前需要从一万个候选药里面选一个,但现在通过算法,只要从一百个候选药里面去选。
  这里就用到了"开悟"上积累的经验,特别是强化学习上的经验。目前该算法已经能够能提升一个数量级甚至两个数量级。
  在医药器材方面,其AI显微镜助理也基于开悟在线加速平台打造,协助医生精准治疗。
  除了医疗之外,腾讯还有其他构想: 打通虚拟与现实世界的藩篱,从而赋能物理世界,比如无人车和机器人的发展; 游戏中对话智能的研究,或能成为通向强人工智能的重要路径; 研究游戏中人、智能体和环境的交互,能让智慧城市这样复杂而意义深远的项目受益。
  而所有蓝图的"地基",是忠实的王者荣耀玩家们疯狂"上分",为系统贡献宝贵的数据,让AI暗中学习。
  黄蓝枭表示,该算法便可用于现实中多个机器人或是无人机的智能协同,未来还能够迁移落地到其他产业环境中,为工业机器人、救灾机器人等提供助力。
  DeepMind之后,后来者腾讯,"从游戏到医疗再到未来"。目前,缺的是一个类似于XLand的AI游戏元宇宙。
  在DeepMind构想中,在其游戏元宇宙XLAND里,AI智能体能够触类旁通,即学会了玩魔兽争霸(即时战略游戏),以后就能很快上手同等类型,但玩法更多、场景更多的帝国时代(即时战略游戏)。
  相比之下,DeepMind早期开发的AlphaZero, 虽然非常强大,在三大棋(西洋棋、将棋、围棋)领域中打遍天下无敌手,但是每一次都需要从零开始,学习很长时间。
  也就是说,腾讯需要一个虚拟空间,让AI能够学了数学之后,再学物理化学时,不用从头再把数学书"啃"一遍。
  # END #

重磅发布2022第三章颠荡起伏下的CEX市场从破产到黑天鹅的阴霾图片来源视觉中国得得智库20222023全球加密货币市场年报再出发是链得得旗下得得智库团队针对2022年全球加密货币市场进的综合分析与复盘。在本年报中,得得智库首先对全球整个加密货家轿市场新玩家!长安逸达正式亮相,最大的问题是生不逢时?最近一年多时间里,汽车行业的关注重点似乎都在新能源车型上,但传统燃油车仍然是汽车市场当之无愧的主导力量,国产汽车厂商在该领域的短板也不容忽视。在发展新能源汽车的同时,国产厂商还需要未公布英雄联盟新作在韩国过审玩家将扮演塞拉斯据外媒Gematsu报道称,一款尚未公布的英雄联盟游戏在韩国通过评级,该作名为MageseekerALeagueofLegendsStory,玩家将在游戏中扮演塞拉斯,游戏类型为动新春迪达拉放弃远程普攻,改为近身攻击,玩家却认为没有特色?在新春黑土上架之后,接下来要登场的新春忍者是期待值很高的迪达拉,而火影忍者手游情报君也带来了他的全技能爆料。只不过当很多玩家看完这个爆料后并不是太满意,其中有一个核心内容就是缺少了一名魔兽世界玩家的情怀发现引硬件商关注最近,一名国外的魔兽世界玩家在清理老家的时候,发现了15年前他用过的魔兽定制键盘赛睿(SteelSeries)的战霸(Zboard),勾起了对参团公会活动鏖战副本的美好回忆。他将截从无序到管制,蹿红的强社交游戏鹅鸭杀,又是中国玩家在惹祸同样是游戏主播带火的游戏,同样是小团队推出的游戏。比起曾经的绝地求生来说,鹅鸭杀更有戏剧效果,尤其是直播间的节目效果。毫不夸张地说,这款游戏能突破70万玩家在线数,咱们中国玩家功不人的好运从哪里来作者洞见樱桃先天之命不可改,后天之运靠己求。古语有云时来天地皆同力,运去英雄不自由。时运,是浑然天成的助力,是水到渠成的惊喜。每个人都希望自己交好运,遇贵人,一飞冲天。但天上不会掉过年,人净有运气,家净有福气作者洞见许朝暮财不入脏门,福不润浊人。腊月二十四,掸尘扫房子。临近年关,家家户户都在掸尘除灰,洒扫住宅。按照民间说法,尘与陈谐音,掸尘寓意着掸除晦气,喜迎新春。古人说,高堂素壁,无被称为马脸的长脸,也就这几位明星能抗住,美到挪不开眼!在之前的审美观念中,很多人觉得拥有鹅蛋脸或瓜子脸便是美女标准,但我们却忽略了另外一种脸型的美女,那就是长脸,有些人将长眼称为马脸,因为人们觉得脸太长不好看。随着审美观念的不断改变,你这个没有心的人你这个没有心的人,根本体会不到别人对自己的关心。话语悠扬伤感,像是一首低沉的催眠曲把我带入她那神秘莫测的世界。错愕于她的冷漠自私与无情,我竟然开始想念和她在一起时,那些温暖短暂美好过年期间,聪明的父母从不会对亲戚说这两件事,这是一种远见文氧气图来自网络春节马上就要到了,大部分的亲戚都会聚在一起吃吃饭,唠家常。有很多长辈,为了能够获得别人的吹捧,就会开始炫耀,相互攀比等等。有些麻烦和苦恼,其实都是他们自己制造出来的
正式开园!岳阳又多一个游玩好去处号外!号外!江豚湾生态体育公园2月25日正式开园啦可能有小伙伴们疑惑了这个公园在哪里呢有哪些好玩的别急别急,我们接着往下看江豚湾生态体育公园北临长江,东接洞庭,处于主要交通干线洞庭糖尿病降糖新药多格列艾汀,实测记录202320今天血糖最高点9。5出现在早餐后的8。43分。早上6。30分服用了半片多格列艾汀片,7。33分早餐食用了比较干的糯玉米143克(入口净重)鸡蛋1个,血糖从4。6飙升至9。5,之后快昔日明星被骗8700万,网上求助,别让自己成为下一个受害者头号解忧馆娱评大赏还记得飞人博尔特吗?他曾是疯狂刷新世界纪录的短跑天才,披着无限荣光宣布退役。最近,昔日巨星再次回归热搜,却是因为被诈骗。有媒体称博尔特被诈骗团伙围攻,损失超过12打乒乓球的窍门打乒乓球的窍门如何让球更转?在乒乓球场上,困扰球友们的一个常见问题是不能把球发得很转,或者是回接对方的下旋球如何搓得比较转问题也常常达不到目的。其实这里有两个关键环节需要很好地把握老詹全明星受伤退出比赛!全明星败了,湖人季后赛还有着落嘛?詹姆斯受伤退出比赛!全明星首次败北!湖人岌岌可危?全明星赛结束,塔图姆拿下55分10篮板6助攻,成功拿下本届全明星MVP,昨日在三分大赛上表现一般的他,在全明星正赛上火力全开,三分欧洲最美十大球场(下)第六名诺坎普球场诺坎普球场也是大家最为熟知的球场之一,是西甲豪门巴塞罗那的主场,世界第二大足球场,欧足联五星球场。可同时容纳十万人观看比赛,也是见证了巴萨这么多年的辉煌。第七名克鲁韦世豪高估自己了!原以为他会被抢着要,结果至今没找下新东家韦世豪在上赛季恒大提前降级到中甲之后,他就一直被视为离队热门。同时当打之年的韦世豪,原以为自己会成为中超转会市场上的大鱼,变得炙手可热。韦世豪前段时间确实被媒体炒作的非常热,一会跟当我谈深圳马拉松的时候,我谈些什么在近半个月的纠结中,深圳马拉松还是如期而至,我也如期参加了,非常幸运参与了这场2万人的赛事,作为跑步不是很久的我,一直很向往去跑一场深圳马拉松,也如我所愿,也安全完赛。早晨5点起,王治郅说国家队巩晓彬最仗义,孙军浑身假动作,刘玉栋最刻苦!王治郅,曾经的追风少年,带领铁军八一男篮统治了一个时代,带领球队豪取六连冠。后来,联盟为了限制八一队,允许除八一队以外的球队可以引进外援政策,这样就不是八一队一家独大的局面。当时的母亲离世,韧带断裂,练体操18年,我不断陷入低谷,但不舍冠军梦这是自拍第365个口述故事如果你有故事,请私信我范忆琳口述林子牧撰文孔宁婧编辑我是范忆琳(范忆琳),前国家体操队运动员。从4岁第一次接触体操,到22岁退役,体操陪伴了我近二十年。它拜登访乌后美议员发文这个国家已经完了,美国应马上一分为二据悉,在俄特别军事行动即将一周年之际,美国总统拜登20日突然访问乌克兰并和泽连斯基会晤。虽然这趟访问只持续了短短的5个小时,却引发舆论关注因为美国上下对这次行程非常保密,随行的工作