专栏电商日志财经减肥爱情
投稿投诉
爱情常识
搭配分娩
减肥两性
孕期塑形
财经教案
论文美文
日志体育
养生学堂
电商科学
头戴业界
专栏星座
用品音乐

1亿用户在王者荣耀,为腾讯AI打工

  (图片来源:腾讯开悟平台官网)
  文Renee
  编辑Emma
  要是知道马斯克的自动驾驶系统可能是基于赛车游戏打造的,你是否会感到意外?
  2017年,OpenAI宣布旗下的开源人工智能测试环境Universe加入了游戏大作《侠盗猎车手5》,让AI能够在短时间内获得准确识别各种物体和突发情况的能力。
  原因在于,现实生活中,无人车摄像头感知到的其实也就是一张二维图片。游戏场景里的物体如果和现实非常相似,就能通用。
  我们无法知晓特斯拉自动驾驶系统含游戏量有多少,不过主要靠着游戏锻炼AI的Deepmind已成功为游戏正名:2016。7,DeepMind团队的AlphaGo经过大量的棋牌策略类游戏数据训练,击败了世界围棋冠军柯洁;2022。10,DeepMind团队的AlphaTensor在没有任何现有矩阵乘法算法的知识的情况下,在团队给出的游戏场景中反复练习,从而重新演化对于矩阵乘法的算法探索,在一个有限域中改进了Strassen(历史最快算法)的二阶算法。
  由此,DeepMind团队成功将游戏的触角伸到了学术界。
  目前,腾讯也有此意:2022。11,腾讯开悟平台宣布正式开放王者荣耀AI开放研究环境申请。它将面向非商业用途的机器学习算法研究,提供业界独有的高复杂度MOBA训练环境,助力相关学术领域的前沿探索。
  也就是说,你天天休闲打的王者荣耀游戏,未来很有可能会为学术领域的前沿探索贡献一份力量。
  这,就不得不去思考,为何游戏能够成为AI的训练场?你打的王者荣耀要怎么为学术贡献力量?
  01AI工作娱乐两不误
  目前,AI游戏已经成为腾讯、网易等国内头部游戏企业发力的核心方向,三七、盛趣、完美、B站等,也都在探索AI游戏的可能。
  为何大家都将游戏成为AI的主要测试平台?
  我们都知道,AI的终极目标是打造一个以假乱真的真人,这就意味着,AI要有性格、偏好。也就是说,研究者们需要摸透AI的风格,并将其打造成自己想要的模样。
  DeepMind基于此,引入了联盟(League)训练概念(让AI模仿某真人打法与自己进行对抗),通过博弈对战的方式了解AI的性情,各个大厂也都采取该路线。
  这就需要一定的指标去衡量AI或者真人的风格,也需要真人大量的数据展现自己的风格,让AI在某些方面增强,某些方面减弱,从而让AI完美复刻他人。
  游戏就成为了最佳训练场。
  第一,游戏能够提供多个指标去衡量AI表现情况,并塑造AI。
  每场比赛结束,提供的游戏时间、胜负、金钱、击杀时间、击杀个数等数据能够作为模型的特征,反应智能体AI的偏好:
  比如通过击杀个数可以判断其是否具有很强的战斗能力,通过短时间内的连杀数据可以判断其是否激进。基于此人们可以知道AI是个什么样的人,从而进行改进。
  长此以往之后,玩家就能够通过配合度、激进度、防守能力等指标去调整AI的个性,也就是说AI能够拥有独特的性格。
  (AI多样化和个性化在游戏中的应用图源:腾讯游戏学堂作者Yaqing)
  腾讯AILab游戏AI研发中心负责人付强在2021年的TGDC会议上也表明,所有的竞技游戏都是有明确的胜负指标,包括中间的核心指标,这些明确的指标会便于我们去测试和迭代,去塑造AI。
  第二,游戏环境能够提供丰富的场景及任务,锻炼AI做决策的能力,并从中得到海量数据。
  王者荣耀中就有对抗路、打野区、中路、游走、发育路五种发展场景,每个场景中的人都有自己的使命,例如打野区的人就需要疯狂打怪,从而为团队提升经济水平,游走的人就需要及时到达残血的队友身边为他保驾护航,其他区域的人就需要高强度输出伤害,守好自己的路。
  在这场比赛中,玩家除了需要各司其职,也需要和团队及时沟通战略,例如何时去打怪,何时去集体推搭,是打野怪和平发育还是抢人头激进发育,这都是需要短时间内根据现状做出最优决策。
  同时付强表示,游戏世界能够不管说是获取人类自己的数据,还是通过AI自己对战去生成的数据,从这个角度来说,虚拟世界比现实去获取这些数据的成本、其迭代的效率会高很多。
  除此之外,游戏世界试错成本要低得多。
  我们不妨设想一下,某公司的AI产品直接在你家门口道路上尝试自动驾驶,出事故的概率很难把握。而在游戏世界中试错几万次都无所谓。所以,通过构建虚实交融的环境,我们可以建设模拟城市交通的虚拟世界,将在虚拟世界中试错出来的最优策略迁移到现实世界。
  目前,游戏赋能AI不再是在游戏圈里自嗨,也踏入了学术圈。
  今年10月,DeepMind团队的AlphaTensor在没有任何现有矩阵乘法算法的知识的情况下,在团队给出的游戏场景中反复练习,从而重新演化对于矩阵乘法的算法探索,在一个有限域中改进了Strassen(历史最快算法)的二阶算法。
  在该项成就的突破背后,游戏成为了它的法宝据DeepMind团队透露,AlphaTensor便是从游戏系统设计中寻找灵感,通过树形搜索的方式,将矩阵乘法高效算法的问题转换为在单人游戏中寻求数学结果,而AlphaTensor的原型也是游戏出身的AlphaGo。
  腾讯也在积极布局之中,目前与北京大学、清华大学、电子科技大学、中国科学技术大学四所国内高校合作开发了创新课程,希望更多学者在游戏环境中探讨和研究AI落地难题,并寻找AI新技术覆盖更多场景的可能性,服务医疗、工业、农业、交通等行业。
  02DeepMind,不只是AI游戏王
  从AlphaGo到AlphaTensor,DeepMind一直走在AI的前线。那么,DeepMind为何能够开创游戏哺育AI的先河?
  面对前所未有的领域,团队设立了重重门槛,去判断该AI项目是否值得研究。
  在开启项目前,DeepMind团队内部重点考核了三个问题:这个AI项目能不能被归纳为某一大型组合化的状态空间(即所有可行方案的集)?如果不能的话,则难以使用专家系统来预设解决方案,而要使用蛮力来穷尽所有可行解决方案,将困难重重。这个AI项目有没有清晰可量化的衡量标准,能让我们根据这个目标来逐步优化学习系统?比如,游戏的目标就是分数。这个AI项目有没有充足的数据可供系统学习?
  游戏环境能够满足第2、3个问题,棋牌策略类游戏的解法能够满足第1个问题(所有的走法都是可以归纳的)。
  基于此,经过大量的棋牌策略类游戏数据训练,2016年AlphaGo击败了世界围棋冠军,同时发展出能够自我对弈的AlphaZero。
  但团队的野心不止于此成为游戏的王者只能证明其把某个模型玩透了,而将游戏积累的经验数据去处理真实世界的问题,才是诗和远方。据团队创始人透露,最开始的AlphaGo和AlphaZero都是与游戏相关,但最终目标不仅仅是破解游戏,而是使用它们来引导通用学习系统,并应对现实世界的挑战。
  所以,DeepMind团队在做棋牌策略类的游戏之外,也在寻找更具现实意义的游戏。
  一款由华盛顿大学等机构联合开发蛋白质折叠游戏Foldit进入到DeepMind的视野。该游戏能够集中所有玩家的动力和精力,为蛋白质折叠研究做贡献。
  游戏的结果出乎意料:游戏玩得最好的往往不是生物学家,而是普通玩家,他们很可能比科学家更快破解出某种蛋白质的真实结构。一些由Foldit玩家破解出的重要蛋白质结构还发表到《Nature》杂志上。DeepMind团队给出的解释是,有些玩家有着非常出色的直觉。
  基于此,在2016年,DeepMind团队启动AlphaFold项目,人工构建系统模拟这些玩家的直觉。
  在今年的7月28日,欧洲生物信息学研究所(EMBLEBI)通过AlphaFold成功预测了超过100万种生物的2。14亿个蛋白质的三维空间结构,涵盖了地球上几乎所有已知的蛋白质,再次突破了AI界的边界。
  有了AlphaGo、AlphaFold这样明星产品后,DeepMind野心就藏不住了,这两个产品还不够优秀只能是某一个领域的佼佼者,其他领域就是个小白,而DeepMind需要的是会举一反三的AI智能体。
  于是在2021年,DeepMind发布了包含数十亿任务的游戏元宇宙XLand平台。
  (DeepMind游戏元宇宙框架图源:DeepMind官网)
  在这个游戏元宇宙中,无数的游戏星球组成了游戏星系,每个星球上的游戏按竞争性、平衡性、可选择性、探索难度四个纬度进行区分。
  比如下图,左边的游戏双方需要将小球赶到自己的区域才算获胜,不是你死就是我亡,一点合作的机会都没有,所以它的竞争性指标直接被拉满了;而右图的游戏,则是要求将几何体按颜色归类到一起,多个智能体合作完成任意一组配对就可以,所以竞争性很低,但是可选择性很强。
  (DeepMind游戏元宇宙模块详情图源:DeepMind官网)
  在锻炼竞争性、平衡性、可选择性、探索难度的综合实力的同时,为了让智能体获得更加泛化的能力,研究人员设定在学习时,每个新任务都要基于通关的旧任务生成,保持学习的连续性。
  目前该项目还在苦苦内测中第五代智能体在XLand4000多个星球中共玩了70万个游戏,经历了2000亿次训练,完成了340万个独特任务。
  DeepMind从一开始,就为自己的AI研究设立了明确的标准,从可行性最高的游戏开始做起,防止陷入超前的漩涡;同时有着更为长远、现实的目标:游戏AI并非只为了让AI更会玩,而是为了更好赋能现实世界,对医疗、交通、工业机器人等领域有所帮助。
  如今,能够找到数理化相通性的泛化机器人,成为DeepMind下一个发展目标。
  03腾讯,跟着DeepMind过河?
  与DeepMind相同,腾讯也从游戏出发,企图用AI来玩一些复杂多变的策略性游戏,以训练出接近人类智力水平的智能体,目前都在往医疗方向发展。
  (腾讯AIlab构想腾讯2021年的TGDC会议)
  在2021年的TGDC会议上,腾讯AILab公布其具体的战略布局:
  基于棋牌策略类游戏的绝艺平台更多从单一个体、场景,复杂博弈的角度去探索AI单独作战的能力;
  基于王者荣耀打造的绝悟平台是从多智能体、复杂场景的角度去探索AI团队协作的能力;
  开悟是把前两者锻炼出的能力向学术界开放,以期获得实质性的落地成果。
  该布局已然明朗,绝艺、绝悟平台锻炼AI各个能力,而开悟是集成这两个平台的技术,与多方合作,加快AI落地。
  据《王者荣耀》项目执行制作人黄蓝枭所说,开悟平台将基于《王者荣耀》游戏,集成标准接口、核心算法、脱敏的测试数据、评估工具和计算集群等,为高校老师和同学进行多智能体的机器学习算法研究提供了应用场景和验证环境。
  目前,在第一个应用场景医疗上,已有开悟的身影。
  在药物研发上,为解决制药流程耗时过长痛点(包括基础研究、药物发现、临床前沿研究、临床研究等),腾讯AI团队选择在药物发现、临床前沿研究两个环节赋能,即缩减药物发现和临床前沿研究所花费的时间。比如在药物发现环节,以前需要从一万个候选药里面选一个,但现在通过算法,只要从一百个候选药里面去选。
  这里就用到了开悟上积累的经验,特别是强化学习上的经验。目前该算法已经能够能提升一个数量级甚至两个数量级。
  在医药器材方面,其AI显微镜助理也基于开悟在线加速平台打造,协助医生精准治疗。
  除了医疗之外,腾讯还有其他构想:打通虚拟与现实世界的藩篱,从而赋能物理世界,比如无人车和机器人的发展;游戏中对话智能的研究,或能成为通向强人工智能的重要路径;研究游戏中人、智能体和环境的交互,能让智慧城市这样复杂而意义深远的项目受益。
  而所有蓝图的地基,是忠实的王者荣耀玩家们疯狂上分,为系统贡献宝贵的数据,让AI暗中学习。
  黄蓝枭表示,该算法便可用于现实中多个机器人或是无人机的智能协同,未来还能够迁移落地到其他产业环境中,为工业机器人、救灾机器人等提供助力。
  DeepMind之后,后来者腾讯,从游戏到医疗再到未来。目前,缺的是一个类似于XLand的AI游戏元宇宙。
  在DeepMind构想中,在其游戏元宇宙XLAND里,AI智能体能够触类旁通,即学会了玩魔兽争霸(即时战略游戏),以后就能很快上手同等类型,但玩法更多、场景更多的帝国时代(即时战略游戏)。
  相比之下,DeepMind早期开发的AlphaZero,虽然非常强大,在三大棋(西洋棋、将棋、围棋)领域中打遍天下无敌手,但是每一次都需要从零开始,学习很长时间。
  也就是说,腾讯需要一个虚拟空间,让AI能够学了数学之后,再学物理化学时,不用从头再把数学书啃一遍。
  END

孙颖莎输球3大原因!2点训练可弥补,1致命缺点不改正难有突破WTT布达佩斯冠军赛已经落下了帷幕,国乒在五个单项中取得了四个冠军,在时隔近四个月后再度参加国际大赛,能够取得这样的成绩已经是实属不易。其中在女单项目中,国乒的优势依然非常明显,提许久不联系的人,突然联系你了,逃不过3个原因图源自网络侵权请联系删除在我们生命中,来来往往会认识很多人,有些人能陪着我们一起经历人生的悲欢,有的人却只陪我们一程,然后就在中途下了车,任你是不甘还是不舍,也无法让他们的步伐停下为什么宁愿买高配千元机,也不考虑低配旗舰机?3点原因太真实为什么宁愿买高配千元机,也不考虑低配旗舰机?3点原因太真实大家在买手机的时候应该会有比较纠结的时候,一个是到底是选择高配手机多用几年呢?还是低配手机少用几年?这个问题应该也困扰着很荣耀手机撤出印度,因为众所周知的原因印度发生了什么?7月21日晚,在荣耀的新品发布会会后,荣耀CEO赵明接受了媒体群访。对于印度市场,赵明表示,荣耀几年前就在印度有团队并经营了很长时间,后来由于众所周知的原因荣耀印度团队撤出,目前荣2022年最值得买的MiniLED电视TCLQ10G,画质价格双王炸MiniLED作为新一代的显示技术,自被苹果采用之后,其曝光率,便如加了Buff一般节节攀升,无疑是今年来最火热的显示技术。被市场选中,自然有市场的理由,相较于传统LED背光的LC下半年最值得入手的手机推荐这三款手机好用不贵价格最低至1299元下半年已经开始一段时间了,对于很多小白来说,上半年都没有选到合适的手机,下半年的手机又该如何去选择呢?现在手机的更新换代非常的快,手机的价格也降得非常的快,买的手机不好可能会很快被CBA三消息山东两战大胜广州,可兰白克迎首秀,首钢辟谣签威少爱国篮,爱CBA,我是洛姐,小伙伴们看完记得点赞!山东队这个休赛期没能获得参加夏季联赛的机会,这让球迷们感到非常意外,毕竟山东队是青岛队的同省球队,这次的夏季联赛正好又在青岛市举行CBA三消息山东宣布最新外援,陶汉林打爆广州,首钢留争议球员大家好呀,我是北柠,各位小伙伴们要养成先赞后看的习惯哦!山东队是现在CBA联赛里中游水平的一支球队,他们的实力其实是不错的,只不过这个赛季在徐长锁指导的带领下山东队没有将他们的战斗碳讨首钢股份杜斌钢企降碳将助力社会绿色发展碳排放权交易管理办法(试行)已经落地有一年半的时间,全国碳排放权交易市场开市也近一年。很多企业确定了碳排放管理的总体思路具体目标实现路径,构建了碳排放管理框架或者业务体系。市场中碳CBA三消息山东两战大胜广州,可兰白克迎首秀,首钢辟谣签威少爱国篮,爱CBA,我是洛姐,小伙伴们看完记得点赞!山东队这个休赛期没能获得参加夏季联赛的机会,这让球迷们感到非常意外,毕竟山东队是青岛队的同省球队,这次的夏季联赛正好又在青岛市举行CBA三消息山东宣布最新外援,陶汉林打爆广州,首钢留争议球员大家好呀,我是北柠,各位小伙伴们要养成先赞后看的习惯哦!山东队是现在CBA联赛里中游水平的一支球队,他们的实力其实是不错的,只不过这个赛季在徐长锁指导的带领下山东队没有将他们的战斗
2022年,我的不购买清单我虽然是一个女人,但是很多女性用的东西我一般都没有用,活得比较粗,比较大女人,比如美甲纹眉化妆高跟鞋香水等等,我不能再举例了,感觉自己已经不是一个女人一样。但是我比较随心随性,所以37岁爆砍4314,一人撑起湖人内线,7冠王詹姆斯打中锋可超大梦湖人因浓眉受伤之际,最近比赛都让詹姆斯开启詹中锋模式,在主场对阵开拓者的比赛中,37岁的詹中锋砍下43分14篮板4助攻2断抢2盖帽的无解数据,送给开拓者4连败,而前六场比赛里詹中锋8人入围年度最佳女运动员候选名单!全红婵或创历史,孙颖莎落选8人入围年度最佳女运动员候选名单!全红婵或创历史,孙颖莎落选。权威媒体体坛周报在其官方社交媒体上公布了2021年度最佳女运动员的候选名单,共有8位女运动员入选,分别是陈梦,张雨霏,恒大队史射手榜TOP5郜林95球排第三,穆里奇仅第五,高拉特第一21赛季中超联赛仅剩下最后2轮比赛,由于多方面因素的影响广州队在第二阶段遭遇了一系列的困难,其中最大的一个难题就是进球数上,在最近的比赛中不少年轻球员都斩获了进球,但这样的数据对比在太空中放屁有生命危险?宇航员在太空中想放屁该怎么办?我们自古就对太空充满了向往,随着科学技术的不断发展,人类的脚步也迈入了太空。但是因为宇宙和地球的环境大不相同,许多在地球上的我们看起来稀松平常的事情在太空中确是被严格要求甚至是禁止经常上火,易怒早谢?中医怎么用药今天说一个案例,是比较常见的早谢症型相火亢进型,多见是年轻气盛的年纪不大的,而且经常用手自我安慰的,虚求大易怒,爱上火。陈先生,26岁,说最近有点虚,想调理一下仔细了解他的情况诉说马云真要种地了,越来越活跃的马云!袁隆平亩产做到了!马云呢?大家好,我是语云,今天给大家探讨一下马云老师的近况,马云最近活跃的很啊,各大媒体报道,人民日报央视报道改口称在阿里云可为重回巅峰,把马爸爸,他现在干啥呢?家人们听听早在几年前马云就LOL手游锤石还在带余震?其实生命源泉更加适合大家好,我是玩手游的张同学。最近小编一直在用锤石上分,上分还算顺利,也是从铂金磕磕绊绊地打到了翡翠。期间也是尝试了不同的主基石,感触也是蛮多的。今天主要和大家聊一下锤石的主基石到底500元人民币在缅甸能干嘛?缅甸姑娘告诉你现如今,出国旅游已经成为了人们生活中的主要娱乐活动了。在选择出国旅游的时候,大多数游客们都喜欢到周边的国家旅游。(此处已添加小程序,请到今日头条客户端查看)因为这些国家不仅有着较低人类工程的奇迹!青藏铁路后又一进藏天路!这项世纪工程有多难这是世界上最难修建的铁路之一被誉为人类工程奇迹它就是川藏铁路是我国继青藏铁路之后又一条进藏天路全长1838米,总投资3198亿预计12年完工国外的工程师也曾说过要想建成川藏铁路没有长期吃鱼的人,身体或会收获4大好处,还可能降低15的死亡风险你喜欢吃鱼吗?作为我们餐桌上不可缺少的一道美食,鱼肉一直很受人们的欢迎。鱼肉肉质鲜嫩,营养丰富,含有多种人体必需的营养物质。近日,有研究还发现,经常吃鱼,或能降低全因死亡风险。一每
友情链接:快好找快生活快百科快传网中准网文好找聚热点快软网