范文健康探索娱乐情感热点
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

微软麻将AI来了!已在国际专业麻将平台天凤上荣升十段

  今年6月,由微软亚洲研究院开发的麻将AI系统Suphx成为首个在国际专业麻将平台"天凤"上荣升十段的AI系统,这是目前AI系统在麻将领域取得的最好成绩,其实力超越该平台公开房间顶级人类选手的平均水平。
  今天,微软首次对外正式披露了该项目的详细进展,这个项目由微软亚洲研究院副院长刘铁岩带队的四人团队组成,用时一年,成绩显著。
  大家可能有很多疑问,麻将AI和我们熟知的围棋AI有哪些不同?都是人工智能那谁更厉害?麻将AI又能做什么?网易智能同微软团队进行了深入的交流。
  他们为什么选择麻将!
  实际上,打造麻将AI要比打造已经压制人类的谷歌围棋AI难度更大。因为如果是围棋,棋局信息是公开的,但对于麻将而言,有太多的隐藏信息,并且有更多的随机性。
  换句话讲,麻将这类非完美信息游戏,与围棋、象棋等完美信息游戏相比,对人工智能来说具有更大的挑战性,如果说围棋的可观测状态信息是10的172次方,隐藏的不确定信息为0,那么,麻将的可观测状态信息则是10的121次方,可怕的是隐藏的不确定信息达到了10的48次方。
  刘铁岩向网易智能表示,我们生活的世界是由许许多多的随机事件构成的,而且在很多情况下,无法知晓的信息也许远多于我们能够掌握的信息,而我们仍然要在这样信息不完全的条件下做出大大小小的决策。
  "AI在非完美信息游戏中的突破,将有助于协助人类应对更多高度复杂的现实问题,尤其是在智能交通、金融投资等容易受到随机突发状况影响的场景中"。他谈到。
  AI如何在天凤"打怪升级"
  据介绍,由于长期在民间广为流传,不同地区的麻将玩法非常多样,缺乏统一的规则标准和评价体系。日本在线麻将竞技平台"天凤",因其完善的竞技规则、专业的段位体系,成为专业麻将平台,受到职业麻将界的广泛承认。
  刘铁岩介绍,天凤平台为高水平麻将玩家提供两种竞技房间:"特上房"对四段以上所有玩家免费开放,允许AI参与游戏,目前所有玩家在此房间的最高段位是十段;
  "凤凰房"仅对七段以上的人类付费玩家开放,目前不允许AI参与游戏,在该房间能够达到的最高段位是十一段,称为"天凤位"。自天凤平台在2006年推出以来,全平台达到四人麻将天凤位的麻将高手仅有13位[JL1],曾经达到过十段的选手约有180位,而现役十段的人类选手也仅有十几位。
  而微软亚洲研究院开发的麻将AI系统Suphx于3月登陆天凤平台,在AI能够参与的公开竞技房"特上房",Suphx与人类选手展开了5000余场四人麻将对局,在这5000余场对局中,Suphx的稳定段位超过了8.7。
  刘铁岩透露,他们也在和天凤平台探讨,以怎样的方式让Suphx进入还不允许AI参与的凤凰房。
  麻将AI到底难在哪?
  与象棋、围棋、德州扑克等棋牌类游戏相比,麻将具有更复杂的隐藏信息和更高的难度。
  总体而言,微软亚洲研究院将麻将AI面临的挑战总结为以下三点:
  首先,巨大的状态空间:与只有52张牌的德州扑克相比,136张麻将牌的排列组合可能性更多。同时,麻将中同一个玩家两次出牌之间,夹杂了其他三个玩家的出牌和自己摸的底牌,可能出现的不同局面数目非常巨大。值得特别指出的是,在麻将中,4位玩家的出牌顺序是不固定的,任意一位玩家的"吃碰杠"都可能使出牌顺序突然改变,导致游戏树不规则、且动态变化。这些特点使麻将很难直接利用AlphaGo等棋盘游戏AI常用的蒙特卡洛树搜索算法。
  其次,非完美信息博弈:象棋和围棋属于完美信息游戏,玩家可以看到棋局中对方玩家的落子。麻将则存在大量的隐藏信息。具体而言,麻将中每个玩家可以有13张手牌,另外还有84张底牌。对于一个玩家而言,他只知道自己手里的13张牌和之前已经打出来的牌,却无法知道别人的手牌和没有翻出来的底牌,所以最多可以有超过120张未知的牌[JL2]。这么多的未知信息使得麻将的难度非常高。一方面,由于随机性太大,玩家即便在出牌决策中估计对方玩家手牌、底牌等不可见的牌,也无法避免不确定性对于游戏走向的影响。这将对AI模型的训练带来很大挑战:AI模型很难发现已知牌面信息和最优打法之间的逻辑链路。另一方面,丰富的隐藏信息导致游戏树的宽度非常大,对树搜索算法的可行性提出了进一步的挑战。
  其三,复杂的奖励机制:日本麻将的规则是"无役不能和牌",多样的特殊牌面构成了复杂的"役种"和番数计算规则。一轮游戏共包含8局,单局得分与役种和番数相关,最后根据8局的得分总和进行排名,来形成最终影响段位的点数奖惩。因此有时麻将高手会策略性输牌,例如,在第8轮时如果A玩家已经大比分领先第二名,他可能会故意放炮给排名第四的玩家,来防止总分被排名第二的玩家反超,保证自己在最终结算时获得最大的点数奖励。这为构建高超的麻将AI策略带来了额外的挑战,AI需要审时度势,把握进攻与防守的时机。
  三大技术见招拆招
  "面对麻将游戏的巨大挑战,AI仅靠强大的计算力无法从根本上解决问题,而需要更强的直觉、预测、推理和模糊决策能力,"微软亚洲研究院副院长、机器学习领域负责人刘铁岩博士表示。他们的主要技术应用可以概况为先知教练、全盘预测、自适应决策。
  据了解,微软亚洲研究院针对麻将的特点与难点尝试了一系列基于强化学习的新算法,比如,为了应对巨大的状态空间,研究团队引入了全新的机制对探索过程的多样性进行动态调控,让Suphx可以比传统算法更加充分地试探牌局状态的不同可能;另一方面,一旦某一轮的底牌给定,其状态子空间会大幅缩小;所以研究团队让Suphx在推理阶段根据本轮的牌局来动态调整策略,对缩小了的状态子空间进行更有针对性的探索,从而更好地根据本轮牌局的演进做出自适应的决策。
  其次,针对非完美信息博弈的挑战,Suphx尝试了先知教练技术来提升强化学习的效果。其基本思想是在自我博弈的训练阶段利用不可见的一些隐藏信息来引导AI模型的训练方向,使其学习路径更加清晰、更加接近完美信息意义下的最优路径,从而倒逼AI模型更加深入地理解可见信息,从中找到有效的决策依据。
  另外,对于麻将复杂的牌面表达和计分机制,研究团队还利用全盘预测技术搭建起每轮比赛和8轮过后的终盘结果之间的桥梁。可以让AI理解每轮比赛对终盘的不同贡献,从而将终盘的奖励信号合理地分配回每一轮比赛之中,以便对自我博弈的过程进行更加直接而有效的指导,并使得Suphx可以学会一些具有大局观的高级技巧。

微信内测版新增关怀模式,字体变大更清晰IT之家9月16日消息微信近日推出了8。0。14内测版,主要优化了一些已知问题。据数字尾巴报道,已经有部分内测版用户可使用关怀模式。据报道,关怀模式类似于长辈模式或老年模式,用户在民警盗用嫌疑人微信消费案一审宣判被告人获刑3年3月IT之家9月15日消息据丰城法院官微,江西省丰城市人民法院今日依法对被告人陈某(奉新县公安局原民警)盗窃案进行一审公开宣判,以被告人陈某犯盗窃罪,判处有期徒刑三年零三个月,并处罚金央行我国对虚拟货币的监管政策是明确的一贯的IT之家9月24日消息近日,人民银行等十部门发布关于进一步防范和处置虚拟货币交易炒作风险的通知(以下简称通知)。人民银行有关负责人就相关问题回答了记者提问。通知的出台背景是什么?央央行虚拟货币相关业务活动属于非法金融活动,坚决依法取缔IT之家9月24日消息今日,中国人民银行发布进一步防范和处置虚拟货币交易炒作风险的通知。通知指出,虚拟货币不具有与法定货币等同的法律地位。比特币以太币泰达币等虚拟货币具有非货币当局发改委等部门发布关于整治虚拟货币挖矿活动的通知加快存量项目有序退出IT之家9月24日消息国家发展改革委网站消息,发改委发布关于整治虚拟货币挖矿活动的通知。通知称,虚拟货币挖矿活动指通过专用矿机计算生产虚拟货币的过程,能源消耗和碳排放量大,对国民经河北开展虚拟币挖矿和交易行为整治IT之家9月14日消息据网信河北官方公众号,日前,河北省互联网信息办公室联合省教育厅公安厅等部门,针对虚拟货币挖矿和交易行为部署专项整治行动。据介绍,虚拟货币挖矿能源消耗巨大,与我甘肃兰州新区多部门联合清查虚拟货币矿机挖矿IT之家9月10日消息9月9日,甘肃能检办工信厅发改委一行人员开展比特币等虚拟货币挖矿活动专项检查行动。对兰州新区内多家大数据企业进行现场检查,对厂区环境用电设备等进行重点摸排。专央行再次提醒虚拟币风险,将高压态势打击相关交易炒作活动感谢IT之家网友刺客的线索投递!IT之家8月27日消息今日,在2021年金融知识普及月金融知识进万家争做理性投资者争做金融好网民活动媒体吹风会上,中国人民银行金融消费权益保护局副局马来西亚开始对币安采取执法行动,要求停止当地业务7月30日消息,据国外媒体报道,据马来西亚证券委员会公布的消息,马来西亚证券委员会(SC)今天对币安非法经营数字资产交易所(DAX)采取执法行动,要求该交易所停止在马来西亚的业务。比特币价格跌破3万美元,为6月22日以来首次7月20日消息,据国外媒体报道,作为市值最大的加密货币,比特币价格跌至3万美元以下,为今年6月22日以来首次,可能成为价格进一步下跌的最大加密货币。在所有加密货币中,比特币是最有价安徽省全面清理关停虚拟货币挖矿项目IT之家7月14日消息合肥在线今日发布文章我省全面清理关停虚拟货币挖矿项目。文章指出,未来三年,全省电力供需形势严峻,存在较大的供应保障缺口。在内建外引两手抓的同时,安徽将全面清理
美国民意调查科技对经济利大于弊,但社交媒体太糟糕据美国NBCNews报道,根据NBCNews华尔街日报最新的的民意调查,美国公众对Facebook和Twitter等社交媒体巨头态度消极。大部分受访者表示,这些网站不但没有团结美国雷军4G手机已清仓,全力转5GIT之家5月25日消息据新华网报道,日前全国人大代表小米集团董事长兼CEO雷军在采访中表示,年初到现在,小米已发布了5款5G手机。去年年底,小米基本上已经清仓了4G手机,全力转5G淘宝直播独立App春节前上线IT之家1月23日消息在淘宝直播机构大会上,淘宝直播负责人赵圆圆透露,淘宝直播独立App将在春节前正式上线。淘宝直播是阿里巴巴推出的直播平台,定位于消费类直播,用户可边看边买涵盖的李佳琦薇娅双十一决胜负,阿里脸都笑歪了11月11日凌晨两点,李佳琦结束直播,直播间观看人次定格在3682万一个小时后,薇娅下播,数字定格在4310万。备受外界关注的淘宝直播一哥一姐的双十一battle中,薇娅暂时获得了丁磊谈对有道期望给用户带来惊喜是最重要的北京时间10月25日晚间消息,网易有道今晚将正式登陆纽交所,在媒体采访中,网易有道CEO周枫表示,从线下教育起家的公司更聚焦某一个年龄段,而有道会非常关注怎样能帮到更多的用户,像现上市前夕,有道CEO周枫发布内部信这只是新学期的开学仪式IT之家10月25日消息今日晚间2130,网易首家独立上市公司网易有道即将于纽约证券交易所正式挂牌上市,股票交易代码为DAO,发行价为每股美国存托股(ADS)17美元。网易有道CE网易有道回忆录真正的教育事业没有终点从搜索到教育,十二年后,有道终于迎来高光时刻。2007年,坐在清华科技园西北角的周枫还在苦苦攻克搜索,当时他或许很难想到,十二年后他将在曾一片荒芜枯黄的后厂村里研究着与教书育人相关用捐款反对财富税?2018年美国最富有的20个人捐了多少钱反对征收财富税的一个更有说服力的理由是,富人已经向慈善机构捐赠了大量资金。这是马克扎克伯格上个月在福克斯新闻上为自己阶级辩护的一部分观点。但加州大学伯克利分校经济学家财富税倡导者GLVMH掌门人阿尔诺身家或超比尔盖茨贝索斯,成全球首富11月26日消息,随着路易威登母公司路威酩轩集团(LVMH)与美国珠宝品牌蒂芙尼公司达成最终协议,正式收购蒂芙尼,微软联合创始人比尔盖茨(BillGates)和亚马逊创始人兼首席执LV老板阿诺特再次超越比尔盖茨成全球第二大富豪,两人仅差1亿美元北京时间11月6日消息,据福布斯实时富豪榜,法国奢侈品巨头路威酩轩(LVMH)的股价自10月初以来一直炙手可热,推动其CEO伯纳德阿诺特再次超越比尔盖茨,成为全球第二大富豪。截至美将ARM出售给英伟达,软银CEO孙正义净资产一周增加34亿美元9月21日消息,据国外媒体报道,过去一周(当地时间9月11日收盘至9月18日收盘),软银创始人兼CEO孙正义的净资产增加了34亿美元。此前在9月13日,软银集团和英伟达宣布,双方已