保健励志美文体育育儿作文
投稿投诉
作文动态
热点娱乐
育儿情感
教程科技
体育养生
教案探索
美文旅游
财经日志
励志范文
论文时尚
保健游戏
护肤业界

数学科普人士攻克火爆猜字游戏Wordle,求解算法成绩逼近理

  免费猜字小游戏Wordle正在席卷全球,火到以数百万美元的价格被收购,全球玩家数量也突破了200万。如果你在微博、微信等地方看到这些神神秘秘的方块,那就是Wordle玩家在分享自己当日的战绩了。
  根据统计,大多数人类玩家需要猜测4次或以上才能取得胜利。比如,2月5日的题目在当天30多万份晒出战绩的玩家中,只有27能在三次以内猜中。这个游戏自然也成了程序员们的新竞技场,他们写出各种算法来比拼谁用的步数最少。这其中,百万粉数学科普人士3Blue1Brown的玩法更为硬核他不光写出了求解算法,还用数学知识一步步优化至逼近理论极限,最终成绩平均3。138次猜测就能获胜。并且他用统计办法找出了与人类常见策略不同的最佳开局单词crane。
  他像往常一样把这个过程整理成视频分享出来,不仅展示了算法,还把其中涉及的信息论、统计学知识讲得明明白白。视频发布一天之内就有上百万播放,围观的网友也纷纷在评论区表达了赞叹。
  为了游戏点进来,为了精彩的信息论知识留下,太酷了!
  他用了什么样的算法,理论极限又是怎么算出来的?下面一起来看看。从每一次猜测中获得最多信息
  Wordle的游戏规则很简单,玩家需要猜出程序每天指定的一个5位英语单词谜底。玩家可以随意提交一个英语单词,但必须是字典里有的,不能胡乱拼写。如果字母在谜底中出现且位置对了就显示绿色,字母出现了但位置不对就显示黄色,字母在答案的单词中没出现就显示灰色。根据反馈信息再进行下一轮猜测,在6次尝试之内猜出就算赢。
  如何让步数尽量少?
  3Blue1Brown的总体思路是尽量从每一次猜测中获得最多的信息。他先是找来了26个字母在英语文本中出现频率的统计数据,尝试在前两次尝试中覆盖最多高频字母。比如othernails的组合,就可以覆盖出现频率最高的11个字母中的10个,如果运气好就能确定下来一些字母。即使这些字母都没出现依然是一种信息量很大的反馈,10个常用字母都没出现的单词数量就大大减少了,让下一步猜测更简单。
  不过在尝试过程中,又出现了新的问题。同样用nails这几个字母,也可以拼成snail,这两种拼写顺序之间的差异,仅依据字母频率数据是无法衡量的。
  下面需要一种新的计算方法。如何计算信息量?
  原版Wordle游戏里有一个数量12972的总单词列表,都能作为猜测词使用。另外有一个2315个单词的列表,只有这些单词会出现在答案里(据说是游戏作者的女朋友挑选的)。因为游戏是用Javascript写的,数据都在客户端,这些数据直接可以从源码里找到。不过3Blue1Brown觉得让程序利用答案列表的话有点像作弊了,他果断给自己加大难度,只考虑总单词列表。游戏中,每一次猜测都能从12972个单词中排除一些结果。比如猜测weary,如果W位置正确同时A出现了,那么剩下的可选单词只剩58个。
  这样对同一个猜测,从5个字母全没出现到5个字母全对的各种反馈的概率都可以计算出来。
  这样,问题就变成了如何评估各种反馈情况包含的信息量。
  3Blue1Brown选择的办法,就是利用信息论祖师爷香农提出的信息熵概念。信息熵描述的是事件的不确定性,单位就是大家知道的比特。理解起来也不难,可以用扔硬币来解释。
  扔1枚硬币只会出现正、反两种结果,而且概率相等。扔2枚硬币就有正正、正反、反正、反反这4种结果,扔3枚有8种情况等等,也就是扔n次有2的n次方种结果。
  当一个事件有两种结果且概率都是12,其不确定性相当于扔1枚硬币,此时信息熵定义为1比特。如果一个事件有8种结果且概率都是18,就相当于扔3枚硬币,此时信息熵就是3比特。
  信息量和信息熵的数量相等、意义相反,相当于衡量一则信息能消除多少不确定性。设每种结果的概率为p,信息量为I,有如下等式。
  稍作变换,可以得到信息量的计算公式。
  回到Wordle游戏上,一次猜测获得的信息量可以用每种可能情况的概率与对应信息量相乘、再把结果相加来计算,也就是求数学期望。
  以猜测weary为例,计算出获得的信息量为4。9比特。代表这则信息消除的不确定性比扔5个硬币的不确定性少一点。
  算法思路有了,接下来就可以交给程序,计算出所有12972个单词的能消除的信息熵。
  用同样的方法,可以再计算第二步、第三步猜测能消除的信息熵。
  根据这些计算结果,程序就可以在每一次猜测时,选择所有可能单词里能消除信息熵最多的那个。
  比如第一次猜slate获得一次反馈,此时还剩下578个单词可选,其中选ramin能消除最多的信息熵,这样一步一步猜直到猜出正确答案。
  接下来,拿这个程序在所有2135种可能的答案上跑一遍,平均用了4。124步猜出正确答案。
  3Blue1Brown觉得这个成绩还不够好,至少没有超过普通人类玩家水平,还需要继续优化。最终成绩逼近理论极限
  成绩不够好的一个问题出在每个单词作为答案的可能性其实并不相同。像aahedaaliiaargh这种偏门单词虽然在允许猜测的总单词列表里,但并不在答案列表的2315个单词里。找一个典型的例子,当遇到abbas(人名,阿巴斯)和abyss(深渊)二选一时,如果程序能知道abyss是常用词,就可以省下一步。
  下一步改进方向就是引入词频统计数据,这样的数据集可以从Wolfram上找到。
  这里还遇到一个问题,比如which和braid的出现频率相差1000倍,但都可以算是常见单词,出现在答案列表里的可能性相差不大。
  解决办法就是用Sigmoid函数做处理,让更多数据靠近0或1。
  将处理后的词频数据与前面的信息量计算结果相结合,得到优化后的信息量计算方法。
  在实际游戏中,也把信息量与词频结合考虑,就能让程序更倾向于选择常见单词。比如在下面的情况中,words和dorms的信息量并不是最高的,但因为词频较高所以优先考虑。
  优化后的成绩到了3。601,平均节省了半步。如果加大计算量,每次根据两步搜索的结果选择单词可以进一步提高成绩。
  而且根据两步搜索的计算结果,3Blue1Brown认为能获得最大信息量的开局单词是crane。此外还可以让程序知道具体哪2315个单词真的是在答案列表里的,用上所有这些技巧后,成绩再次提升到3。438。
  实际上这个成绩的理论极限就不可能低于3。2315种答案意味着有11。17比特的不确定性,而暴力搜索后,前两步能获得的最大信息量在10。01比特,还剩下1。16。也就是说第三步的难度比二选一还要难一点,没有算法能保证每次都正确。
  不过3Blue1Brown还是找到了新办法进一步提升成绩。让程序记住每个正确答案,并在下一局中把猜过的单词排除出去,最终成绩到达3。138,逼近了理论极限。
  看完整个视频后,有网友表示学到的信息论知识比上课学到的还多。也有很多人对到底哪个单词才是最佳开局展开了讨论。虽然两步搜索的结果是crane,不过3Blue1Brown也不确定对于人类玩家来说是不是最佳开局单词。毕竟实际游戏中人类很难像程序一样算出第二步的情况。对于人类来说,soare和tares都是很好的开局。还能挑战变态模式
  程序写好后,3Blue1Brown还做了更多尝试,比如原版Wordle的困难难度,成绩是3。562,还有一个Wordle变态版Absurdle,这个版本不再限制尝试次数,但变态之处在于游戏AI会与玩家对抗。玩家猜测一次后正确答案就会变化,在所有反馈可能性中挑选信息熵最大的那个,就像是在躲避玩家的猜测。
  Absurdle的作者之前还开发过一个变态版俄罗斯方块,每次都给你最不需要的方块。对于这个变态版Wordle,结果3Blue1Brown的程序也挑战成功。
  如果你看到这里也想挑战这个变态版试试,可以复制下方链接。
  视频传送门:
  https:www。youtube。comc3blue1brownvideos
  原版游戏地址:
  https:www。powerlanguage。co。ukwordle
  变态版游戏地址:
  https:qntm。orgfilesabsurdleabsurdle。html

大学生班级户外活动策划书模板(精选4篇)时光如箭,转眼一划而过,一段时间的工作已经结束了,我们又将迎来新的希望,新的工作内容和目标,是时候静下心来好好写写策划书了。相信写策划书是一个让许多人都头痛的问题,以下是小编收……哪吒汽车注册资本增加至22。65亿,增幅28。69IT之家12月30日消息,信息显示,近日,哪吒汽车关联公司合众新能源汽车有限公司发生工商变更,公司注册资本由17。6亿元人民币增加至22。65亿元人民币,增幅28。69。……特斯拉电动汽车交付量将再创新高全年有望超过90万辆12月30日消息,据国外媒体报道,2021年已只剩下两天,各大公司在这一年的成绩也备受关注,电动汽车产量和交付量连年创下新高的特斯拉,在今年能否再创新高,也备受关注。从特……2021年5月思想汇报范文三篇【篇一】敬爱的党组织:为一名国营企业新时期的工作人员,面对新形势新任务,要把学习摆在更加重要的位置,不断开阔自己的视野,提高自己的思想境界,要深刻领会和把握三个代表……马斯克特斯拉和SpaceX在材料物流领域面临巨大通胀压力IT之家3月14日消息,今日上午,特斯拉CEO、SpaceXCEO埃隆马斯克(ElonMusk)通过社交媒体表示,特斯拉和SpaceX最近在原材料和物流领域面临着巨大的通胀压力……医院端午节活动总结最新医院端午节活动总结1:五色新丝缠角棕,手系棕穗寄关爱,在农历五月初五端午节到来之际,北京大学人民医院医务社会工作暨志愿服务工作部携手志愿者开展ldquo;心lsquo;棕……特斯拉加钱6。4万上FSD可享受提前交付刚刚涨了价的特斯拉,又在交付策略上搞事情了:花12000美元选配FSD智能驾驶系统,可提前交付新车。以前需要等半年的ModelY,选配之后交付周期立时缩短到2个月。选配FSD可……2021年医院院长护士节致辞在一年一度的国际护士节来临之际,院长代表医院领导班子向全院护士致以节日的问候。下面是品学网小编给大家整理的20xx年医院院长护士节致辞,仅供参考。20xx年医院院长护士节致辞【……爱护小动物建议书范文动物是我们人类的好朋友,我们不能欺负小动物,那么下面品学网小编为大家带来了爱护小动物建议书范文,希望对你有所帮助!关爱小动物的建议书亲爱的的猎人们:你们好,我……甲骨文第一财季营收94亿美元,同比增长4北京时间9月14日消息,发布营收低于华尔街预期的第一财季财报后,盘后交易中甲骨文股价跌幅一度超过3。常规交易中甲骨文下跌0。79美元,跌幅为0。88,报收于88。89美元。……遵纪守法从我做起演讲稿精选五篇范文【导语】:没有规矩,不成方圆。这句话出自战国时期的孟子之口,从这里就可以看出古人对纪律就格外重视。今天小编为大家带来的是关于遵纪守法从我做起演讲稿,希望对大家有所帮助!【……数学老师一年级学生评语评语是对学生阶段性表现的总结性评价,也是对学生进行教育的一种方式,更是鼓舞、激励、鞭策学生的重要契机;下面是有数学老师一年级学生评语,欢迎参阅。数学老师一年级学生评语1。……
巨人网络公司将元宇宙游戏确定为长期布局的方向之一IT之家12月29日消息,今日,巨人网络在投资者互动平台表示,元宇宙被普遍认为是下一代互联网的形态。公司十分重视元宇宙趋势及其带给游戏产业的机遇。经过前期调研和论证,公司将元宇……单位保洁承包合同范本保洁工作是物业管理的一项基本内容,也是物业管理公司管理水平的一个直观反映。那么对于单位保洁承包合同你了解多少呢?以下是品学网小编整理的单位保洁承包合同,欢迎参考阅读。单位保洁承……电子商务专业大学生酒店实习报告专业:华南师范大学南海学院XX年级电子商务专业实习单位:徐闻县海鲜大酒店实习时间:2009年7月13日到2009年8月23日实习目的:通过实地实习,了解酒店经……特教老师心得体会范文这个暑假到特教学校担任老师实习,深深感受到自己的这次的特教实践的责任重大,让那些特殊孩子过上有尊严的生活,使他们的心灵纯净。下面是品学网小编为大家收集整理的特教老师心得体会范文……中餐摆台注意事项中餐宴会摆台须根据宴会的性质、形式、主办单位的具体要求、参加宴会的人数、面积等来制定方案。下面由品学网小编给大家带来的中餐摆台注意事项,希望各位客官喜欢!什么是摆台中餐宴……集邦咨询工业元宇宙将催动全球智能制造市场规模在2025年达5IT之家11月29日消息,研究机构集邦咨询在今日发布最新的市场报告称,工业元宇宙将催动全球智能制造市场规模在2025年一举突破5400亿美元,2021至2025年复合成长率达1……人音版五年级上册教学工作计划一、学生情况分析:五年级的学生的接受能力增强不少,对音乐也充满了浓厚的兴趣,学生在演唱时基本上能不喊唱,会用正确的方法演唱而且认识到了气息的作用,演唱时也能满怀感情地歌唱……Facebook母公司Meta第四季度营收337亿美元,净利北京时间2月3日凌晨消息,Meta(原Facebook)今天发布了截至12月31日的2021财年第四季度及全年未经审计财报。报告显示,Meta第四季度营收为336。71亿美元,……音频社交平台ClubhouseCEO疫情后用户也离不开我们,北京时间12月9日早间消息,仅仅用了一年时间里,美国音频社交平台Clubhouse脱颖而出人气暴涨,迫使老牌互联网公司Meta、推特、Spotify等推出类似产品,甚至在这一领……音频社交平台Clubhouse聘请首位法律顾问,曾在Pint北京时间10月26日晚间消息,据报道,音频聊天应用Clubhouse已聘请安东尼法尔宗(AnthonyFalzone)为公司的首任法律总顾问。法尔宗曾为图片社交网络Pin……消防安全管理责任书范文消防安全重中之重,消防常识进万家,平安相伴你我他。防范火灾人人有责。下面是小编给大家带来的消防安全管理责任书范文,欢迎大家阅读参考,我们一起来看看吧!消防安全管理责任书范……年度员工工作业绩评语一年即将过去,对于一些优秀员工的工作业绩怎么写评语呢?下面是有年度员工工作业绩评语,欢迎参阅。年度员工工作业绩评语1、不管是做服务员还是当领班,只要分给她工作,她会完成得……
友情链接:易事利快生活快传网聚热点七猫云快好知快百科中准网快好找文好找中准网快软网