范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

给AI补数学课,人工智能可证明数学数据库中82的问题了

  不得不说,科学家们最近都在痴迷给 AI 补数学课了。这不,脸书团队也来凑热闹,提出了一种新模型,能完全自动化论证定理,并显著优于 SOTA。
  要知道,随着数学定理愈加复杂,之后再仅凭人力来论证定理只会变得更加困难。因此,用计算机论证数学定理已经成为一个研究焦点。
  此前 OpenAI 也提出过专攻这一方向的模型 GPT-f,它能论证 Metamath 中 56% 的问题。而这次提出的最新方法,能将这一数字提升到 82.6%。
  与此同时,研究人员表示该方法使用的时间还更短,与 GPT-f 相比可以将计算消耗缩减到原本的十分之一。难道说这一次 AI 大战数学,是要成功了?还是 Transformer
  本文提出的方法为一种基于 Transformer 的在线训练程序。大致可以分为三步:
  第一、在数学证明库中预训练;
  第二、在有监督数据集上微调策略模型;
  第三、在线训练策略模型和判断模型。
  具体来看是利用一种搜索算法,让模型在已有的数学证明库中学习,然后去推广证明更多的问题。其中数学证明库包括 3 种,分别是 Metamath、Lean 和自研的一种证明环境。这些证明库简单来说,就是把普通数学语言转换成近似于编程语言的形式。
  Metamath 的主库是 set.mm,包含基于 ZFC 集合论的约 38000 个证明。Lean 更为人熟知的,是微软那个可以参加 IMO 赛事的 AI 算法。Lean 库就是为了教会同名算法所有的本科数学知识,并让它学会证明这些定理。
  这项研究的主要目标,是为了构建一个证明器,让它可以自动生成一系列合适的策略去论证问题。为此,研究人员提出了一个基于 MCTS 的非平衡超图证明搜索算法。
  MCTS 译为蒙特卡洛树搜索,常用于解决博弈树问题,它因为 AlphaGo 所被人熟知。它的运行过程,就是通过在搜索空间中随机抽样来找寻有希望的动作,然后根据这个动作来扩展搜索树。
  本项研究采用的思路类似于此。搜索证明过程从目标 g 开始,向下搜索方法,逐步发展成一个超图(Hypergraph)。当出现一个分支下出现空集时,就意味着找到了一个最优证明。最后,在反向传播过程中,记下超树的节点值和总操作次数。
  在这个环节中,研究人员假设了一个策略模型和一个判断模型。策略模型允许判断模型进行抽样,判断模型可以评估当前策略找到证明方法的能力。整个搜索算法,就以如上两个模型作为参照。而这两个模型都是 Transformer 模型,且权值共享。
  接下来,就到了在线训练的阶段。这个过程中,控制器会将语句发送给异步 HTPS 验证,并收集训练和证明数据。然后验证器会将训练样本发送给分布式训练器,并定期同步其模型副本。
  实验结果
  在测试环节,研究人员将 HTPS 与 GPT-f 进行了比较。后者是 OpenAI 此前提出的数学定理推理模型,同样基于 Transformer。结果表明,在线训练后的模型可以证明 Metamath 中 82% 的问题,远超 GPT-f 此前 56.5% 的记录。
  在 Lean 库中,这一模型可以证明其中 43% 的定理,比 SOTA 提高了 38%,以下是该模型证明出的 IMO 试题。
  不过目前它还不是十全十美。比如在如下这道题中,它并没有用最简便的办法解出题目,研究人员表示这是因为注释中出现了错误。
  One More Thing
  用计算机论证数学问题,四色定理的证明便是最为人熟知的例子之一。四色定理是近代数学三大难题之一,它提出"任何一张地图只用四种颜色就能使具有共同边界的国家,着上不同的颜色"。
  由于这一定理的论证需要大量计算,在它被提出后 100 年内,都没有人能完全论证。直到 1976 年,在美国伊利诺斯大学两台计算机上,经过 1200 小时、100 亿次判断后,终于可以论证任何一张地图都只需要 4 种颜色来标记,由此也轰动了整个数学界。
  加之随着数学问题愈加复杂,用人力来检验定理是否正确也变得更加困难。近来,AI 界也把目光逐步聚焦在数学问题上。
  2020 年,OpenAI 推出数学定理推理模型 GPT-f,可用于自动定理证明。这一方法可完成测试集中 56.5% 的证明,超过当时 SOTA 模型 MetaGen-IL30% 以上。
  同年,微软也发布了可以做出 IMO 试题的 Lean,这意味着 AI 能做出没见过的题目了。去年,OpenAI 给 GPT-3 加上验证器后,做数学题效果明显好于此前微调的办法,可以达到小学生 90% 的水平。
  今年 1 月,来自 MIT + 哈佛 + 哥伦比亚大学 + 滑铁卢大学的一项联合研究表明,他们提出的模型可以做高数了。总之,科学家们正在努力让 AI 这个偏科生变得文理双全。
  论文地址:
  https://arxiv.org/abs/2205.11491

三星为GalaxyWatch4推出环保表带,使用苹果皮制成IT之家9月11日消息三星宣布为GalaxyWatch4推出六款限量版表带,由可回收和环保材料制成,包括苹果皮。该系列是与SamiMir合作制作的,SamiMir是一位时装设计师,49元,小米电子温湿度计开启众筹支持磁吸,可存储温湿度数据IT之家9月22日消息今日,小米电子温湿度计在小米商城开启众筹,零售价59元,众筹价49元。小米电子温湿度计选用了35mm35mm的电子墨水屏作为显示屏,内置瑞士Sensirion手机智能语音助手为何离我们越来越远了你或许幻想过,拥有一个像电影钢铁侠贾维斯一样的AI管家,它可以进行独立思考,还能帮你处理各种生活事务。随着时间的推移,人工智能技术已经化身为手机语言助手出现在我们的生活中。我们熟悉中兴发布YouCare5G智慧T恤可监测多项体征指标IT之家6月29日消息在昨日举行的MWC2021世界移动通信大会的首日,中兴通讯与ACCYOURATE联合发布了YouCare5G智慧T恤。中兴智慧T恤的介绍视频IT之家了解到,这小米手环6官宣实现全面屏,将于29日发布会亮相IT之家3月27日消息小米将于3月29日晚1930举办发布会,预计会有小米11ProUltra小米MIX笔记本等产品亮相,官方表示可能是有史以来新品最多的一次发布会。今日小米智能生华为WatchGT2现已支持从iOS手机的运动健康应用下载更换新表盘感谢IT之家网友百慕大的冰的线索投递!IT之家4月30日消息据IT之家网友反馈,华为WatchGT2现已推送1。0。12。20版本固件,支持从iOS手机的运动健康应用下载更换新表盘脑机结合,你准备好成为超人了吗?脑机接口可以给人类带来什么呢?恢复失去的能力?超越过去的潜能?新纪录片我是人类记录了神经技术如何帮助人们恢复视力重新训练身体和治疗疾病然后让我们所有人都变得更加强大。一个下雨天,比红魔手表精钢版发布续航20天搭载GPS,599元IT之家5月27日消息红魔游戏手机于今日下午举办发布会,正式发布了腾讯红魔6R游戏手机。与此同时,红魔还带来了红魔手表的精钢版,质感升级,售价依旧维持在599元。这款产品配备了可调小米MIX4一指连伴侣将于8月20日在小米社区App开启0元众测IT之家8月10日消息今日晚间,小米举办2021雷军年度演讲,同时正式发布了全面屏手机小米MIX4。小米MIX4手机搭载了UWB一指连技术。据小米官方介绍,UWB频宽高达500MH郭明錤苹果AppleWatchS7外观大变,首次采用平边和窄边框设计,9月发布与量产IT之家9月10日消息今日下午,天风国际分析师郭明錤发布报告称,市场担忧AppleWatchS7因面临生产问题而无法如期在9月发布与量产,且因出货不足导致组装厂商立讯的AppleW揭秘奥运冲浪首金AI当教练,还筛选出最佳比赛地点8月3日消息,今年的东京奥运会中首次加入了冲浪这一比赛项目。上周二美国冲浪运动员CarissaMoore在女子冲浪比赛中夺冠,取得了奥运史上的首枚冲浪项目的金牌。据华尔街日报报道,
我在VR里看冬奥运动员在我头顶飞这简直太好玩了,我还没有玩够!运动员在冬奥会场馆内沉迷玩VR游戏的视频近日在多个社交媒体上广泛传播。冬奥场馆内的VR游戏实况随着全民对冬奥赛事的关注度提高,越来越多的人感受到冰雪运摩托罗拉推出5G颈环搭载骁龙8Gen1,5000mAh电池,给VR眼镜配了个主机IT之家2月15日消息,摩托罗拉今天发布了一款颈部可穿戴5G设备,旨在为轻量级VR和AR头显(XR头显)提供动力,例如联想的ThinkRealityA3智能眼镜。据Engadget英国保险公司与VR相关的索赔在2021年增加了31,大多数都是电视屏幕破了IT之家2月14日消息,一个更有趣的迹象表明,VR头戴设备似乎越来越受欢迎了。保险公司Aviva表示,涉及VR头戴设备的家庭内容索赔在2021年增加了31,自2016年以来总体增长CounterpointARVR设备出货3年翻10倍破亿台,苹果Meta索尼或成最大推手1月20日消息,近日Counterpoint发布报告,预测2025年XR(扩展现实)头戴设备出货量有望突破1亿台,相较2021年增长近10倍。2022年预计发布的新产品OculusMeta高管回应停止开发VRAR传闻不光没停止,还将扩大投入1月7日消息,日前有报道称Meta已在2021年11月叫停VRAR设备操作系统的开发工作项目XROS。Meta发言人公司元宇宙项目RealityLabs的通讯经理SheevaSlo华米AmazfitGTR3ProGTS3智能手表发布全天监测,售价899元起IT之家10月12日消息,今天下午华米科技举行了Amazfit2021全球年度新品发布会,会上正式发布了AmazfitGTR3AmazfitGTR3Pro和AmazfitGTS3智中科院研发出有触感的机器人,成功为猪肝进行了微创手术IT之家1月17日消息,据中科院消息,近日,中国科学院深圳先进技术研究院医工所微创中心研究员王磊团队在基于布拉格光栅光纤传感原理在微创手术的应用活体组织触诊的研究中实现了活体组织的众筹价299元起,小米发布米家窗帘伴侣无需改造轨道6400mAh内置电池,支持小爱同学米家App控制感谢IT之家网友HBYeDataBase的线索投递!IT之家3月7日消息,今日,小米推出了米家窗帘伴侣,支持多种开合方式与智能联动,零售价349元起,众筹价299元起。其中,轨道版IDCAI应用不断落地,预计2025年中国人工智能市场总规模将超184亿美元IT之家3月11日消息,今日,IDC发布报告称,预计全球AI市场规模将在2021年达到885。7亿美元(约5597。62亿元人民币),并在2025年增至2218。7亿美元(约1。4AI破解古文字登Nature封面修复缺失文字,精确地理位置和书写时间最新一期的Nature封面,AI再度来到舞台中央,这一次是在破译古文字方面立功了。这是一种基于Transformer架构的方法,由DeepMind谷歌牛津大学等多家研究机构联合开发揭秘AI造芯助力突破摩尔定律,释放人力成本2月9日消息,据IEEE报道,随着AI在芯片设计方面的应用,芯片性能提升周期在逐渐缩短,有可能打破每隔18个月芯片性能可提升一倍的摩尔定律。MathWork公司MATLAB平台的高