范文健康探索娱乐情感热点
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

给AI补数学课,人工智能可证明数学数据库中82的问题了

  不得不说,科学家们最近都在痴迷给 AI 补数学课了。这不,脸书团队也来凑热闹,提出了一种新模型,能完全自动化论证定理,并显著优于 SOTA。
  要知道,随着数学定理愈加复杂,之后再仅凭人力来论证定理只会变得更加困难。因此,用计算机论证数学定理已经成为一个研究焦点。
  此前 OpenAI 也提出过专攻这一方向的模型 GPT-f,它能论证 Metamath 中 56% 的问题。而这次提出的最新方法,能将这一数字提升到 82.6%。
  与此同时,研究人员表示该方法使用的时间还更短,与 GPT-f 相比可以将计算消耗缩减到原本的十分之一。难道说这一次 AI 大战数学,是要成功了?还是 Transformer
  本文提出的方法为一种基于 Transformer 的在线训练程序。大致可以分为三步:
  第一、在数学证明库中预训练;
  第二、在有监督数据集上微调策略模型;
  第三、在线训练策略模型和判断模型。
  具体来看是利用一种搜索算法,让模型在已有的数学证明库中学习,然后去推广证明更多的问题。其中数学证明库包括 3 种,分别是 Metamath、Lean 和自研的一种证明环境。这些证明库简单来说,就是把普通数学语言转换成近似于编程语言的形式。
  Metamath 的主库是 set.mm,包含基于 ZFC 集合论的约 38000 个证明。Lean 更为人熟知的,是微软那个可以参加 IMO 赛事的 AI 算法。Lean 库就是为了教会同名算法所有的本科数学知识,并让它学会证明这些定理。
  这项研究的主要目标,是为了构建一个证明器,让它可以自动生成一系列合适的策略去论证问题。为此,研究人员提出了一个基于 MCTS 的非平衡超图证明搜索算法。
  MCTS 译为蒙特卡洛树搜索,常用于解决博弈树问题,它因为 AlphaGo 所被人熟知。它的运行过程,就是通过在搜索空间中随机抽样来找寻有希望的动作,然后根据这个动作来扩展搜索树。
  本项研究采用的思路类似于此。搜索证明过程从目标 g 开始,向下搜索方法,逐步发展成一个超图(Hypergraph)。当出现一个分支下出现空集时,就意味着找到了一个最优证明。最后,在反向传播过程中,记下超树的节点值和总操作次数。
  在这个环节中,研究人员假设了一个策略模型和一个判断模型。策略模型允许判断模型进行抽样,判断模型可以评估当前策略找到证明方法的能力。整个搜索算法,就以如上两个模型作为参照。而这两个模型都是 Transformer 模型,且权值共享。
  接下来,就到了在线训练的阶段。这个过程中,控制器会将语句发送给异步 HTPS 验证,并收集训练和证明数据。然后验证器会将训练样本发送给分布式训练器,并定期同步其模型副本。
  实验结果
  在测试环节,研究人员将 HTPS 与 GPT-f 进行了比较。后者是 OpenAI 此前提出的数学定理推理模型,同样基于 Transformer。结果表明,在线训练后的模型可以证明 Metamath 中 82% 的问题,远超 GPT-f 此前 56.5% 的记录。
  在 Lean 库中,这一模型可以证明其中 43% 的定理,比 SOTA 提高了 38%,以下是该模型证明出的 IMO 试题。
  不过目前它还不是十全十美。比如在如下这道题中,它并没有用最简便的办法解出题目,研究人员表示这是因为注释中出现了错误。
  One More Thing
  用计算机论证数学问题,四色定理的证明便是最为人熟知的例子之一。四色定理是近代数学三大难题之一,它提出"任何一张地图只用四种颜色就能使具有共同边界的国家,着上不同的颜色"。
  由于这一定理的论证需要大量计算,在它被提出后 100 年内,都没有人能完全论证。直到 1976 年,在美国伊利诺斯大学两台计算机上,经过 1200 小时、100 亿次判断后,终于可以论证任何一张地图都只需要 4 种颜色来标记,由此也轰动了整个数学界。
  加之随着数学问题愈加复杂,用人力来检验定理是否正确也变得更加困难。近来,AI 界也把目光逐步聚焦在数学问题上。
  2020 年,OpenAI 推出数学定理推理模型 GPT-f,可用于自动定理证明。这一方法可完成测试集中 56.5% 的证明,超过当时 SOTA 模型 MetaGen-IL30% 以上。
  同年,微软也发布了可以做出 IMO 试题的 Lean,这意味着 AI 能做出没见过的题目了。去年,OpenAI 给 GPT-3 加上验证器后,做数学题效果明显好于此前微调的办法,可以达到小学生 90% 的水平。
  今年 1 月,来自 MIT + 哈佛 + 哥伦比亚大学 + 滑铁卢大学的一项联合研究表明,他们提出的模型可以做高数了。总之,科学家们正在努力让 AI 这个偏科生变得文理双全。
  论文地址:
  https://arxiv.org/abs/2205.11491

小米米家智能蒸烤箱发布一机多用,售价1499元IT之家8月21日消息小米今天发布了米家智能蒸烤箱,将于8月26日早10点在小米商城开启众筹,众筹价1299元,零售价1499元。据官方介绍,米家智能蒸烤箱拥有30L大容积,采用立疑似诊断准确率96只需20秒,这个AI什么来头?应收尽收应治尽治不漏一人。这是目前联防联控抗击疫情的关键,而其中的重点则是确诊病例和疑似病例的筛查,而AI正在成为疫情防控战的新兵种。对此,阿里达摩院就传来好消息,全新的AI诊断技只有巴掌大的卫星,能绕地球飞行检测辐射美国路易斯安那大学拉斐特分校的学生制造了一颗名为CAPE3的微型卫星,并搭载他们自己设计制造的芯片。这颗卫星最近搭乘维珍轨道公司的火箭进入近地轨道,围绕地球快速飞行,并将有关辐射的美国夫妇家中Nest摄像头突然说话,改密码也没用IT之家9月29日消息得益于智能显示器,智能摄像头,恒温器和智能门铃等设备,我们的房屋正在变得越来越智能。这些智能家居设备不仅使我们的生活更简单,而且使我们在家里感到更安全。但是,华为智能眼镜专利曝光,镜腿可镶嵌智能手表IT之家2月11日消息去年11月,华为消费者业务CEO余承东在接受CNBC采访时表示,该公司正在开发与智能手机配合使用的AR眼镜,华为AR眼镜将于今年年底或明年亮相。现在荷兰网站L优惠900元!石头扫地机器人T7Pro双11预热开启到手价2999元IT之家10月10日消息今年上半年,石头科技带来了扫地机器人T7Pro旗舰新品,售价3899元,这是石头科技2020年度AI科技探索新品,产品具备石头科技最新前沿技术成果和最好的用Redmi智能电视X系列三款齐发全系标配8单元重低音音响系统IT之家5月23日消息今天Redmi智能电视官微继续预热Redmi智能电视X系列,透露称新品全系标配8单元重低音音响系统。官方称,全系标配8单元重低音音响系统,4个12。5W超大功卢伟冰不止Redmi10X,5月26日将发布Redmi智能电视X65X55X50IT之家5月18日消息卢伟冰今晚在微博透露,5月26号与Redmi10X一起发布的,还有Redmi智能电视X65X55X50三款新品。卢伟冰还称,这次RedmiX系列智能电视在画质小米疑开发WearOS智能手表,配套应用或取名MiWearIT之家9月25日消息据外媒9to5Google报道,小米正在开发一款智能手表,运行谷歌WearOS操作系统。谷歌WearOS2。28版本中出现了名为MiWear的配套应用。据了解库克苹果正在研究可在早期阶段识别健康风险的技术IT之家1月21日消息AppleWatch经过这些年的发展,已经越来越不局限于一款智能手表,而是用户不可或缺的健康伴侣,而苹果在运动健康和医疗方面也在投入越来越多的关注。根据外媒A小米手环4复联限量版礼盒开箱图赏属于漫威迷们的礼物在可穿戴设备领域,小米手环一直保持着不错的市场表现,前不久他们也正式发布了小米手环4系列,新品除了标准版和NFC版本外,还包括小米手环4复仇者联盟系列限量版礼盒。极客之选也于最近拿
IBM推出AutoAI允许企业人工智能模型开发自动化由于IBMWatsonStudio(之前的DataScienceExperience)等产品,部署AI应用和服务并不像以前那样具有挑战性。于2017年首次亮相的WatsonStud小爱蓝牙音箱随身版开启预约售价49元IT之家11月19日消息小爱蓝牙音箱随身版现已在小米商城开启开启预约,售价为49元。小爱蓝牙音箱随身版整机重量为52g,和一枚鸡蛋的重量相似。长按或者短按机身底部的语音激活按钮可以讯飞同声字幕功能上线,追剧自带中英双语实时字幕IT之家5月26日消息根据讯飞官方的消息,讯飞翻译机3。0针对线上跨语言交流场景,新增同声字幕功能,官方称可以实现追剧自带中英双语实时字幕。IT之家了解到,讯飞称讯飞翻译机3。0既讯飞推两款语音转写新品识别率达98,299元起IT之家5月25日消息今天,科大讯飞智能录音转写赛道正式发布2款新品讯飞智能录音笔A1讯飞会议宝S8,预售价格分别为299元和589元,这是自2019年5月讯飞首款智能录音笔上市后小米有品上架众筹新品水槽净洗机与AI录音笔IT之家8月13日消息日前,小米有品相继上架了多款众筹新品,包括墨案AI录音笔与美仕杰水槽净洗机。墨案AI录音笔墨案AI录音笔支持蓝牙BLE5。0,内置300mAh电池,配备16G智能音箱大混战赔本的买卖何时盈利?天猫精灵,把空调关了小度小度,今天天气如何小爱同学,打开窗帘如今,智能音箱不再是一个边缘化的产品,随着产品价格越来越低内容越来越丰富功能越来越智能,琳琅满目的智能音箱产品逐渐进入大RealmeTV仓库谍照曝光证实屏幕规格为43英寸IT之家5月14日消息Realme即将推出的电视产品已经被多次曝光,早在二月份的时候,我们就已经在BIS认证平台上看到了它的身影。最近,这款电视也获得了谷歌和蓝牙SIG平台的必要认小米自研超级拟人技术,雷军喊出了180000米粉的名字IT之家8月14日消息在小米手机十周年之际,小米将3。7亿元返还给小米手机1首批用户,每人赠送1999元无门槛红包。据小米公司公众号消息,雷军还为初代小米手机用户录了一段话,而实际苹果HomePod上季度出货量仅为160万台,市占率不增反降IT之家2月21日消息外媒StrategyAnalytics近日一份智能音响报告指出,苹果在去年2月推出的智能音响HomePod第四季出货量较上一季增长45,为160万台。不过市占相约跨年12月31日起,小米小爱音箱将支持召唤微软小冰IT之家12月26日消息微软小冰大家都不陌生,作为小娜的妹妹,小冰一直以精灵古怪的形象示众。不久前小爱同学更新3。5版本之后,新增支持QQ音乐,召唤小冰尝鲜版上线,但是小米官方并没报告AppleWatch继续引领可穿戴市场,本季度出货1620万台IT之家3月5日消息外媒appleinsider引用IDC数据,表示苹果继续领跑可穿戴设备市场,AppleWatch,AirPods和Beats耳机的销售帮助苹果保持其在2018年