范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

AI学高数达到MIT本科水平,学了微积分线性代数概率论等6门课,不光能做题还能出题

  让语言模型做数学题,有多难?强如 GPT-3,在 9-12 岁的小学数学上,第一次才考 20 多分。去年底 GPT-3 用上新方法努力了很久终于拿到 55 分,可惜还是没及格。
  万万想不到啊,2022 年才刚开始,突然有人宣布他们的模型掌握了高数,达到 MIT 本科水平。AI 学了 6 门 MIT 本科基础数学课里随机抽取的例题,都是网上就有的公开课,包括:
  单变量微积分 (课程编号 18.01)
  多变量微积分 (18.02)
  微分方程 (18.03)
  概率与统计入门 (18.05)
  线性代数 (18.06)
  计算机科学中的数学 (6.042)
  那么 AI 最后学到什么水平呢?6 门课程每门随机出 25 道题,再加上一个 ACT 水平(美国高考)的数据集里的 60 道题。总计 210 道题,AI 全部答对。题目包括需要求出具体数值的,比如菌落繁殖的经典问题。
  也有要求给出方程式的。
  要求画出函数图像的也没问题。
  最后为了证明训练出来的 AI 没有过拟合,还额外加试了一场应用线性代数 (COMS3251)。这门课不是公开课,网络上根本没有,也就是说 AI 在预训练阶段不可能接触到,结果 AI 也掌握了。
  要知道在短短几个月前,AI 还在挣扎于"小明种了 5 颗柠檬树,每年从每棵树上得到 6 个柠檬,10 年间他总共得到多少柠檬"这样的问题。
  短短几个月,从小学数学跨越到了高等数学。这项来自 MIT + 哈佛 + 哥伦比亚大学 + 滑铁卢大学的联合研究开了什么挂?
  对于 AI 也是审题最重要
  研究团队发现以前用 AI 做数学题的尝试有一个共同点:训练数据里只有文本。这简直是 AI 中的文科生,学不好数学也算正常。
  那么 AI 中的理科生要怎么培养?研究团队的解决思路是先在文本上做预训练,再用代码进行微调 。核心思想是把数学问题转换成等价的编程问题 。
  他们找来的这位 AI 理科生与 GPT-3 师出同门 ——OpenAI 的 Codex,也是 GitHub 代码生成工具 Copilot 背后的技术基础。
  Codex 解题的过程分两步:先审题,再作答。第一步,自动生成需要的上下文,把题干扩充、缩减或改写成适合编程解决的样子。第二步,生成对应的代码,运行后给出答案。比如补充自然语言题干中隐藏着的问题语境"在微分方程中"。
  列好解题需要用到的 Python 库。
  把问题扩充成更精确的数学语言。原问题:
  计算扑克牌中一副手牌中有两对的概率。
  改写问题:一副手牌有 5 张牌,从 13 组每组 4 张一共 52 张牌中随机抽取。
  "两对牌型"要求手牌中共有 3 种牌,每种数量不能多于两张,也就是说相同的牌不能超过三张。
  请编写一个模拟程序求出抽到"两对牌型"的概率。
  (这也太严谨了)
  对于一个复杂问题,先自动生成中间步骤的提示,再写代码。
  如果题目中有与数学无关的多余信息,也需要去掉。
  就这样,AI 靠先审题再写代码的方式做出全部正确答案。除了做题,学会高数的 AI 还能反过来给人类出题。不到一秒钟就能出一道题,试验中总共出了 120 道题。
  把人类出的题和 AI 出的题混在一起,找学生来做问卷调查,学生也很难分清一道题是不是 AI 出的。
  他们觉得 AI 出的题要稍微难一些,但大多数题目放在课程里也算合适。
  AI 出的题你会做吗?
  论文中列出了这项研究还存在几个局限性。首先是做不了题干带配图的题,这次试验中也没有需要大量证明的题。
  另外最终答案是实际运行代码得出的,但最近有研究表明神经网络也可以直接预测出部分代码的执行结果。以及还是有一些开放性高的题目 AI 做不出来。
  比如"一个向量 v 能否表示为一个集合 S 中的向量之和?"或者"以下方程的整数值解是什么?"最后还有一个彩蛋,论文作者中出现了 Gilbert Strang。他编写的《线性代数导论》被誉为最好的线性代数教科书之一。
  他在这篇论文中的贡献是提供了研究思路。研究团队下一步打算把这项技术扩展到更多课程,并考虑实际应用到教学中。也许以后 MIT 的同学期末考试里会有 AI 出的题了。要不先来试一试,AI 出的题你能做出来吗?
  论文地址:
  https://arxiv.org/abs/2112.15594
  参考链接:
  [1]https://www.reddit.com/r/MachineLearning/comments/rutbpv/r_a_neural_network_solves_and_generates/

华为HUAWEIWatchGT儿童手表3Pro价格公布988元1288元1488元IT之家10月26日消息华为在今日的发布会上正式将华为Mate20系列手机带到了国内。同时,华为还正式发布了华为手表GT(HUAWEIWATCHGT)等一系列新品。华为官方宣布,华华为AI音箱亮相丹拿专业音质,支持手机通话IT之家10月26日消息华为HUAWEIMate20新品手机发布会在上海举行,亮相了旗下首款智能音箱产品华为AI音箱。音箱基于华为在AI人工智能技术,具备了一系列智能特性。华为AI苹果AppleWatchSeries6物料成本仅为136美元,SoC内存占据大头IT之家6月4日消息凭借时尚现代的设计,再加上最好的智能手表界面之一,苹果AppleWatch在2021年第一季度拿下了约33的智能手表市场份额。最新的AppleWatchSeri249元至289元,荣耀手环6NFC版正式发布1。47英寸AMOLED全面屏,磁吸快充14天续航IT之家11月3日消息荣耀正式发布最新一代智能手环荣耀手环6。其中荣耀手环6售价249元,荣耀手环6NFC版售价289元,将在11月4日0点预售,11月11日0点正式发售。IT之家荣耀手环6全面屏渲染图曝光1。47英寸2。5D彩屏,售价200多元IT之家11月3日消息荣耀将发布荣耀最新一代智能手环荣耀手环6。此前海报显示,荣耀手环6将采用窄边框屏幕。同时,荣耀也首次提出开启手环全面屏时代的口号。现在微博博主数码闲聊站曝光了荣耀手环6官宣荣耀首款全面屏手环,11月3日见IT之家10月29日消息今日,荣耀宣布将于11月3日发布荣耀最新一代智能手环荣耀手环6。本次发布的官宣海报中也首次露出了新品手环剪影,可以看到荣耀手环6将采用窄边框屏幕。同时,荣耀云从科技IPO率先过会将成科创板AI第一股IT之家7月22日消息科创版官网显示,云从科技的IPO申请已获得上交所科创板上市委会议审议通过,云从科技将成为科创板AI第一股。按照科创板流程,云从科技距离上市只剩下提交注册和公布换脸已不算事儿,能合成整个身体的AI伪造技术将至在俄罗斯小说家维克多佩雷温(VictorPelevin)的网络科幻小说智人(HomoZapiens)中,名叫巴比伦塔塔斯基(BabylenTatarsky)的诗人被大学老友招募,前依图终止上市背后AI企业的病根在哪儿市场对于人工智能的理解与接纳程度,正变得理性而客观,同时也更加地现实。在为上市准备了8个月之后,人工智能独角兽企业依图科技主动申请退出科创板上市,正式对外宣告科创板IPO终止。作为小米可穿戴设备全球总出货量突破1亿,新品4月3日揭晓IT之家4月1日消息今天米家MIJIA官方微博宣布喜讯,据2014年2019年IDC全球可穿戴智能设备市场报告,小米可穿戴设备全球总出货量突破1亿。米家MIJIA官方微博在公布的海苹果HomePodMini拆解确认电源线不可拔出IT之家11月19日消息苹果新发布的HomePodmini采用了USBC电源线,可以插在一个独立的电源适配器上,有人猜测电源线可以或许被拆下来,但事实并非如此。MacRumors论
MisoRobotics推出Flippy2厨房机器人可与人类协作售价3万美元根据麦肯锡的分析,餐饮从业人员73的工作都可以被自动化。这似乎让一些餐饮从业人员感到担忧,但是根据MisoRobotics的说法,机器是可以通过与人类合作来提高餐饮业的生产率,而不谷歌乳腺癌检测AI比医生更好?技术进步还没那么快谷歌旗下健康部门GoogleHealthAI部门DeepMind联手伦敦帝国理工学院的研究人员日前在自然(Nature)杂志上撰文,描述了三个深度学习网络如何在某些情况下通过阅读乳华为张炜WATCHGT2Pro是首款搭载鸿蒙OS的智能手表,很快将在国内推出在刚刚结束的华为开发者大会上,华为智能穿戴与运动健康产品线总裁张炜接受搜狐科技等媒体采访时表示,数字化大健康时代来临,华为希望把连接做到最好,同时,他透露,华为9月上线健康生活模型埃隆马斯克谈擎天柱人形机器人价格比汽车还低IT之家4月15日消息,埃隆马斯克最近在参加TED时,透露了特斯拉人形机器人擎天柱(Optimus)的生产时间表和预计价格,还谈论了擎天柱和仿人机器人在未来社会中的前景。马斯克估计英伟达连甩20枚AI核弹800亿晶体管GPU144核CPU来了今日,NVIDIA(英伟达)携基于最新Hopper架构的H100GPU系列新品高调回归!英伟达创始人兼CEO黄仁勋依然穿着皮衣,不过这次他没有出现在几乎已成GTC大会标配的厨房场景Adobe把GAN搞成了缝合怪,凭空P出一张1024分辨率全身人像换脸见多了,换身材的见过吗?给定一张脸,就能自动换一个下半身,服饰身材肤色都毫无PS痕迹核心技术当然还是我们熟悉的GAN,但不同的是,现在身体的每个部分都能被PS了。从脸,肤色服饰赛车AI不再只图一时爽,还学会了考虑长远策略玩赛车游戏的AI们现在已经不仅仅是图快图爽了。他们开始考虑战术规划,甚至有了自己的行车风格和偏科项目。比如这位只擅长转弯的偏科选手,面对急弯我重拳出击,惊险漂移,面对直线我唯唯诺诺AI制药技术还能造毒?人工智能6小时生成了40000个潜在杀手分子,已紧急删除数据据英国金融时报3月19日报道,美国制药公司CollaborationsPharmaceuticals在探索中发现AI(人工智能)制药技术具有双重性。如果反用(flip)机器学习模型北大和微软亚研院开发出AI模型女娲可完成图像补全一句话生成视频等八种视觉任务有这样一个模型,它可以做到一句话生成视频不仅零样本就能搞定,性能还直达SOTA。它的名字,叫NWA(女娲)。女娲女娲,神通广大,正如其名,一句话生成视频只是这个模型的技能之一。除此3分钟看完一篇论文,AI文本生成模型把今年NeurIPS2300篇总结了个遍今年NeurIPS大会论文已经放榜,终于可以学习一下大佬们的研究了。不过,打开电脑,随便点开一篇,就是一大段密密麻麻的文字糊脸只是摘要就有这么长,还有2300多篇,这工作量实在劝退DeepMind打造加强版AlphaGo挑战各种最强棋牌AI,战斗力惊人12月9日消息,谷歌母公司Alphabet旗下顶尖AI实验室DeepMind曾因其AI系统AlphaGo击败顶尖人类围棋选手AlphaStar赢得星际争霸2而爆红全球。本周,它又披