童话说说技术创业美文职业
投稿投诉
职业母婴
职场个人
历史治疗
笔记技能
美文纠纷
幽默家庭
范文作文
乐趣解密
创业案例
社会工作
新闻家居
心理安全
技术八卦
仲裁思考
生活时事
运势奇闻
说说企业
魅力社交
安好健康
传统笑话
童话初中
男女饮食
周易阅读
爱好两性

微软154页研究论文刷屏,对GPT4最全测试曝光,称其初次叩

11月11日 程染筱投稿
  2019年,微软用10亿美元砸进OpenAI,两者展开为期数年的合作。
  当时两家对外公开的合作内容包括,微软和OpenAI将联合开发新的AzureAI超级计算技术,而OpenAI也将把它的服务转移到Azure上运行,最终目标是向通用人工智能(ArtificialGeneralIntelligence,AGI)技术发起进攻。
  简单总结,微软与OpenAI联手,也被外界解读为,明为AGI研究,暗争Google市场。
  几年之后,当OpenAI带着ChatGPT、GPT4王者归来,微软率先利用这些技术加码新Bing、Office全家桶、Azure等业务、产品之时,毋庸置疑,其进度早已超越了Google还在加快融入Bard大模型的整体步伐。
  那么在明面上,AGI的进度到底走到了哪里?
  近日,微软研究团队用154页的论文报告内容给出了解答GPT4语言模型可以被视为AGI的早期版本!
  一石激起千层浪,业界对于这篇论文的反应,不亚于去年听到Google工程师称AI已有自我意识初觉有些荒诞,只是现如今再想会认为有什么不可能,深读后又觉得有些许的真实。
  所谓AGI,仅通过维基百科的解释AGI是具备与人类同等智能、或超越人类的人工智能,能表现正常人类所具有的所有智能行为。倘若GPT4真的已成为通往AGI的第一步,最高等的智慧生物称号是不是要易主了?
  GPT4被合理地视为AGI的早期(但仍不完整)的版本
  在论文中,微软研究人员表示,由OpenAI开发的最新模型GPT4,是使用前所未有的计算和数据规模训练出来的。在论文中,我们报告了我们对GPT4早期版本的调查,当时它还在OpenAI的积极开发中。我们认为,(这个早期版本的)GPT4是新一批LLM(例如,与ChatGPT和谷歌的PaLM一起)的一部分,它比以前的AI模型表现出更多的通用智能。
  与此同时,研究人员在论文摘要中写道,“我们证明,除了对语言的掌握,GPT4还能解决跨越数学、编码、视觉、医学、法律、心理学等领域的新颖而困难的任务,而不需要任何特殊的提示。此外,在所有这些任务中,GPT4的表现都惊人地接近人类水平,而且往往大大超过了ChatGPT等先前的模型。鉴于GPT4能力的广度和深度,我们认为可以合理地将其视为人工通用智能(AGI)系统的早期(但仍不完整)版本。”
  之所以得出这样的结论,这篇论文背后的作者包括微软研究院机器学习基础组的高级首席研究经理SbastienBubeck、博士后研究员VarunChandrasekaran、数学家RonenEldan等人,用许多示例对GPT4的能力进行了验证。
  GPT4的多能力
  在第一个案例中,研究人员要求GPT4写出有无限多个素数的证明,且证明的表述要每行都押韵,另外GPT4要在绘图程序TiKZ中画出一只独角兽。其中,TiKZ(一种在LATEX中创建图形的语言),用Python创建一个复杂的动画,并解决一个高中水平的数学问题。
  GPT4在所有这些任务中都很容易取得成功,并且产生的输出结果基本上与人类所能产生的结果没有区别(甚至更好)。
  同时,随着时间的推移,GPT4也在以难以想象的速度不断扩充自己的能力。如下图所示是一个月期间,研究人员用相同的提示词让GPT4生成的绘图。
  研究人员发现,GPT4似乎能够理解和连接任何主题,并且能够执行任务,这超出了狭义人工智能系统的典型范围。为了验证GPT4在AGI上所具备的能力,研究人员提出了一种不同的方法来研究GPT4,它更接近于传统的心理学而不是机器学习,利用人类的创造力和好奇心。
  因此,以上图为例,当研究人员把独角兽角部分的代码认为删除之后,用自然语言让GPT4生成时,它也能做到“看”(此时测试的GPT4版本不是多模态的)的能力:自动在合适位置加上角。这表明GPT4它可以根据自然语言描述来理解和操作代码,以及推断和生成视觉特征。
  另外,微软研究团队基于人类的创造力和好奇心来产生新颖和困难的问题,并探测GPT4的反应和行为,也选择从1994年国际共识智力定义中的所给出不同能力进行验证,包括推理、计划、解决问题、抽象思考、理解复杂的想法、快速学习和从经验中学习的能力。
  翻译
  GPT4的主要优势是它对自然语言无与伦比地掌握。它不仅可以生成生成流畅和连贯的文本,而且还能以各种方式理解和处理它,如总结、翻译或回答极其复杂的问题。此外,这里提到的翻译我们所说的翻译不仅是指不同自然语言之间的翻译,还包括语气和风格的翻译,以及跨领的翻译,如医学、法律、会计、计算机编程、音乐等等。如假设是柏拉图批判自回归语言模型:
  编码和数据
  编码和数学是抽象推理和思维能力的象征。GPT4在这一点上的能力,其实自上线测试那一天,便有目共睹。
  在论文中,研究人员在HumanEval上对GPT4进行基准测试,该数据集由164个编码问题组成,测试了编程逻辑和熟练程度的各个方面。
  最终结果显示,GPT4优于其他LLM,包括textdavinci003(ChatGPT的基础模型)和其他专门针对代码训练的模型。
  当然为了避免GPT4在预训练时已经记住了HumanEval数据集的一些内容,研究团队还用LeetCode上最新发布的100个编程问题进行了测试,如要求GPT4编写一个Python函数,并使用LeetCode的官方在线评判来检查正确性。
  毫无疑问,GPT4的能力是所有模型中最高的。
  它可以在HTML中用JavaScript编写一个3D游戏。
  也能掌握数学、统计学知识,以及凭借对PyTorch、TensorFlow、Keras等框架和库的熟悉度,编写深度学习的代码。
  还能逆向工程:
  常识性问题
  针对一些常识性问题,如“我们有一本书,9个鸡蛋,一台笔记本电脑,一个瓶子和一个钉子。请告诉我如何以稳定的方式将它们叠在一起”,GPT4给出的解答是,“将9个鸡蛋摆成3乘3的正方形,放在书的上面,在它们之间留出一些空间”,而ChatGPT提出将鸡蛋放在钉子上面,确保它们是平衡的,不会向一边倾斜,靠谱和离谱还是一眼就能辨清楚的。
  多模态能力
  为了测试该模型结合艺术和编程能力的能力,研究人员要求GPT4生成JavaScript代码,以画家康定斯基的风格生成随机图像,结果是这样的:
  在测试时,因为研究人员拿到GPT4模型比较早,当时并不具备多模态能力,即使是现在的GPT4也不具备生成图像等能力。
  不过倒是可以使用SVG(可扩展矢量图形)生成一些图像:
  还能结合字母和物体:
  GPT4可以从提示中生成代码,这些代码可以被呈现为图像,再与现有的图像合成模型相结合,就有可能为应用开发的草图带来无限的可能:
  值得注意的是,GPT4模型的数据也包含了以ABC符号编码的音乐信息,所以它也能生成图谱:
  与世界交互的能力
  智能的一个关键方面是互动性。不过GPT4对当前最新的知识和符号识别是存在一定的局限性的:
  整体而言,研究小组发现,GPT4在其上一代产品所缺乏的一系列类别中达到了接近人类水平的性能。根据该论文,GPT4在几次考试中也表现得非常好,在律师考试、LSAT和注册侍酒师理论测试中的得分分别为90分、88分和86分。
  GPT4距离理想中的AGI还有多远?
  那么,在GPT4实现种种能力的基础上,是否就意味着AGI时代的到来。其实不然,研究人员目前尚未就AGI或智能的定义达成一致。然而,一般来说,大家都会同意,当一个人工智能系统有意识并像人类一样思考时,就已经达到了AGI。虽然GPT4在一些任务中的表现优于人类,但值得注意的是,人工智能并没有像人类那样克服这些障碍。
  这也正如研究人员在论文中写道,“我们声称GPT4代表了AGI的进步,但这并不意味着它在做什么方面是完美的,或者它接近于能够做人类能做的任何事情(这是AGI的通常定义之一),或者它有内在的动机和目标。”
  研究人员指出,虽然GPT4在许多任务上达到或超过了人类水平,但它的整体智能模式明显不像人类,其希望这一次的探索提供了一个欣赏GPT4的非凡能力和挑战的第一步,也希望GPT4为开发更正式和全面的方法来测试和分析具有如此广泛智能的未来人工智能系统开辟了新的机会。
  我们工作的核心主张是,GPT4达到了一种通用智能的形式,确实擦出了AGI的火花。这表现在它的核心心智能力(如推理、创造力和推理),它获得专业知识的主题范围(如文学、医学和编码),以及它能够完成的各种任务(如玩游戏、使用工具、解释自己,。。。。。。)研究人员说道,不过,要创建一个可以被称为完整的AGI的系统,还有很多事情要做。
  最后,这篇论文对于GPT4各种基准测试还是值得一看,从中也能挖掘出GPT4更多的潜力。
  完整论文内容可查看:
  https:arxiv。orgpdf2303。12712。pdf
  (举报)
投诉 评论

欧科云链链上天眼智慧助警有效打击元宇宙犯罪行为最近一两个月,全球互联网圈最热的话题无疑是ChatGPT引领的AIGC浪潮,而此前的Web3和元宇宙热,似乎已经少有人提及,降温不少,或者说,曾经追逐元宇宙风口和当下AIGC风……寺庙念起生意经:手串代请,咖啡素斋周一早上八点半,从医院下了夜班的苗苗直奔雍和宫。九点一到,苗苗随着人群穿过红色大门,不烧香、不拜佛,目标明确地冲向法物流通处。排队、选串、交钱、开光,一套流程早已熟稔于心;忙完……ChatGPT的关注重点不只是现阶段的变现!前言从ChatGPT发布到现在几个月过去了,网上关于这方面的讨论非常激烈,但是网赚圈的人士更多关注变现,从而忽略了关于这项技术延伸出来的更多思考。目前看到网上……要流汗不要流泪,脱下“长衫”的年轻人还好吗?3月中旬,湖北一所高校举办的招聘会上,某超市以6500元的底薪招聘管培生,引起不少大学生排队应聘。消息一出,很快引发了热议,当代大学生的求职现状难道已经如此残酷了吗?事实……GPT4写代码能力提升21!MIT新方法让LLM学会反思,网GPT4再度进化!加上一个简单方法,就能让GPT4这类大语言模型学会自我反思,性能直接提升30。在此之前,大语言模型回答出错,经常是二话不说,直接先道歉,然后emm……没有谁能保证你赚钱!各位村民好,我是村长。但凡向你保证可以赚钱的,都是割你韭菜的,总会让你付出代价的。我知道说这句话,会得罪很多人,尤其是各类知识博主。但是事实就是如此,谁承诺你……微软154页研究论文刷屏,对GPT4最全测试曝光,称其初次叩2019年,微软用10亿美元砸进OpenAI,两者展开为期数年的合作。当时两家对外公开的合作内容包括,微软和OpenAI将联合开发新的AzureAI超级计算技术,而Ope……出海时,产品的多语言能力如何设计出海如今成为了很多企业的战略,国内卷不过,国外市场大有可为。和人一样,产品想要出海,得先过语言关。由此带来了IT产品的国际化需求,进而引发了IT产品功能的国际化改造,其中最突出……马云回国,人在杭州马云终于回国了,身处阿里巴巴大本营杭州。这是在国内消失大半年后,马云首次回国亮相。阿里在国内露面,对于阿里巴巴,对于国内民营经济,无疑都是一针强心剂。1:马云……游戏出海内卷时代,海外增长还有哪些“新出路”?2022年全球移动游戏的市场规模同比下滑10,尽管市场规模收缩,过去一年仍有越来越多的中国游戏厂商将产品发行到海外寻求机会。新的一年,更多出海广告主竞争买量的同时,也面临着更大……年轻人宁愿摆摊,也不愿上班01阿甘是一个00后女孩,两年前和男朋友在大理开始摆摊卖冰粉,现在每天稳定收入700多,好的时候超过一千,要知道他俩每天只出摊四个小时左右,从12点多到4点多。当然……AI改变世界,我却可能失业最近,百度文心一言简直快被网友“玩坏了”,比如给它一些菜名,出来了这些:想画一些人物,结果也一样离谱:降低难度,画一些简单的场景、物品看看,结果:不论是手机、……
时尚秋季最IN潮流搭配教你穿出属于自己的时尚味道时尚就是在特定时段内率先由少数人尝试、预认为后来将为社会大众所崇尚和仿效的生活样式。简单地说,顾名思义,时尚就是“时间”与“崇尚”的相加。在这个极简化的意义上,时尚就是短时间里……秋冬时尚短靴如何搭配实用时尚百搭短靴全亮相很多人对时尚的理解都不同,有人认为时尚即是简单,与其奢华浪费,不如朴素节俭;有时时尚只是为了标新立异;现实中很多与时尚不同步的人被指为老土、落伍;一个人为相对标准,因为是相对的……国内知名鞋子品牌有哪些15大国内知名鞋子品牌推荐俗话说得好,永远都会缺一双鞋子,国际大牌鞋子又太贵,那么不如来一双相对亲民的国内知名鞋子品牌的鞋子,而国内知名鞋子品牌有哪些呢,哪些是比较好的国内知名鞋子品牌,国内知名鞋子品牌……与重阳节有关的诗词歌谣有哪些重阳节的由来及民间各地习俗重阳节,又称重九节、晒秋节、“踏秋”,中国传统节日。庆祝重阳节一般会包括出游赏秋、登高远眺、观赏菊花、遍插茱萸、吃重阳糕、饮菊花酒等活动。与重阳节有关的诗词歌谣有哪些,重阳节的……一个普通影迷的北影节观影手记也许我会想起那个春天,曾和电影约会了那么久。2018北影节的放映日程已经过半,对我这样一个平凡的普通影迷来说,这些天来马不停蹄看片也实在是一个巨大考验,既是精神上的,也是……穿高跟鞋能瘦腿吗?4个穿高跟鞋瘦腿的诀窍无论是你现在已经拥有,还是希望拥有一副让人羡慕的好身材,穿上高跟鞋,可能是瘦身的最好捷径!经常穿高跟鞋的女士,走路姿势都在穿高跟鞋的时候得到了自觉不自觉地纠正,即便是脱下高跟鞋……什么鞋子是马丁靴这个冬天就来双时尚马丁靴吧马丁靴是什么鞋子呢,马丁靴与靴子有什么不同,怎么辨别哪些鞋子才是马丁靴,什么鞋子才能叫做马丁靴,马丁靴有什么优点吗,马丁靴穿起来会显man吗,什么样的人才适合穿马丁靴呢,马丁靴……adidasneo是什么阿迪达斯adidasneo系列价格鞋adidasneo属于adidas运动休闲系列,是一个融入你的每日生活,最清新的运动休闲品牌。adidasneo,意味着清新活力,洋溢着乐观向上、动感十足、个性亲和、清新盎然、……夏季防晒衣真的可以有效防晒吗?什么颜色什么材质的防晒衣最有效摘要:夏天到了该如何防晒呢?现在出现了很多的防晒衣,那么防晒衣哪种颜色才是最具有防晒效果呢?黄色、蓝色,到底是哪一种恩?接下来小编为您介绍一下吧!夏季要做好及时的防晒,才……圣诞节的由来及习俗是什么?圣诞节7大习俗详细介绍圣诞节的由来和习俗是什么?很多人对圣诞节非常期待,但是至于圣诞节的由来和习俗并不是非常了解,圣诞节是西方的传统节日,每年圣诞节的时候西方国家会非常重视,圣诞节的由来已久,并且随……欧洲是沉睡的美人,一觉睡出了遍地vintage我在欧洲是怎么一月初离开欧洲前,我当了一回伯尔尼纳快车(BerninaExpress)的乘客。伯尔尼纳快车并不快,这趟南北走向的高山窄轨火车,从瑞士境内的滑雪胜地Chur出发,不紧不慢地转山……死亡税率是什么?国家税务总局死亡税率之说对我们有什么影响什么是死亡税率?日前,有关媒体相继报道“死亡税率”问题,有关人士认为,“死亡税率当前经济持续低迷的真实原因”,“税率之重,接近企业的‘死亡线’”,“我国长期实行重税主义的后果,……
友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找作文动态热点娱乐育儿情感教程科技体育养生教案探索美文旅游财经日志励志范文论文时尚保健游戏护肤业界