范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

让ChatGPT长手!Meta爆火新论文,让语言模型学会自主用工具

  鱼羊 Pine 发自 凹非寺
  量子位 | 公众号 QbitAI
  ChatGPT爆火,Meta也坐不住了。
  微软和谷歌正在搜索引擎那边刺刀拼刺刀呢,谁想Meta冷不防抛出一篇新论文,顿时吸引全场目光:
  瞄准ChatGPT的"软肋",让大语言模型 自行学会了使用工具 !
  简单来说,基于Meta的这个思路,ChatGPT这些大语言模型可以缺啥补啥:
  不会算数,就自己掏出计算器计算;需要最新信息,就自己连接搜索引擎搜索……
  是不是有点AI自己操作自己内味儿了?
  论文一出,不少AI研究者就将其视作" 过去几周里最重要的论文 "。
  这篇论文给人们打开了思路,让大语言模型未来可以成为所有事情的起点。
  还有网友表示:我老婆原本不太关心AI,听说Meta这论文都惊了。普通人真的得好好想想这事儿了。
  自学工具用法的大语言模型
  这一回,Meta给这个会使工具的语言模型起名 Toolformer 。
  Toolformer的内核逻辑,总结下来很简单,就是:
  专业的任务交给专业的工具来做。
  在生成文本的过程中,遇到特定的任务,Toolformer会直接调用所需工具的API。
  比如说,在执行这个任务:1400名参与者,有400人通过了测试,占多大比例? (为了让ChatGPT掌握数学运算,OpenAI可没少折腾)
  Toolformer丝毫不慌,直接"掏出"计算器,现场计算得出结果: 29% 。
  又或者说,想要备注个事情,只知道是周五,具体日期还不知道?
  没关系,翻出日历查一下就好了。
  甚至翻译任务也可以直接丢给它,各国语言都能够识别并翻译,直接省去了在软件切换语言的工夫。
  除了这些工具之外,Toolformer还能够调用Q&A以及搜索引擎等工具。
  这时,就已经有网友开始畅想未来了:
  现在,ChatGPT版必应能帮你比较酒店价格,那未来有了Toolformer,预定性价比高的酒店岂不是也可以甩给AI去做了。
  不过话说回来,Toolformer面对不同的任务都能行云流水般地调用对应的工具,它是怎么做到的呢?
  一言以蔽之,Toolformer经过训练,能够在生成文本中插入API调用,直接将任务外包出去。
  在这其中,训练的过程是以 自监督 的方式完成的。这意味着无需大量人类标注好的数据,Toolformer只需要少量演示就能学会调用API。
  具体来说,先给Toolformer提供少量已经手动标注好的例子,然后让语言模型在实践中 生成一个更大的包含示例的数据集 。
  这个过程主要分成三步:
  首先是 取样 ,通俗点讲就是看输入的文本提示中,哪个地方需要调用哪种工具,然后直接将"调用的API"插入到对应的地方;
  其次是 执行 ,执行上一步的"调用API"任务,将生成的文本直接插入进去;
  最后是 过滤 ,上一步中工具生成的文本如果对输入文本来说用处不大的话,就可以直接pass掉,保留对文本有用的地方。
  这样一来,基于这些有用的数据集,Toolformer便可以对预先训练好的大语言模型进行微调。
  讲了这么多,Toolformer的真实效果到底如何,有没有一个横向的数据对比?
  论文将Toolformer和多个其他大语言模型,包括GPT-J,OPT (66B) 以及GPT-3(175B) 进行了对比,比较了它们在数学、Q&A以及机器翻译等方面的能力。
  结果显示,在学习使用工具后,GPT-J的零样本学习性能的到了显著的提高。
  Toolformer:是在GPT- J上微调,并加强了CCNet子集中的API调用/ Toolformer (disabled):同上,但解码期间禁用API调用
  并且在大多数任务上性能都有明显提高,在一些下游任务中Toolformer甚至已经超过了GPT-3。
  "未来大语言模型发展的重要分支"
  说到这里,不知道你怎么看这件事儿。
  有不少网友是已经按捺不住,想着去拔AI电源了。
  而引发更多讨论的,是这样一种观点:Toolformer可能是未来LLM(大语言模型)发展的一个重要分支。
  大语言模型进化出使用工具的能力,知道应该在何时、使用何种工具来实现需求,也就意味着许多在今天还需要人类和AI协作完成的工作,未来AI都能自己搞定了。
  比如现在还多少有些"人工智障"的语音助手,如果背后有ChatGPT+Toolformer的技术能力支撑,那么从挑选符合需求的餐厅,到直接订座,这一系列动作都可以被丝滑地串联起来。
  又比如微软的必应搜索接入ChatGPT。如果这些大语言模型能充分调用各种API、使用UI,那它不仅能帮人们完成搜索,还能完全改变人们操作网页的方式——一切输入都可以化简为自然语言。
  甚至,ChatGPT这样的模型,借助各种API重写自己的代码,也将成为可能。
  事实上,让AI掌握工具的使用方法这个研究方向,也并不只有Meta在做。
  比如谷歌即将嵌入到搜索中的 Bard ,背后模型LaMDA就内置了一套工具箱,包括计算器、翻译器和访问搜索引擎获取外部信息的接口。
  还有开源项目 LangChain ,也致力于将大语言模型与外部的计算、知识来源相结合,以开发真正可用的应用程序。
  而现在,Meta又使大模型对工具的使用"熟练度"、"自主性",更上一层楼。
  不过,也有网友指出,Toolformer所展现出的"自学"能力,还是一个初级、"狭义"的版本。
  这些模型本身仍然是纯粹的函数:给定相同的输入(包括采样时的随机值),它将总是产生相同的输出。
  有点像是在说,一个大语言模型能学会将特定领域的语言作为其自然语言的一部分,以此纳入来自外部工具的知识。
  One More Thing
  Meta新论文炸场,还挑动了人类的"反思"神经。
  这不,新鲜梗图已经出炉:
  人类在沉迷,而机器在学习。
  论文地址:
  https://arxiv.org/abs/2302.04761
  参考链接:
  [1] https://twitter.com/timo_schick/status/1624058382142345216
  [2] https://twitter.com/mathemagic1an/status/1624870248221663232
  [3] https://twitter.com/Tisoga/status/1624543837745192960
  — 完 —
  量子位 QbitAI · 头条号签约
  关注我们,第一时间获知前沿科技动态

7月2日讯11笔新交易,勇士迎首签,KD或1换5,戈贝尔1换9入狼队1Woj报道,森林狼送出比斯利贝弗利凯斯勒(今年的首轮22顺位)范德比尔特莱安德罗博尔马罗和四个首轮签,从爵士得到戈贝尔。2名记BrianWindhorst节目中透露,篮网对KD的微信更新到8。0。24版本,新增3个实用功能,很多人还不了解,看看我们的微信已经更新到8。0。24版本了,不知道大家都更新了没有呢?一般朋友们最好奇的就是微信到底更新了哪些内容呢?很多人都不了解,就像现在的8。0。24版本,其实它是新增了几个实用微信上线大爆炸功能,来试试最近这几天微信也是发布了新版本,带来了iOS微信8。0。24和安卓微信8。0。24。而且还带来了一些新变化,例如iOS微信的朋友圈改进和视频通话的优化等。同时iOS微信也可以查看已微信更新了8。0。24正式版,功能史诗级最强头号周刊近日,微信安卓平台更新了最新的8。0。24正式版,这里面有哪些使我们期待的新功能呢?我接着往下看。这次8。0。24正式版的更新,微信里面可以快速提取文字,用户只要按住图片,7。3号联盟最新交易汇总,骑士重磅,其他全是小兵,大将还得等等7月3号联盟新交易,骑士重磅!其他全是小兵,大将们比如凯里欧文威斯布鲁克凯文杜兰特的消息还需再等等,哈登被爆正在与76人官方进行谈判,新合同估计会很快落实!骑士队开出了史上最大的合支付限额!微信青少年模式功能上新图说微信青少年模式功能上新采访对象提供新民晚报讯(记者杨玉红)近日,微信正式推出青少年模式支付限额功能。更新到微信安卓版本8。0。23后,父母或监护人可在青少年模式中设置微信支付的微信又更新!图片快速提取文字功能升级见面聊天,最怕尴尬到抠出三室一厅。微信聊天,最怕发图片电话多少,截图发你快递单号,截图发你见面地址,截图发你好看的网址,截图发你见到微信里带有文字的图片,相比于恨到抠脚现在已经可以微信又添新功能!很实用微信正式推出青少年模式支付限额功能。现在,只要将手机更新到微信安卓版本8。0。23后,父母或监护人就可在青少年模式中设置微信支付的限额,包括每日消费限额和单次消费限额。完成设置后,AirPodsPro2可能不会提供健身追踪功能一份报告称,苹果的第二代AirPodsPro不会包括任何健身追踪功能,下一个版本更有可能专注于提供音频相关技术的提升而不是健康相关的功能。围绕着AirPodsPro2的传言,偶尔会吴亦凡可能被判多久?北京市朝阳法院于2022年6月10号在自己的官方公众号发出公告吴亦凡强奸聚众淫乱一案,因涉及被害人隐私,案件将依法采取不公开开庭审理的方式。法院将依法择期宣判。他来了,他来了,他真40岁李小璐手捧大束玫瑰花,无名指戴超大颗钻戒很抢眼,难道是和贾乃亮复合了?李小璐近期非常热衷于在短视频中分享自己的穿搭日常,在最新一期的视频中她小露香肩抱着一大捧玫瑰花。而更加亮眼的是,李小璐的无名指上还戴着一颗大大的钻石戒指。她和贾乃亮离婚后就一直有复
手把手教你搭出洋气时髦风格,14套搭配从裙子到裤装,穿出精致感头条创作挑战赛很多时候我们一时心动买下的衣服,回家才发现不知道怎么搭配,今天就来跟大家手把手拆解单品分享的搭配,相信你也会跟我一样,发现新鲜有趣的穿搭。波点或是格纹图案点缀的半裙是这3类食物促进深度睡眠,连哈佛学者都点赞在各种优化睡眠的技巧里,饮食往往容易被忽略。近日,一项哈佛大学的研究为高蛋白食物助眠找到证据。生命时报综合专家观点,揭示高蛋白食物的助眠机制,提醒你几种饮食习惯可能干扰睡眠。受访专常见食物gi参考值整理相信糖友们都知道饮食治疗是控制血糖的一大关键部分,对于控糖这一词汇也一定不陌生,但具体要怎么从饮食角度控糖呢?有一个重要的营养学概念需要大家了解血糖生成指数GlycemicInde森林之子控制台代码有哪些作弊码作用是什么?森林之子是一款恐怖生存类游戏,里面包含各类野人,游戏目前正在公测中。许多玩家都很好奇森林之子是否和前作一样,都有控制台代码快速下达指令进行一系列的行为,有哪些控制台代码?每一个作弊早餐这么吃,让你的大脑更聪明,记忆力更好,肥胖率更低!早上如何吃更健康?这个问题可能很多人都有过,但是你知道吗?早餐是一天中最重要的一餐,它不仅影响着你的身体健康,还关系到你的大脑发育记忆力肥胖率等方面。如果你想知道早上如何吃更健康,10种最常见心血管药物,副作用都有哪些?都适合哪些人吃?阿司匹林他汀洛尔类普利沙坦地平利尿药螺内酯华法林单硝酸等心血管方面最常用的10种药物,您都知道它们都有啥作用,多见副作用都有啥?有的会出血有的损伤肝有的影响心跳,有的影响肾脏有的吃清明蔗,毒过蛇!清明节前后,慎食这5种食物阳春三月,万物复苏,在沐浴着温暖的阳光,享受和煦春风的时候,啃两根清甜爽口的甘蔗,是很多小伙伴的心头好。但有句俗语你听过吗?清明蔗,毒过蛇,甘蔗作为一种清甜多汁的水果,一直很受欢迎大气污染防治十年成效如何?生态环境部PM2。5浓度下降57,重污染天数下降923月28日,生态环境部召开3月例行新闻发布会,生态环境部大气环境司司长刘炳江介绍,大气污染防治近十年取得积极成效,十年间我国的GDP总量增长了69,PM2。5浓度下降了57,实现了水煮蔬菜佐大蒜蛋黄酱适合家宴清爽馨香的第一轮酒第一轮酒不能厚重,最好是清爽酸香的酒款,慢慢堆栈香气。而开启一顿晚餐的前菜,则要轻巧细腻,滋味丰富但不重口味,方能引起众人对后续餐点的期盼,本次要推荐给您的为水煮蔬菜佐大蒜蛋黄酱曾育碧官宣退出E3展会!御三家后又一游戏巨头离开育碧曾于上个月公开宣布将参加今年的E3展,而在今日给外媒VGC的一份声明中,该公司表示决定退出E3,转而举办自己的发布会。多年来,E3为整个行业带来了许多难忘的时刻。虽然我们最初打Zoom宣布与OpenAI合作,4月向受邀客户推出AI助手智东西编译吴菲凝编辑李水青智东西3月28日消息,昨日,美国视频会议公司Zoom宣布与AI研发公司OpenAI启动合作,将于4月开始向受邀客户推出新的AI助手工具。Zoom推出的AI