范文健康探索娱乐情感热点
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

原来AI也需要有人哄,一句话让GPT3准确率暴涨61

  一觉醒来,机器学习社区炸了锅。因为最新研究发现,只要对 GPT-3 说一句"让我们一步一步地思考",就能让它正确回答出以前不会的问题。
  比如下面这个例子:
  16 个球中有一半是高尔夫球,这些高尔夫球中有一半是蓝色的,一共有几个蓝色的高尔夫球?(问题不难,但要注意这是零样本学习,也就是说 AI 训练阶段从没见过同类问题。)
  如果要求 GPT-3 直接写出"答案是几",它会给出错误答案:8。
  但加上让我们一步一步地思考这句"咒语"后,GPT-3 就会先输出思考的步骤,最后给出正确答案:4!
  而且这并不是巧合,研究团队在论文中做了充分的验证。上面的问题出自经典的 MutiArith 数据集,专门考验语言模型做数学题的能力,GPT-3 本来在零样本场景下准确率仅有 17%。
  这篇论文中总结了 9 个最有效的提示词,其中换着花样让 GPT-3 逐步思考的前 6 个都让准确率暴涨到 70% 以上。
  甚至一句最简单的"Let’s think"(让我们想一想) 都能涨到 57.5%。这感觉,就像是幼儿园阿姨在哄小朋友……
  这个技巧似乎也不需要对 GPT-3 做魔改,已经有人在 OpenAI 官方 Demo 上成功复现,甚至换成中文也行。英文题干中文提示,GPT-3 给出正确中文答案。
  最早把这篇论文转发到社交网络的谷歌研究员表示,新的 all you need 增加了。
  看到这里,各路大佬纷纷脑洞大开,玩起了梗。如果鼓励 AI"你能行的,我相信你"会怎样?
  威胁 AI 一下说"时间不多了"或者"你头上有把枪"又会如何?
  对 AI 说"开车稳一点"会成为自动驾驶解决方案吗?
  还有人提出,这简直和科幻故事《银河系漫游指南》的剧情一样,实现通用人工智能的关键是知道如何正确地向 AI 提问。
  那么,这种神奇现象究竟怎么回事?语言大模型是零样本推理者
  发现这个现象的是谷歌大脑与东京大学的合作研究,探索了语言大模型在零样本场景下的表现。
  论文标题《语言大模型是零样本推理者》还致敬了 GPT-3 的《语言模型是少样本学习者》。
  所用方法属于 Chain of Thought Prompting(思维链路提示,以下简称 CoT),今年一月刚由谷歌大脑团队提出。
  最早的 CoT 应用于少样本学习,在提问的同时给一个分步骤回答的示例来引导 AI。
  这次的最新研究提出零样本 CoT,主要改动是简化了示例的部分。
  第一步,把题干改写成"Q:xxx,A:xxx"的形式,其中触发句 A 可以提取出语言模型的思考过程。
  第二步属于额外实验,增加了"答案是……"的提示促使语言模型给出最终答案。
  这样做最大的好处是通用,不再需要对不同问题类型提供专用的示例。
  论文中对各类问题做了充分实验,包括 12 项测试:
  6 个数学问题测试集,SingleEq、AddSub、SVAMP 和更有挑战的 MultiArith, AQUA-RAT, GSM8K。
  2 个常识推理测试集,CommonsenseQA 和 StrategyQA。
  2 个符号推理测试集,Last Letter Concatenation 和 Coin Flip。
  以及 BIG-bench 中的日期理解问题、跟踪乱序物体任务。
  与普通的零样本学习相比,零样本 CoT 在其中 10 项中取得更好效果。
  △ 右侧值为额外实验结果
  在比较有难度的 MultiArith 和 GSM8K 数学测试中,用 GPT-3 最新版本 Text-davinci-002 (175B) 做了更深入实验。
  如果给 8 次尝试机会取最好结果,还能进一步提升准确率至 93%。
  在错误结果分析中研究人员还发现,很多问题中其实 AI 的推理过程是正确的,只是答案无法收敛至唯一确定时会给出多个备选。
  论文的最后,研究团队提出这项研究不仅可以作为零样本 CoT 的基线,更希望让学界认识到在构建微调数据集和少样本提示模版之前,充分发掘语言大模型零样本能力的重要性。
  研究团队来自东京大学松尾研究室。
  负责人松尾丰教授,同时是软银董事会中的第一位人工智能专家。
  团队成员中的客座教授顾世翔来自谷歌大脑团队,顾世翔本科师从三巨头之一 Hinton,博士毕业于剑桥大学。
  加点"魔法"已经成为 AI 圈新潮了
  零样本 CoT 究竟为何起作用还有待探索。
  不过有人实验得出,这种办法似乎只对 GPT-3(text-davinci-002)比较有效,他尝试了 001 版本,发现收效甚微。
  他列出了一个自己做的例子。提问:请将 machine,learning 中每个单词的最后一个字母连起来。
  GPT-3 在提示下给出的答案是连起来了两个单词中的所有字母。
  对此,作者之一顾世翔回复表示,其实"咒语"对初始版、改良版的 GPT-3 都有效果,这些结果在论文中也有体现。
  也有人发出质疑,表示难道深度学习变成了一场找"神奇咒语"的游戏?
  同时,我们在吐槽队伍里又看到了马库斯的身影。
  他也列出了一个失败的例子,GPT-3 在"咒语"加持下也没弄明白,莎莉的牛到底会不会起死回生……
  不过值得注意的是,类似这种稍微给 AI 加点小魔法,提升效果立竿见影的例子已经不稀奇了。
  有网友分享,自己用 GPT-3 时加几个中间命令,确实能得到更满意的结果。
  此前谷歌和 MIT 的研究人员发现,无需更改底层架构,只要训练语言模型会像程序员 debug 时那样"打断点",模型读代码、做算术的能力唰唰唰地就上去了。
  原理也非常简单,就是在计算步骤较多的程序里,让模型把每一步都编码成文本,并将它们记录到一个称为"便签"的暂存器中。由此一来,模型的计算过程变得更加清晰有序,性能自然大幅提升。
  还有本项实验中用来测试的 Instruct GPT-3,也是一个典型的例子。只需让 GPT-3 从人类反馈中强化学习,它就能明显改善答非所问的情况。
  具体来看就是先用一些人类的示范回答微调模型,然后收集某个问题的几组不同输出数据,人工对几组答案进行排序,并在此数据集上训练奖励模型。
  最后,使用 RM 作为奖励函数,近端策略优化(PPO)算法微调 GPT-3 策略,以强化学习方法最大化奖励。
  包括引爆这次话题的推特博主 Aran,正是当初发现加一句"虚幻引擎"就能让 AI 生成图像画质飞升的那位。
  前谷歌机器人大佬 Eric Jang 此前也发现,强化学习也能运用类似的思维来提升计算效率。
  也有人表示,这种用在 AI 上的技巧,不正是自己平常动脑时会用的吗?
  实际上,此前 Bengio 就从脑科学入手,提出 AI 的运转模式应该像人类动脑模式一样。
  人类的认知任务可以分为系统 1 认知和系统 2 认知。
  系统 1 认知任务,是指那些无意识完成的任务。比如你可以马上辨别出手里拿的是什么东西,但是却无法和别人解释,自己是怎么完成这个过程的。
  系统 2 认知任务,是指人类大脑需要按照一定步骤完成的认知。比如做一道加减法运算,你可以很清楚地解释最终答案是如何得出的。
  而这次加的"咒语",正是让 AI 更进一步,学会按步骤来思考。
  面对这样的趋势,有学者认为"提示工程正在取代特征工程"。
  那么"提示词猎人"会成为下一代 NLP 研究者的外号么?
  论文地址:
  https://arxiv.org/abs/2205.11916

华米科技黄汪第三代可穿戴自研芯片将很快推出1月29日晚间消息,在今日的极客公园创新大会2021上,华米科技创始人董事长兼CEO黄汪透露,华米科技自研的第三代可穿戴芯片将很快推出。华米科技是小米生态链企业,早期打造了小米手环华为公开人机对话相关专利可根据对话内容生成准确回复IT之家2月27日消息2月26日,华为技术有限公司公开一项名为一种人机对话的方法和装置的专利,公开号CN108319599B,申请日期为2017年1月。IT之家了解到,该方法应用于小米发布米家高速吹风机H700铝合金一体机身LCD彩屏,众筹价699元IT之家12月14日消息,今日上午,小米宣布推出米家高速吹风机H700,零售价799元,众筹价699元,将于12月15日上午1000开启众筹。设计方面,米家高速吹风机H700采用铝小米米家App7。0体验版新增全屋智能控制中心,所有模块均支持设备的显示和控制感谢IT之家网友软媒用户61330的线索投递!IT之家12月14日消息,小米米家App现已向部分用户推送7。0体验版更新,新增全屋智能控制中心,可在设置中开启。IT之家了解到,米家谷歌人工智能DeepMind,高中数学考了个不及格IT之家4月13日消息我们在许多新闻报道里见识过了人工智能(AI)的厉害。谷歌的AlphaGo曾先后击败了李世石柯洁两位顶尖棋手,拿下了围棋这个人类一直以来占据着优势的项目。图自PAI也会查百度了,OpenAI新成果让GPT3回答开放式问题12月17日消息,本周四,OpenAI基于AI模型GPT3发布了WebGPT,该模型可在线搜索问题组织答案,并添加引用来源,更准确地回答开放式问题。在回答问题时,WebGPT可以通皮克斯技术指导辞职读博研究AI设计怪物,从游戏王卡牌开始让AI画人脸见得多了,要是让AI画个幻想中的怪物又如何?来看几个,先是人形的再来个兽形的还有诡异到说不出来属于什么型的你可能会问,这很难吗?毕竟现在用GAN生成人脸都能以假乱真,生报告全球各企业AI预算较去年大幅增长55,数据变得比算法更重要IT之家8月29日消息据外媒美通社报道,训练数据提供商AppenLimited在近日发布了第七份人工智能与机器学习现状年度报告。报告显示,全球各企业AI预算金额范围从50万美元至5失败者还是啦啦队长?AI能识别自拍照给人分类早在2009年,美国斯坦福大学和普林斯顿大学的科学家就曾提出设想,希望教授计算机识别世界上的任何物体。为了实现这个目标,他们需要很多图片,除了猫狗苹果叉子勺子等,还需要无数人类的图京东陶大程超级模型生态系统将引领新一轮产业变革7月8日消息,2021世界人工智能大会第八届中国产业互联网高峰论坛上,澳大利亚科学院院士京东探索研究院院长陶大程博士表示,超级模型生态系统引领新一轮产业变革。陶大程博士认为,通过构开发者确认苹果AppleWatchS7处理器与前代AppleWatchS6完全相同IT之家9月15日消息今日,苹果在秋季新品发布会上推出了全新AppleWatchSeries7。与前代AppleWatchSeries6相比,小号AppleWatchSeries7
一句话开启光污染模式雷蛇宣布与亚马逊Alexa语音助手合作IT之家1月9日消息据台媒mashdigi的新闻,去年宣布与微星NZXTAMD曜越科技联力Vertagear技嘉Ducky飞利浦在内厂商合作ChromaConnectedDevic小米宣布米家新风机新品11月6日发布IT之家11月2日消息小米官方宣布将在11月6日下午举行新品发布会直播,现在小米双11新品直播发布会首个新品公布,就是米家新风机,号称可以解决4大室内空气问题。小米米家新风机新特性IT之家开箱组智米加湿器开箱图赏小巧机身,干燥天气好伴侣IT之家12月13日消息此前,小米生态链企业智米推出了智米加湿器,智米加湿器的加湿量为每小时200ml,整个机身储水量为2。25L,功耗为24W。智米加湿器采用了高频雾化片,帧频为WAIC观察从双马对话看人工智能的现在与未来去年,我们还在讨论无人驾驶到底什么时候到来,今年就已经触手可及。在2019世界人工智能大会(以下简称WAIC)期间,很多人就有机会切身体验了无人驾驶汽车。这是除了双马对话,2019小米手表支持离线快速支付,还能当登机牌用IT之家10月30日消息今日,米家官方爆料,小米手表将支持独立通话和下载App,还与多款应用合作,带来了许多便捷功能,包括与支付宝合作支持离线快速支付与QQ合作通过手表收发信息,还除了MIUIForWatch,小米手表还将拥有专属应用商店IT之家10月30日消息今日早些时候,米家MIJIA官方表示,小米手表将采用开放的手表生态系统,名称为MIUIForWatch。不过,既然是手表生态系统,没有应用商店怎么行?米家M人脸识别硬核科普人群中看你一眼,从此不忘你容颜小编是个天生懒惰的人,同时又是个急性子,这样的人最享受被科技服务的乐趣。举个例子,十多年前大家还在普遍用现金的时代,小编在商店买东西排队结账,每当看到收银员找零时手忙脚乱的样子就会三星发布新款智能冰箱手机可提醒用户忘关冰箱门据TheVerge北京时间1月8日报道,三星的新款智能冰箱要比你熟悉的冰箱更加主动。据该公司表示,它能检查问题并通过SmartThings应用提醒你。这款新的三星FamilyHub为什么计算机永远不会拥有人类的意识?北京时间10月22日消息,据美国生活科学网站报道,科学家尝试建造超级计算机大脑,但结果表明它们始终无法接近现实人类大脑,为什么电脑很难具有人类真实大脑的意识呢?许多先进的人工智能项HUAWEIHiLink生态大会2019召开华为智选IoT新品四连发一年一度的AWE中国家电消费电子展将在3月14日在上海开展,作为中国规格最高的消费电子展会,今年的AWE上,我们将看到人工智能移动互联网物联网云计算等前沿技术在智能家电领域的深度融亚马逊拟推出高端Echo,移动版Alexa家用机器人或于今年面世据悉,亚马逊正在开发更高质量的Echo智能音箱版本,并加大了家用机器人的研发力度。据知情人士透露,该公司计划在明年发布新款Echo智能音箱。他们表示,新款圆柱形音箱的原型机在外型上