DeepMind通过拥有2800亿个参数的模型来测试大型人工智能语言系统
DeepMind通过拥有2800亿个参数的模型来测试大型人工智能语言系统的极限
该公司新开发的人工智能语言模型被命名为Gopher
语言生成是目前人工智能领域的一大热门。有一类称为"大型语言模型"(即LLM)的系统能够实现各种强大的功能,包括改进谷歌搜索引擎、打造文本界面的奇幻游戏等。但这些项目也存在严重的缺陷,比如会生搬硬套一些涉及性别歧视和种族主义的语言,以及无法通过逻辑推理测试。这就带来了一大问题:只靠增加数据和算力能否克服这些弱点?或者说,这种技术范式是否即将遇到瓶颈?
Alphabet的人工智能实验室DeepMind在2021年12月8日发表了三篇研究论文,其中就探讨了这个课题。该公司得出的结论是,进一步扩大这些系统的规模应该能带来长足的改进。DeepMind研究科学家告诉记者:"该论文的一项关键发现是,大型语言模型仍在进化,其能力仍在增强,这一领域还没有进入停滞期。"
DeepMind经常将工作成果运用到谷歌产品中。它建立了一个拥有2800亿个参数的语言模型,将其命名为Gopher,用来探究这种LLM的能力。参数的多少是衡量一种语言的模型大小和复杂程度的直观标准。在这方面来说,Gopher比OpenAI的GPT-3(1750亿个参数)更大,但不如一些更具实验性的系统,比如微软和英伟达的Megatron模型(5300亿个参数)。
在人工智能领域,一般来说是越大越好的,因为更大的模型通常能提供更高的性能。DeepMind的研究证实了这一趋势,并表明扩大LLM的规模确实能在一些最常见的基准测试(例如情感分析和汇总)中提供更高的性能。然而,研究人员也提醒,要解决语言模型固有的一些问题,不能只依靠数据和计算。
该研究员说:"我认为目前看来,这个模型肯定会以各种方式失败。其中一部分因素在于,模型无法充分理解它所读取的内容,而且我感觉,对于这一类问题,我们只是寄希望于通过更多的数据和更大的规模来改善性能。"
但他又补充说,还存在"其他类别的问题,比如模型没能摆脱老一套的偏见,或者模型被欺骗而给出不实信息。而对于这些问题,DeepMind认为扩大规模也不是解决办法。"他指出,在这些情况下,语言模型将需要"额外的训练程序",比如来自真人用户的反馈。
为了得出这些结论,DeepMind的研究人员针对152项语言任务或基准测试,评估了一系列不同大小的语言模型。他们发现在一般情况下,模型越大,能提供的结果就越好。而在科学家选择的大约80%的测试中,Gopher具有最先进的性能。
在另一篇论文中,该公司还调查了与部署LLM相关的各种潜在危害。举例而言,系统可能使用有毒语言、分享错误信息、被用于恶意目的(例如分享垃圾邮件或广告宣传)。随着人工智能语言模型的部署范围越发广泛(例如作为聊天机器人和销售代理),上述所有问题都会显得越发重要。
但值得注意的是,在评估机器学习系统时,基准测试的性能并不是终极标准。在最近的一篇论文中,一些人工智能研究人员(其中两人来自谷歌)探讨了基准测试的局限性。他们指出,这些数据集的范围终归是有限的,无法与现实世界的复杂性相提并论。要测试这些系统,唯一可靠的方法就是看实际应用中的表现——新技术都不外乎如是。而借助大型语言模型,我们将很快看到更多这样的应用。
稿件来源:https://www.theverge.com/2021/12/8/22822199/large-language-models-ai-deepmind-scaling-gopher
该公司新开发的人工智能语言模型被命名为Gopher
语言生成是目前人工智能领域的一大热门。有一类称为"大型语言模型"(即LLM)的系统能够实现各种强大的功能,包括改进谷歌搜索引擎、打造文本界面的奇幻游戏等。但这些项目也存在严重的缺陷,比如会生搬硬套一些涉及性别歧视和种族主义的语言,以及无法通过逻辑推理测试。这就带来了一大问题:只靠增加数据和算力能否克服这些弱点?或者说,这种技术范式是否即将遇到瓶颈?
Alphabet的人工智能实验室DeepMind在2021年12月8日发表了三篇研究论文,其中就探讨了这个课题。该公司得出的结论是,进一步扩大这些系统的规模应该能带来长足的改进。DeepMind研究科学家告诉记者:"该论文的一项关键发现是,大型语言模型仍在进化,其能力仍在增强,这一领域还没有进入停滞期。"
DeepMind经常将工作成果运用到谷歌产品中。它建立了一个拥有2800亿个参数的语言模型,将其命名为Gopher,用来探究这种LLM的能力。参数的多少是衡量一种语言的模型大小和复杂程度的直观标准。在这方面来说,Gopher比OpenAI的GPT-3(1750亿个参数)更大,但不如一些更具实验性的系统,比如微软和英伟达的Megatron模型(5300亿个参数)。
在人工智能领域,一般来说是越大越好的,因为更大的模型通常能提供更高的性能。DeepMind的研究证实了这一趋势,并表明扩大LLM的规模确实能在一些最常见的基准测试(例如情感分析和汇总)中提供更高的性能。然而,研究人员也提醒,要解决语言模型固有的一些问题,不能只依靠数据和计算。
该研究员说:"我认为目前看来,这个模型肯定会以各种方式失败。其中一部分因素在于,模型无法充分理解它所读取的内容,而且我感觉,对于这一类问题,我们只是寄希望于通过更多的数据和更大的规模来改善性能。"
但他又补充说,还存在"其他类别的问题,比如模型没能摆脱老一套的偏见,或者模型被欺骗而给出不实信息。而对于这些问题,DeepMind认为扩大规模也不是解决办法。"他指出,在这些情况下,语言模型将需要"额外的训练程序",比如来自真人用户的反馈。
为了得出这些结论,DeepMind的研究人员针对152项语言任务或基准测试,评估了一系列不同大小的语言模型。他们发现在一般情况下,模型越大,能提供的结果就越好。而在科学家选择的大约80%的测试中,Gopher具有最先进的性能。
在另一篇论文中,该公司还调查了与部署LLM相关的各种潜在危害。举例而言,系统可能使用有毒语言、分享错误信息、被用于恶意目的(例如分享垃圾邮件或广告宣传)。随着人工智能语言模型的部署范围越发广泛(例如作为聊天机器人和销售代理),上述所有问题都会显得越发重要。
但值得注意的是,在评估机器学习系统时,基准测试的性能并不是终极标准。在最近的一篇论文中,一些人工智能研究人员(其中两人来自谷歌)探讨了基准测试的局限性。他们指出,这些数据集的范围终归是有限的,无法与现实世界的复杂性相提并论。要测试这些系统,唯一可靠的方法就是看实际应用中的表现——新技术都不外乎如是。而借助大型语言模型,我们将很快看到更多这样的应用。
稿件来源:https://www.theverge.com/2021/12/8/22822199/large-language-models-ai-deepmind-scaling-gopher
web前端面试笔记,基础题1让一个p水平居中,至少写出3中2有几种前端储存的方式?这些方式的区别是什么?3以下代码输出什么?constarrxx1,xx2,xx3,xx4console。log(arr。re
联想事件,落幕言之不预也2021生机大会1。股权转让事件,不了了之。毕竟有当时的大背景,且当时的法制不够健全2。柳杨降薪3。税务部门介入调查,对其个人所得税一项给出结论4。联想电脑被淘汰5。杨被追究相应的
为何三星国产机大搞折叠屏,而苹果却不为所动?OPPO也发布了自己的第一款折叠屏手机FindN,不黑不吹,这款折叠屏手机确实很棒,也是当前折叠痕迹最小的折叠手机,没有之一,同时价格相比于其它折叠屏手机,也不算贵,甚至是首发价最
早知道5G消息联合实验室将揭牌欧美股市全线下跌e公司讯,天源环保品高股份春立医疗今日新股申购央行将一年期贷款市场报价利率(LPR)下调至3。8中国电信计划1月择机推动5G消息商用,方案正在制定中5G消息联合实验室将揭牌,多项团
求大神帮我分析一下智慧照明的前景如何?智能照明行业产业链全景梳理下游应用范围广智能照明概念相关产业按价值链自上而下主要可分为三大部分即上游原材料及控制系统中游智能照明设备及平台提供及下游应用环节。上游原材料包括芯片电子
小米新品发布会定档12月28日,小米12与MIUI13有望同台登场12月数码圈要热闹起来了,继诸多厂商官宣发布会之后,小米也于今日正式官宣了自家小米12的发布会。从官方放出的消息来看,小米12与新系统MIUI13将会在12月28日共同发布会。相信
小米线下海报曝光苏炳添依旧是小米12代言人中关村在线消息昨天,网上曝光了一张小米的海报,苏炳添依旧代言小米手机。海报上显示,小米12的slogen为快,更稳。并且小米新品发布会将在12月28日举行,会在今天上午正式官宣。此
电商直播带货一姐薇娅偷税,是否能让直播带货进入冷藏期薇娅,果然是直播界一姐,就连偷税都是绝对的霸主地位,偷税漏税被罚都能高达13亿,就连偷税漏税的高发区娱乐界都黯然失色,把范冰冰都秒成了渣。随着直播界第三的雪梨被爆偷税后,现在就连排
受美股中概股重挫影响,哔哩哔哩阿里巴巴等港股集体低开文福布斯中国12月21日,港股看盘走低,互联网概念集体受挫,网易京东快手阿里巴巴美团腾讯控股哔哩哔哩皆走低。截止发稿,走势出现分化,哔哩哔哩(9626。HK)大跌8。1,快手(10
王者荣耀新一批高帧率机型公布,拯救者平板在内IT之家12月20日消息,据王者荣耀官方消息,游戏将在2021年12月21日830930对全服进行不停机更新。在更新日志中,王者荣耀公布了新一批高帧率安卓机型,包括vivoS12P
vivoS12系列即将发布前置双色温四柔光灯S系列作为vivo的中高端机型,因其强大的自拍实力和持续在线的颜值一直以来受到了不少消费者的认可与喜爱。12月20日vivo发布预热视频,透露vivoS12系列将搭载后置一亿像素超