范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

AI语言模型真的是越大越好吗?这个模型优于Gopher

  出品 | AI科技大本营(ID:rgznai100)
  近年来对于 AI 语言模型的有一个争议就是 —— 越大越好。
  DeepMind 正在质疑这个理由,并表示给 AI 一个记忆可以帮助与它 25倍大小的模型竞争。
  去年 6 月,OpenAI 发布 GPT-3 模型时,就重写了语言 AI 的规则手册。该实验室的研究人员标明,简单地扩大神经网络的规模和训练数据可以显著提高各种语言任务的性能。
  RETRO 模型
  自 GPT-3 发布以后,许多其他科技公司也加入了这一潮流,开发了自己的大型语言模型并实现了类似的性能提升。但研究人员还是对这种方法提出了担忧,尤其是前谷歌研究员 Timnit Gebru。
  在一份公司的文件中,Gebru 和他的同事强调说,这些模型及其数据集的庞大规模使他们比普通的神经网络更加难以理解,而这些神经网络以「黑匣子」而闻名。这可能会使检测和减轻这些模型中的偏差变得更加困难。
  他们发现了一个更大的问题,依靠越来越多的计算能力在 AI 领域取得进展意味着该领域的尖端技术对于除了资源丰富的商业实验室外的所有人来说都是遥不可及的。扩大模型就可以带来持续的进步,也意味着有前景的替代方案的资源更少。
  但在新的研究中,DeepMind 表明可能还有另一种方式。在一系列论文中,该团队解释了他们首先是如何构建自己的大型语言模型 Gopher,该模型比 GPT-3 大 60% 以上。然后,他们展示了一个更小的模型,该模型能够在数据库中查找信息,可以与Gopher和其他大型语言模型进行面对面的交流。
  研究人员将这个较小的模型称为 RETRO,代表 Retrieval-Enhanced Transformer。Transformers 是大多数大型语言模型中使用的特定类型的神经网络;他们对大量数据进行训练,以预测如何回答人类用户的问题或提示。
  RETRO 也依赖于变压器,但它被赋予了一个重要的增强。除了根据训练预测接下来应该出现什么文本外,该模型还可以搜索包含 2 万亿个文本块的数据库,以查找使用类似语言的段落,从而改进预测。
  研究人员发现,只有 70 亿个参数的 RETRO 模型在各种语言任务上都可以胜过 AI21 Labs 制作的 1780 亿个参数的 Jurassic-1 转换器,甚至在大多数方面都优于 2800 亿个参数的 Gopher 模型。
  除了减少所需的训练量外,研究人员还指出,能够查看模型在进行预测时参考了哪些文本块,可以更容易地解释它是如何得出结论的。对数据库的依赖也为更新模型知识提供了机会,无需重新训练,甚至无需修改语料库以消除偏差来源。
  结语
  有趣的是,研究人员表明,他们可以利用现有的变压器,通过重新训练其网络的一小部分,对其进行改造,使其能够与数据库一起工作。这些模型很容易超越原始模型,甚至接近从头开始训练的 RETRO 模型的性能。
  不过,重要的是要记住,按照大多数标准,RETRO 仍然是一个大型模型。它几乎是 GPT-3 的前身 GPT-2 的五倍。人们似乎很可能希望看到更大的 RETRO 模型和更大的数据库有什么可能。
  DeepMind 当然认为进一步扩展是一个很有前途的途径。在 Gopher 的论文中,他们发现虽然增加模型大小并没有显著提高逻辑推理和常识任务的性能,但在阅读理解和事实核查等方面的好处是显而易见的。
  也许 RETRO 最重要的教训是,扩展模型并不是获得更好性能的唯一途径,甚至不是最快的途径。虽然规模确实很重要,但人工智能模型的创新也至关重要。
  所以说,语言模型真的是越大越好吗?对此,你怎么看呢?
  参考链接:
  https://singularityhub.com/2021/12/20/biggers-not-always-better-deepminds-new-language-ai-is-small-but-mighty/

我也来聊聊MIUI13的初体验手机K30Pro开发版内测更新到1。22音箱redmi触屏音箱8开发版已升级MIUIHOME平板开发版公测的小米平板5pro先说说MIUI13PHONE1流畅度真的很大的提升!总是微信收款码还能用最后一个月?别慌一谣言汇总支付宝微信支付收款码将于3月1日起被禁止商用3月1日起,微信支付宝收款码不能用于经营收款收款码禁止商用。2022年3月份马上就到来了,一些新闻报道出了乌龙,以上说法都是错微信视频号上线付费直播间DoNews1月25日消息(翟继茹)据悉,微信视频号已经上线首个付费直播间,在免费试看3分钟后,需支付90个微信豆才可以继续观看视频。根据苹果iOS充值页的内容显示,用户可以选择7腾讯视频制片人张萌被移送公安机关,曾制作你是我的荣耀等热播剧记者刘燕秋编辑此前曝出的腾讯视频制片人张萌涉嫌贪腐事件又有新进展。1月25日,腾讯发布腾讯集团反舞弊通报,并对涉及商业贿赂职务侵占等行为的典型案件进行通报。其中,PCG影视内容制作有偿征稿四川省大数据产业联合会征稿啦大数据人工智能Python机器学习相关爱好者及从业人士速来!征集内容产业政策解读产业动态信息行业技术热点探讨创新产品发布案例分享和分析大数据技术标准解决方案发展趋势展望与应用研究等2022年,直屏为何再次成为了新机的首选不知道大家2022年的元旦假期过得如何是否有好好休息呢?对于我们三易生活来说,基本上从去年11月底12月至今,其实一直都维持着相当紧张的工作节奏。原因无它,大家有看过我们的相关内容2021年发布的旗舰手机中,你最推荐的是哪一部?为什么?只说国产第一小米12pro第二一加10pro(今年不给力)第三iqoo9pro第四真我GT2pro按照性价比真我GT2pro第一,接下来看红米K50超大杯宇宙首款大作是否会上2K屏同样是小屏旗舰,魅族18s满血配置远胜小米12小屏手机在手机行业里是一个比较特别的存在。一方面是因为小屏手机的受众面较小,另一方面是小屏手机大部分都是大屏手机缩减配置后的产品,这让追求旗舰机体验的小屏用户难以找到心仪的手机。比为什么变焦镜头覆盖了很多的定焦焦段,有的人还要购买定焦镜头?感谢邀请。有这样购买的人,那是他(她)们都是人像摄影师。而定焦镜头就是为了拍摄人像而打造的,如果说,一个人像摄影师,有了某一个变焦镜头,虽然也能拍摄人像,但是变焦镜头的画质自然不如买iPhone是买128g的好还是买256g的好?如果资金预算充足的情况下,建议你购买256G或者512G版本,听说iPhone12将会在今晚9月9日凌晨发布,如果是5G手机,而且手机拍摄视频逐步的1080P以及4K成为了主流,甚RedmiK50宇宙来袭RedmiK40系列是2021的一匹黑马。它在618年赢得了销售冠军,半年多来价格几乎没有波动。可以看出这个模型有多香。(主要是12256g版本)虽然K40的价格相对较低,还有使用
硬件与算法融合成行业趋势,浅谈联发科与虹软的合作随着手机市场进入存量时代,作为差异化卖点,AI成为芯片终端厂家们继5G之后又一个发力点。日前,虹软对外表示,其与联发科保持战略协作,通过芯片算法的深度适配,将给行业带来更大的活力和新版华为soundx智能音箱到底有啥功能?这有一份体验报告请你签收我们都知道HUAWEISound系列智能音箱自诞生之初就联合了法国高端音响品牌DEVIALET帝瓦雷(它还有个名字叫做爆炸音乐中心,英国皇家阿尔伯特音乐厅和巴黎歌剧院,用的就是它)中国5G手机终端连接数达3。92亿户中新社北京8月20日电(记者刘育英)中国工业和信息化部20日发布的数据显示,截至7月末,5G手机终端连接数达3。92亿户,比上年末净增1。93亿户。工信部称,中国移动电话用户总规模马斯克Tesla特斯拉2022年推出人形机器人原型机特斯拉(Tesla)CEO马斯克(ElonMusk)表示,特斯拉可能在2022年推出TeslaBot人形机器人原型,以从事人们不喜欢做的危险重复性或枯燥的工作。路透社8月20日报道预算3000元不懂买什么?高颜值高配置,旗舰机就选这三款虽然现在的手机市场竞争非常残酷,但我们也不难发现,各大厂商的旗舰机价格是越来越贵了,没有个四五千都不好意思跟人打招呼,对于很多用户而言并不友好,预算在3000元才是大部分人的常态,大公司动态丨呷哺呷哺决定关闭200家亏损门店腾讯加入芯片赛道科技圈小米集团的确接触了各方面造车团队,但集团并未作出任何合作意向决议8月20日,小米公司发言人称,昨日晚间有关小米造车事宜有不实传言,现就该传言做出以下澄清截至目前小米集团的确接低调的百度老板娘马东敏15岁进中科大少年班,向母校捐1亿这个女人不简单,裸婚嫁给相爱不到三个月的恋人,几年时间从身无分文到资产上亿,她帮助丈夫从程序员到公司老总,捐款一亿给母校。马东敏女士被誉为百度背后的女人,李彦宏直言没有妻子就没有今过分依赖苹果很危险!瑞银看好英飞凌而非意法半导体财联社(上海,编辑周玲)讯,尽管芯片短缺利好全球芯片公司,但瑞银(UBS)分析师认为,像意法半导体(STMicroelectronics)这样对苹果等智能手机制造商过分依赖不见得是中国联通自主品牌!优畅享30e即将发布,5G加持如今的手机市场上,基本被各个手机厂商给牢牢把持了,而作为国内三大运营商之一的中国电信也于前不久推出了全新的自主品牌麦芒,但中国电信并不是第一家推出自主品牌的运营商,其实同样作为运营小米平板5Pro体验生而爱奇艺,何必生产力?咕咕了很久之后,小米平板5系列终于在8月10日发布。有骁龙860和骁龙870版本,起步价分别是1999元和2499元。这是时隔3年后的更新,也是小米平板第一次配上键盘和触控笔,让人iPhone13果然真香,但我还是劝你再等一年近期好文确认了,苹果官方真的在监视我们这可能是今年最强的拍照App曾经排名世界第一的手机,为什么最后还是凉了这是我今年见过最离谱的贴吧最近,很多机友都在机哥后台留言,问我新iPho