范文健康探索娱乐情感热点
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

442个作者,100页论文一半都是参考文献,谷歌耗时2年发布开源大模型新基准BIGBench

  一篇 AI 论文,442 个作者,其中还专门留了一章节写作者贡献,100 页里超过一半都是参考文献……
  谷歌最新发布的论文 ——Beyond The Imitation Game: Quantifying And Extrapolating The Capabilities Of Language Models 作者那一栏就变成了这样……
  来自 132 个机构的研究学者,耗时两年提出了一个大语言模型新基准 BIG-bench 。并在此基础上评估了 OpenAI 的 GPT 模型,Google-internal dense transformer 架构等,模型规模横 6 个数量级。
  最终结果显示,模型性能虽然随着规模的扩大而提高,但跟人类的表现相差还很远 。
  对于这项工作,Jeff Dean 转发点赞:Great Work。
  大语言模型新基准
  来康康这篇论文究竟说了什么。
  随着规模的扩大,模型的性能和质量都有一定的改进,这当中可能还存在一些变革性影响,但这些性能此前都没有很好的描述。
  现存的一些基准都有一定的局限性,评估范围比较狭窄,性能分数迅速达到饱和。
  比如 SuperGLUE,在该基准推出后的 18 个月内,模型就实现了"超过人类水平"的性能。
  基于这样的背景,BIG-bench 就诞生了。
  目前它由 204 个任务组成 ,内容涵盖语言学、儿童发展、数学、常识推理、生物学、物理学、社会偏见、软件开发等方面的问题。
  此外还有个人类专家评审团,也执行了所有任务,以提供基线水平。
  为了方便更多机构使用,研究人员还给出了 BIG-bench Lite ,一个小型但有代表性的任务子集,方便更快地评估。
  以及开源了实现基准 API 的代码,支持在公开可用的模型上进行任务评估,以及新任务的轻量级创建。
  最终评估结果可以看到,规模横跨六个数量级,BIG-bench 上的总体性能随着模型规模的扩大、训练样本数量的增加而提高。
  但跟人类基线水平相比,还是表现得比较差 。
  具体在一些任务上,模型性能会随着规模的增加而平稳地提高。但有时候,会在特定规模上突然出现突破性表现。
  此外,它还可以评估模型存在的社会偏见。
  此外,他们还意外发现模型还可以 get 一些隐藏技能。比如,如何在国际象棋中合乎规则的移动。
  作者贡献写了 14 页
  值得一提的是,可能因为作者过多,论文最后还专门留了一章写作者贡献。洋洋洒洒的写了 14 页 ,其中包括核心贡献者、Review 的、提供任务的……
  剩下的,还有 50 页的参考文献 。
  好了,感兴趣的旁友可戳下方链接康康论文。
  论文链接:
  https://arxiv.org/abs/2206.04615
  GitHub 链接:
  https://github.com/google/BIG-bench

科学家研究金属星球上的火山及其熔岩流在一个主要由金属构成的行星体上,火山及其熔岩流会是什么样子?来自北卡罗来纳州立大学的一项试验性研究提供了对铁质火山的见解,可以帮助科学家解释其他世界的景观特征。火山是由行星表面下部外媒NASASLS月球火箭完成关键热火测试据外媒报道,NASA于当地时间周四试射了其庞大的太空发射系统(SLS)火箭的核心级。测试中,NASA使其在位于密西西比州南部的测试设施摇晃了很久,时间远超工程师进行干净演示所需的时火山喷发可能不是恐龙灭绝事件的主要驱动力如果你在街上随便拉个人问ldquo恐龙是如何灭绝的?rdquo,你得到的答案八成是陨石。不过事实却要复杂的很多。通过深入的调查,我们已经知道一颗1015公里宽的巨大小行星在6600科学家首次发现地球超大陆旋回的可靠线索科廷大学的最新研究首次发现了关于地球超大陆旋回(Supercontinentcycle)已经开始的可靠线索,发现它是在20亿年前启动的。近日发表在地质学(Geology)的论文中,已灭绝巨鸟的头骨化石揭示了极端进化实验据外媒NewAtlas报道,澳大利亚科学家首次研究了历史上最大的鸟类大脑。古生物学家检查了已灭绝的雷啸鸟(dromornithidae)家族的不飞鸟类的脑壳包括一些有史以来最大的鸟RocketLab宣布将为BlackSky发射更多卫星据外媒报道,本周早些时候,RocketLab成功发射了一颗BlackSky卫星。现在,这家公司宣布它已经跟BlackSky签署了一项协议,它将通过5次Electron任务发射后者的美12岁天才少女被大学录取计划未来进入NASA工作据外媒BGR报道,如果你看到12岁的AlenaWicker穿着她的亚利桑那州立大学(ASU)连帽衫,你可能会认为她是从哥哥姐姐甚至父母那里得到的。然而,Wicker是在没有告诉母亲2500多年前绘制的壁画将盐描绘成市场上古代玛雅商品在墨西哥尤卡坦半岛的联合国教科文组织世界遗产卡拉克穆尔发现的2500多年前绘制的一幅壁画中,首次记录了盐作为古代玛雅商品在市场上的情况。在这幅描绘日常生活的壁画中,一个盐贩子向另一3成失眠者放下手机才能睡说中你了吗?据中国睡眠研究会数据显示,如今我国有超3亿人存在睡眠障碍。而在过去一年受新冠肺炎疫情的影响,人们居家时间增加,整体入睡时间却延迟了23个小时。3月21日是世界睡眠日,在世界睡眠日前俄罗斯成功发射一箭38星来自18个国家韩国主打北京时间2021年3月22日14点07分,在哈萨克斯坦拜科努尔发射中心,俄罗斯成功发射了一枚联盟21A火箭,一次性将多达38颗卫星送入太空轨道,它们来自18个不同国家。这些卫星有7研究为神秘致命抗生素耐药病原体的来源提供新线索据外媒报道,一项新研究正在为一种致命的抗生素抗性真菌病原体的起源提供线索,这种病原体10年前神秘地出现在世界各地的医院中。该研究记录了在偏远的自然环境中首次发现该病原体的过程,并建
毅力号完成首次火星行走,历时33分钟行走6。5米北京时间3月6日消息,美国航空航天局(以下简称NASA)星期五宣布,星期四下午毅力号火星车首次实现在火星上行走。对于毅力号火星车寻找火星生命任务来说,这是非常重要的第一步。毅力号拍火星救援成真NASA将发射两架飞船,把毅力号的采集样品接回来IT之家3月5日消息NASA的毅力号火星车不久前到达了火星地表,将采集火星岩石土壤并进行分析。今日据外媒engadget报道,NASA的想法不止于在火星进行探测分析,还打算把火星采中国科学家成功研发可抗新冠病毒的广谱人源化基因工程单抗IT之家8月19日消息据中国科学院微生物研究所官方微信公众号今日消息,8月17日,中国科学院微生物研究所严景华团队联合华中科技大学王晨辉团队北京大学肖俊宇团队中国食品药品检定研究院中国生物武汉造新冠疫苗获批在317岁人群紧急使用,未见严重不良反应IT之家8月18日消息根据国药集团中国生物消息,经国务院联防联控机制有关部门组织论证,国药集团中国生物武汉生物制品研究所新冠病毒灭活疫苗获批在317岁人群中紧急使用。中国生物武汉生东航接收空客首架在中国交付的A350飞机IT之家7月21日消息据中国东方航空官网,该公司今日首次在天津接收空中客车交付的A350900飞机,这是空客天津宽体飞机完成和交付中心向用户交付的第一架A350飞机。IT之家了解到我国歼16D电子战飞机已投入实战化训练,与歼20可强强联合IT之家11月8日消息,根据航空工业官方消息,近期中国人民解放军空军宣布,歼16D电子战飞机已经投入实战化训练,其伴随歼20战斗机作战,可以取得11gt2的效果。官方在海报中表示,鲲龙AG600总师会游泳的大飞机预计年底下线IT之家10月21日消息,AG600鲲龙是由中国航空工业集团下属公司制造的大型水陆两用飞机,用以取代老旧的水轰5。设计用于大型灭火水上救援等综合任务。据新华日报,鲲龙AG600总师2022年全国铁路将投产新线3300公里,推进沿江高铁西部陆海新通道等重大工程IT之家1月4日消息,据央视新闻援引国铁集团的消息,2022年全国铁路将继续高质量推进国家重点工程建设,预计将有3300公里新线建成投产,其中普速铁路1900公里左右。官方指出将聚我国运20运输机已有两款自研发动机,目前都在试飞中IT之家9月29日消息根据央视军事报道,在第13届中国航展上,运20运输机总设计师唐长红表示,运20已经有了中国心,我们不但有自主研制的发动机,而且还是两型,目前都在试飞中,进展顺来听课啦!中国空间站天宫课堂第一课定于12月9日下午开始,神舟十三号航天员授课IT之家12月6日消息,据中国载人航天工程办公室消息,天宫课堂第一课定于12月9日1540开始,神舟十三号乘组航天员翟志刚王亚平叶光富将在空间站进行太空授课。本次中国航天员开直播太波士顿动力最新Spot机器狗舞蹈视频向滚石乐队致敬北京时间11月1日消息,波士顿动力公司(BostonDynamics)近日发布了一段向滚石乐队致敬的视频。在这段视频中,该公司的Spot机器人,唯妙唯俏地模仿了滚石乐队在1981年