范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

放话挑战GPT3以色列推出参数多30亿词条多5倍的新语言模型

  8 月 15 日消息GPT-3 有多厉害不用多说了吧?
  现在,以色列特拉维夫一家 AI 公司 ——AI21 Labs 表示要挑战一下这个巨星在 NLP 领域的主导地位。
  他们计划发布一个比 GPT-3 还要大的模型,且目前不用排队苦苦申请,所有人都可以免费"调教"。
  大多少呢?
  GPT-3 模型拥有 1750 亿个参数,而他们这个叫做 Jurassic-1 (侏罗纪-1) 的模型有 1780 亿个 。
  GPT-3 模型的词汇表有 5 万个 token,而 Jurassic-1 使用的词汇表则有 25 万个!
  对所有人开放,训练只需提供 50-100 个样本
  Jurassic-1 模型的训练数据包括 3000 亿个 tokens,由维基百科、新闻出版物、StackExchange(问答网站)和 OpenSubtitles(全球最大的多国语言开放字幕库)上的信息编译而来。
  在云上经过数百个 GPU 的分布式训练而成,由于最终存储 1780 亿个参数需要超过 350GB 的内存 ,这就要求开发团队使用多种策略来尽可能提高流程的效率。
  而减少文本表示所需的 token 数就是一个好办法。
  Jurassic-1 使用的词汇表不仅包括了完整词和分词(word piece),还挖掘了一些不太常见的词或词组,比如"纽约洋基队"、"run of the mill(习语,平庸的)"、国家元首名字。
  这也是 Jurassic-1 成为第一个使用包含多词汇(muti-word)token 的语言模型。
  这就让模型的效率提上来了,比如"Once in a while I like to visit New York City"这句,GPT-3 需要使用 11 个 token 来表示,而 Jurassic-1 只需 4 个。
  Jurassic-1 模型的规模大了 30 亿参数,GPT-3 能干的活它自然也"不甘示弱":生成"人话"自不用说,文本转表格、话题分类、Python 转 JavaScript、从产品描述中生成简短的产品名称、写歌、算数等从简单到复杂的任务都能 hold 住。
  ▲Jurassic-1 重新解读商场"黑话"
  ▲Jurassic-1 写博客
  性能如何呢?
  实验显示,Jurassic-1 模型在一系列任务中的表现与 GPT-3 相当或更好 (尤其是在回答学术和法律问题方面)。
  下表说明了在几乎所有的语料库中,Jurassic-1 模型的适用性都大幅领先对手 GPT-3。
  ▲各种语料库中每个字节的平均对数概率(log-probabilities)
  此外,与 GPT-3 相比,Jurassic-1 在零样本学习中与之性能持平,但在少样本学习中略胜一筹 ,这也是因为它的 tokenizer 可以在相同的上下文长度中容纳更多的文本,因此可以在 prompt 中包含更多的示例。
  ▲零样本实验结果
  ▲少样本实验结果
  现在,Jurassic-1 模型的公测版本已通过 AI21 Labs 的 Studio 平台提供给开发人员使用,大家训练只需提供 50-100 个样本,就能搭建一些诸如聊天机器人的应用程序原型 。
  无论你是大中小企业、研究员、自由职业者还是什么身份,所有人都可以不用排队申请就能使用。
  如果有人希望上线自己搭出来的成果,获得生产规模流量,可申请访问定制模型并获得私有微调版本,在一个"按量付费"(pay-as-you-go )的云服务模式中使用。
  ps.多少人申请的 GPT-3 API 一直是 still waiting 的状态?
  不过,至于如何将模型定制到新任务上,AI21 Labs 表示这是个秘密,但反正过程会比标准微调技术更具有鲁棒性。
  因此,模型不太会容易"大面积失忆",也就是在新任务上的继续微调不会丢失此前编进去的信息。虽然自己骂自己,但它的语言偏见略低于 GPT-3
  可能你也会说,Jurassic-1 在根本上也没啥大新奇之处。
  但复刻了 GPT-3 的开源 AI 研究机构 EleutherAI 表示,这是一项工程壮举,而且他们毫不怀疑 Jurassic-1 能执行出与 GPT-3 相当的效果。
  不过问题是此类服务能否在激烈的竞争中盈利,以及如何处理不可避免的安全问题,比如模型的语言偏见。
  Jurassic-1 当然也没有解决模型输出潜在的性别、种族和其他形式的偏见。
  但团队表示非常重视这个问题,目前正在限制在公开测试版中可以生成的文本数量,并且将人工审查每个微调模型的请求以防止滥用。
  不知道能解决多少问题,反正 Jurassic-1 连自己人都骂
  !
  就比如下面这个,Jurassic-1 生成了歧视犹太人的文本:
  最后团队只是"弱弱"地表示,通过 StereoSet(语言系统中与性别、职业、种族等相关的偏见评估基准)测试发现,Jurassic-1 模型的偏见略低于 GPT-3。关于 AI21 Labs
  以色列一家专注于自然语言处理的 AI 公司,2017 年成立,目前从以色列最大的创投机构 Pitango 等公司获得了 3450 万美元资金。
  创始人包括斯坦福大学名誉教授 Yoav Shoham,CrowdX 创始人和以色列辅助驾驶系统 Mobileye 的创始人 Amnon Shashua ,目前有 40 多名员工。
  Jurassic-1"调教"地址:点击打开

中科院地质地球所揭示火星上游太阳风的分布和变化IT之家5月18日消息据中国科学院网站,中国科学院地质与地球物理研究所地球与行星物理院重点实验室利用美国MAVEN火星探测器在2014至2020年期间的高精度离子和磁场观测数据,首NASA宣布将机智号直升机任务延长30个火星日IT之家5月2日消息目前美国的机智号直升机已经完成了在火星上的第四次飞行。美国宇航局NASA昨日宣布,将机智号的任务时间延长30个火星日,以便进一步探索火星表面,并测试无人机的能力因遭到抗议,NASA暂停SpaceX29亿美元月球着陆器合同IT之家5月1日消息在4月16日,SpaceX公司成功打败蓝色起源公司和国防承包商Dynetics公司,赢得了美国宇航局(NASA)价值29亿美元的月球着陆器合同。但是根据外媒Th首次遭遇失败,NASA火星直升机机智号第四次飞行未能起飞北京时间4月30消息,美国宇航局(NASA)的火星直升机机智号原定于在当地时间周四进行目前为止最大胆的飞行尝试,但是它未能起飞。4月29日,毅力号拍摄到的机智号机智号在4月19日创SpaceXCrew1龙飞船即将返回地球,4名宇航员准备就绪IT之家5月2日消息SpaceX公司首个载人飞船Crew1龙飞船于2020年11月15日发射升空,将四名宇航员送入国际空间站。如今他们已经完成为期6个月的在轨任务,即将搭乘同一个飞美国联邦航空管理局批准SpaceX星舰飞船原型未来三次发射北京时间4月30日早间消息,据报道,美国联邦航空管理局(FAA)周四表示,已批准SpaceX星舰飞船原型的未来3次发射,并证实FAA负责人上月与SpaceXCEO埃隆马斯克(Elo天舟三号从空间站后端绕前端对接,后续将迎接天舟四号神舟十四号的到访IT之家4月20日消息,据央视新闻报道,据中国载人航天工程办公室消息,北京时间今天5时02分,天舟三号货运飞船从空间站天和核心舱后向端口分离,绕飞至前向端口,并于9时06分完成自动外交部中国空间站欢迎国外航天员来访IT之家4月18日消息,据央视新闻报道,今天,外交部回应会否有外国航天员加入中国空间站。发言人汪文斌表示,国际合作是航天事业发展的趋势和潮流。当前,中国正在进行首批中外合作项目,中我国空间站关键技术验证阶段完美收官,今年建设阶段将实施6次飞行任务IT之家4月17日消息,中国载人航天工程办公室主任郝淳,中国载人航天工程空间站系统总设计师杨宏,中国载人航天工程航天员系统总设计师黄伟芬等专员在今日的国新办新闻发布会上向我们介绍了天舟四号计划将于5月中上旬择机发射,天舟五号问天梦天实验舱今年发射IT之家4月16日消息,据央视军事报道,西昌卫星发射中心总工程师钟文安介绍,天舟四号预计5月中上旬发射,航天员吃住用品货包已安装完毕,火箭也已完成箭体恢复。据介绍,文昌发射场今年还火箭发射失败,NASA四颗卫星报废,Astra股价暴跌逾262月11日消息,当地时间周四,由于为美国宇航局(NASA)发射四颗微型卫星失败,火箭制造商Astra的股价暴跌逾26。Astra证实,在为NASA执行卫星发射任务中,存在一个飞行中
中美科学家在地球地幔中发现巨大山脉北京时间2月15日消息,美国普林斯顿大学(PrincetonUniversity)和中国大地测量与地球物理研究所的研究人员利用有大型地震的数据,在地幔中发现了巨大山脉,并将研究结果形态各异的冰地球曾经就是一个大雪球据国外媒体报道,我们可以在世界各地发现各种各样形态的冰。冰不仅仅是水被冷冻的结果,各种形态的冰可以告诉我们其所处环境的故事,包括它们如何随季节变化并显示地球气候变化趋势。科学家研究100亿年前银河系发生什么?NASA新任务将给出答案美国航空航天局(以下简称NASA)已经选定其探索者项目(ExplorersProgram)的新任务,使我们能对宇宙的过去有更多了解,搜寻生命存在的迹象。研究宇宙历史和电离时代的光谱我们有生之年能遇到地球两极磁场翻转吗?据国外媒体报道,目前地球北极磁场非常紊乱,以至于科学家更新4年前他们发布的全球磁场模型,这是地球磁极即将翻转的信号吗?世界磁场模型(WMM),是地球磁场更新表现的名称,预计最晚不超地球自转轴倾角不断变化影响南极冰盖融化速度北京时间1月23日消息,据国外媒体报道,随着温室气体二氧化碳浓度不断增加全球持续变暖,南极冰盖越来越容易受天文学尺度的循环周期影响,尤其是地球自转轴倾角。新研究发现,3000万年来日本隼鸟2号探测器成功在小行星表面部署两枚着陆器北京时间9月26日消息,据国外媒体报道,日本隼鸟2号近日成功发射了两枚机器探测器,降落在直径仅有1公里的小行星龙宫(Ryugu)表面。如果一切顺利,隼鸟2号将成为第一艘成功在小行星向瓢虫学习如何翻跟斗,仿生无人机再现新进展7月23日消息,据外媒IEEESpectrum报道,近日研究人员研发了一架搭载人造鞘翅(artificialelytra)的新型无人机。该人造鞘翅模仿昆虫的鞘翅制成,让无人机像昆虫我国实现水稻生育周期减半重要突破,60天可收获IT之家8月22日消息据新华网消息,近日,中国农业科学院都市农业研究所植物工厂创新团队与中国水稻研究所钱前团队合作,在植物工厂环境下成功实现水稻种植60天左右收获的重要突破。这一研我国自主研发建造的深海一号能源站进入最后测试阶段IT之家6月7日消息据央视新闻报道,由我国自主研发建造的全球首座10万吨级深水半潜式生产储油平台深海一号能源站,历经3年完成了设计建造安装,目前已进入投产前的测试阶段。IT之家了解一次看饱,歼20运20歼16歼10训练展示IT之家8月22日消息大家都知道目前歼20型战斗机是我国现阶段装配的一款高隐身性高态势感知高机动性等能力的隐形第五代制空战斗机,震慑潜在对手,守卫我国空天安全,承担着人民的期盼和重大国重器!歼20最新宣传片发布IT之家6月16日消息各位小伙伴可能有所不知,今年是我国最先进战斗机歼20首飞十年纪念,而中国航空工业集团官方此前也为此特意制作了一份歼20的最新宣传视频忠诚奉献逐梦蓝天,回顾十年