范文健康探索娱乐情感热点
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

放话挑战GPT3以色列推出参数多30亿词条多5倍的新语言模型

  8 月 15 日消息GPT-3 有多厉害不用多说了吧?
  现在,以色列特拉维夫一家 AI 公司 ——AI21 Labs 表示要挑战一下这个巨星在 NLP 领域的主导地位。
  他们计划发布一个比 GPT-3 还要大的模型,且目前不用排队苦苦申请,所有人都可以免费"调教"。
  大多少呢?
  GPT-3 模型拥有 1750 亿个参数,而他们这个叫做 Jurassic-1 (侏罗纪-1) 的模型有 1780 亿个 。
  GPT-3 模型的词汇表有 5 万个 token,而 Jurassic-1 使用的词汇表则有 25 万个!
  对所有人开放,训练只需提供 50-100 个样本
  Jurassic-1 模型的训练数据包括 3000 亿个 tokens,由维基百科、新闻出版物、StackExchange(问答网站)和 OpenSubtitles(全球最大的多国语言开放字幕库)上的信息编译而来。
  在云上经过数百个 GPU 的分布式训练而成,由于最终存储 1780 亿个参数需要超过 350GB 的内存 ,这就要求开发团队使用多种策略来尽可能提高流程的效率。
  而减少文本表示所需的 token 数就是一个好办法。
  Jurassic-1 使用的词汇表不仅包括了完整词和分词(word piece),还挖掘了一些不太常见的词或词组,比如"纽约洋基队"、"run of the mill(习语,平庸的)"、国家元首名字。
  这也是 Jurassic-1 成为第一个使用包含多词汇(muti-word)token 的语言模型。
  这就让模型的效率提上来了,比如"Once in a while I like to visit New York City"这句,GPT-3 需要使用 11 个 token 来表示,而 Jurassic-1 只需 4 个。
  Jurassic-1 模型的规模大了 30 亿参数,GPT-3 能干的活它自然也"不甘示弱":生成"人话"自不用说,文本转表格、话题分类、Python 转 JavaScript、从产品描述中生成简短的产品名称、写歌、算数等从简单到复杂的任务都能 hold 住。
  ▲Jurassic-1 重新解读商场"黑话"
  ▲Jurassic-1 写博客
  性能如何呢?
  实验显示,Jurassic-1 模型在一系列任务中的表现与 GPT-3 相当或更好 (尤其是在回答学术和法律问题方面)。
  下表说明了在几乎所有的语料库中,Jurassic-1 模型的适用性都大幅领先对手 GPT-3。
  ▲各种语料库中每个字节的平均对数概率(log-probabilities)
  此外,与 GPT-3 相比,Jurassic-1 在零样本学习中与之性能持平,但在少样本学习中略胜一筹 ,这也是因为它的 tokenizer 可以在相同的上下文长度中容纳更多的文本,因此可以在 prompt 中包含更多的示例。
  ▲零样本实验结果
  ▲少样本实验结果
  现在,Jurassic-1 模型的公测版本已通过 AI21 Labs 的 Studio 平台提供给开发人员使用,大家训练只需提供 50-100 个样本,就能搭建一些诸如聊天机器人的应用程序原型 。
  无论你是大中小企业、研究员、自由职业者还是什么身份,所有人都可以不用排队申请就能使用。
  如果有人希望上线自己搭出来的成果,获得生产规模流量,可申请访问定制模型并获得私有微调版本,在一个"按量付费"(pay-as-you-go )的云服务模式中使用。
  ps.多少人申请的 GPT-3 API 一直是 still waiting 的状态?
  不过,至于如何将模型定制到新任务上,AI21 Labs 表示这是个秘密,但反正过程会比标准微调技术更具有鲁棒性。
  因此,模型不太会容易"大面积失忆",也就是在新任务上的继续微调不会丢失此前编进去的信息。虽然自己骂自己,但它的语言偏见略低于 GPT-3
  可能你也会说,Jurassic-1 在根本上也没啥大新奇之处。
  但复刻了 GPT-3 的开源 AI 研究机构 EleutherAI 表示,这是一项工程壮举,而且他们毫不怀疑 Jurassic-1 能执行出与 GPT-3 相当的效果。
  不过问题是此类服务能否在激烈的竞争中盈利,以及如何处理不可避免的安全问题,比如模型的语言偏见。
  Jurassic-1 当然也没有解决模型输出潜在的性别、种族和其他形式的偏见。
  但团队表示非常重视这个问题,目前正在限制在公开测试版中可以生成的文本数量,并且将人工审查每个微调模型的请求以防止滥用。
  不知道能解决多少问题,反正 Jurassic-1 连自己人都骂
  !
  就比如下面这个,Jurassic-1 生成了歧视犹太人的文本:
  最后团队只是"弱弱"地表示,通过 StereoSet(语言系统中与性别、职业、种族等相关的偏见评估基准)测试发现,Jurassic-1 模型的偏见略低于 GPT-3。关于 AI21 Labs
  以色列一家专注于自然语言处理的 AI 公司,2017 年成立,目前从以色列最大的创投机构 Pitango 等公司获得了 3450 万美元资金。
  创始人包括斯坦福大学名誉教授 Yoav Shoham,CrowdX 创始人和以色列辅助驾驶系统 Mobileye 的创始人 Amnon Shashua ,目前有 40 多名员工。
  Jurassic-1"调教"地址:点击打开

哈勃望远镜捕获球状星团震撼画面包含50万颗恒星IT之家4月13日消息据CNET报道,日前,欧空局(ESA)和美国宇航局(NASA)联合公布了哈勃望远镜拍摄的Messier3球状星团的图像,称这是哈勃望远镜捕获的最美的画面之一。410光年外,科学家发现死亡恒星周围的行星残骸在距离地球大约410光年的室女座方向,正有一大团铁镍金属围绕着一颗死亡恒星高速旋转,科学家们相信,那应该是一颗行星的尸体。大质量恒星的最终宿命是在一次猛烈的爆炸中灰飞烟灭,而质量稍囧科技老外花式吐槽iPhone11系列的摄像头IT之家9月11日消息今日凌晨,苹果正式发布了iPhone11系列新机,不少国外网友在推特上花式吐槽iPhone11新机的摄像头,并制作出了千奇百怪的创意图片。摄像头?不,我反手下德国脑科专家玩手机会让青少年变笨IT之家10月15日消息据中国经济网官微消息,德国媒体就手机对青少年的影响做了市场调研,结果显示,智能手机确实会给人带来一些不好的影响,比如举止随意注意力不集中甚至抑郁。德国媒体就吸烟不仅影响健康,还会悄悄改变你的性格越来越多的人们意识到,尽管我们的性格特征足够稳定,能够深刻塑造我们的生活,但它们在一定程度上也是可塑的,吸烟有害影响可以导致性格发生变化,甚至影响人们未来的性格发展。研究结果表明,NASA火星勘测飞行器看我以上帝视角观察好奇号IT之家7月13日消息NASA的火星勘测轨道飞行器(MarsReconnaissanceOrbiter,MRO)是他们在2005年火星探测计划中发射的火星勘测飞行器,如今已经环绕火火星上的神秘发现好奇号发现神奇的白光北京时间6月28日消息,对火星表面的探索又有了神秘的发现。自2012年以来,美国国家航空航天局(NASA)的好奇号(Curiosity)火星车就一直穿行于火星表面,探测火星的气候和火星被红色雾霾笼罩,NASA证实机遇号探测器仍未苏醒据TechTime北京时间11月17日报道,美国航空航天局(NASA)日前证实,在大规模沙尘暴将火星表面笼罩在一层红色雾霾几个月后,机遇号火星探测器仍未苏醒。机遇号火星探测器机遇号马斯克要送真人上天!载人龙飞船首秀详解美国东部时间2020年5月27日,埃隆马斯克(ElonMusk)旗下SpaceX公司计划实施第一个载人航天任务。这个名为Demo2的测试任务将通过载人龙飞船把美国国家航空航天局(N连线专访NASA唯一健在试飞员驾驶飞船是一种享受!译者注上一次由美国本土进行的载人航天飞行是在2011年7月,NASA的亚特兰蒂斯号航天飞机搭载四名宇航员从佛罗里达前往国际空间站。本周NASA将迎来历史性的一刻,再次从本土将宇航员时速160至350公里的复兴号系列动车组全部投用,中国高铁持续领跑世界IT之家12月21日消息据央视新闻等,中国国家铁路集团有限公司表示时速250公里CR300型复兴号动车组近日已成功研发投用。CR300型即将在多条高铁线路开通运营,包括但不限于杭深
SpaceX星舰飞行测试在即,特斯拉CEO马斯克明年将会有星际飞船展示给大家IT之家11月23日消息,此前CNBC报道报道称,SpaceX希望在明年1月对星舰(Starship)进行首次轨道飞行测试,具体时间取决于测试和监管部门的批准。今日,当被网友问及SCES2022线下展回归在即飞行汽车外骨骼智能戒指黑科技一览科技圈年初盛会全球最大的消费电子展CES2022即将于1月5号,也就是明天,在美国拉斯维加斯正式开幕。一大波有趣的产品轮番登台,科技爱好者们一饱眼福的时候又到了。比如可能被用作202021年我们又对外星人有了哪些新认识不存在所谓最佳联络方法新浪科技讯北京时间12月30日消息,据国外媒体报道,2021年又是神秘现象层出不穷的一年,比如在瑞士上空发现的甜甜圈形UFO加拿大上空云层中忽然消失的神秘绿光突然坠入海中的碟状不明2021十大黑洞新发现外星人可能利用黑洞的能量北京时间12月29日消息,据国外媒体报道,年复一年,黑洞研究领域一直在为我们提供一些令人震惊,同时又异常费解的发现。2021年也不例外。在这一年里,科学家们又获得了许多关于黑洞的新中国科学院院士王建宇空间互联网是商业航天的重要切入点IT之家12月25日消息,据财联社报道,中国科学院院士王建宇在2021年APEC工商领导人论坛上表示,空间互联网是商业航天的重要切入点。王建宇称,相比传统模式,商业航天的研发周期更SpaceX星际飞船项目提速,首枚适合飞行超重型火箭助推器Booster4已到来12月23日消息,据外媒报道,在将超重型火箭助推器SuperHeavyBooster4(B4)吊装到星际基地(Starbase)轨道发射台上三个多月后,SpaceX终于开始了对其测SpaceX完成CRS24发射完美收官2021成功执行138次任务100次火箭着陆感谢IT之家网友SuperHeavy的线索投递!IT之家12月22日消息,当地时间12月21日,SpaceX的猎鹰9号火箭从佛罗里达州肯尼迪航天中心历史悠久的39A号发射场(LC3世界首个行星防御测试任务NASA成功发射DART航天器,明年9月主动撞击小行星IT之家11月24日消息,美国国家航空航天局刚刚于北京时间11月24日14时21分(美国东部时间11月24日1时21分)发射了一个航天器,该航天器的任务很简单,以每小时15000英保护地球防御小行星威胁DART探测器飞向太空美国国家航空航天局(NASA)即将发射的DART(双小行星重定向测试)任务或许将成为保护地球防御小行星威胁的模板。也许有一天,一台已经在仓库里堆放许久的航天器会被召唤到发射台,尽管用水滴探测器保卫地球,NASA行星防御行动曝光北京时间11月6日消息,据外媒报道,美国宇航局(NASA)眼下正在推动发射撞击小行星太空飞船计划的最终步骤。本次撞击行动将是NASA行星防御任务的一次测试。NASA拟发射太空飞船撞长征系列运载火箭完成第400次飞行,我国成功发射实践六号05组卫星IT之家12月10日消息,北京时间2021年12月10日8时11分,也就是中国航天事业奠基人钱学森诞辰110周年纪念日的前一天,在他指挥首次发射的酒泉卫星发射中心,迎来了我国长征系