范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

谷歌开源高效库GPipe,你也可以训练参数超多的模型了

  晓查 发自 凹非寺
  量子位 报道 | 公众号 QbitAI
  BigGan、BERT和GPT-2的出现表明,越大的神经网络模型可以带来越好的性能。其中能写出各种假新闻的GPT-2参数就有15亿个之多。
  如果你也在训练一个参数超多的模型,那么现在有个好消息要告诉你。
  谷歌在最近公布的Lingvo框架下开源了GPipe。它让研究人员不用调整超参数,就能用更多加速核心来训练更大的模型和提升性能。
  GPipe适用于多个连续层组成的任何DNN,而且训练模型的大小与分区数成正比。
  参数越多,效果越好
  在计算机视觉图像分类任务上,模型大小和分类准确性之间存在很强的相关性。
  △不同图像分类模型在ImageNet上的表现,显示出准确度和参数数量的强相关性
  从2014年到2017年,ImageNet视觉识别的冠军的准确度从74.8%提升到了82.7%,模型参数增加了36倍。
  而在这三年间,GPU显存仅仅增加了3倍,因此迫切需要一种高效的神经网络训练库来解决参数太多的问题。
  核心越多,参数越多
  GPipe就可以减少参数模型对内存的占用。
  谷歌研究人员在8核心64GB内存的云TPUv2进行测试。如果没有GPipe,由于内存的限制,每个加速核心只能训练8200万个参数。
  使用GPipe后,活动内存从6.26 GB降低到3.46GB,可以在单个加速核心上训练3.18亿个参数,接近原来的4倍。
  通过GPipe,AmoebaNet能够在云TPUv2上加入18亿个参数,比没有GPipe的情况下多25倍。
  △ 谷歌将AmoebaNet-D模型分配到四倍数量的加速核心上,实现了3.5倍的加速
  GPipe不仅仅速度更快,在训练模型的质量上也有提高。
  为了验证这一点,谷歌训练了另一种图像分类算法AmoebaNet-B,它总共有5.57亿个模型参数。
  该算法在一些常用的数据集上表现很好,将single-crop ImageNet精度提高到了84.3%,在CIFAR-10上的精度为99%,在CIFAR-100上的精度为91.3%。
  GPipe为何能实现高效
  原则上我们可以通过并行计算在GPU或者TPU上训练更大的DNN模型。但是由于DNN的顺序性,这种方法可能导致在计算期间只有一个加速器处于活动状态,不能充分利用设备的计算能力。
  谷歌在GPipe使用了两种AI训练技术:一种是同步随机梯度下降,另一种是并行pipeline,将上一步的输出作为流传输到下一步。
  Gpipe将模型划分到不同的加速核心,并自动将mini-batch的训练样本分成更小的micro-batch,并在pipeline中运行,使TPU核心能够并行操作。
  此外,梯度一直在micro-batch中累积,因此分区数量不会影响模型质量。
  以上都是在云TPUv2上的结果,实际上GPipe在云TPUv3上有更好的性能,每个TPUv3都有16个加速器核心和256 GB(每个加速器16 GB)。用GPipe训练80亿参数的Transformer模型时,能实现11倍的加速。
  开源地址:
  https://github.com/tensorflow/lingvo/blob/master/lingvo/core/gpipe.py
  — 完 —
  诚挚招聘
  量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复"招聘"两个字。
  量子位 QbitAI · 头条号签约作者
  վ"ᴗ" ի 追踪AI技术和产品新动态

为轨道上的卫星加油和维修甚至变轨NASA的OSAM1任务详解据悉,美国宇航局(NASA)正在计划一项任务,以展示其修复和升级地球轨道卫星的能力。这项任务被称为OSAM1(在轨服务组装和制造1),届时NASA将发射一个机器人航天器,配备机器人一起和武仙座流星雨来一场浪漫的邂逅吧流星雨的确很美,在浩瀚的天幕上滑过银色的轨迹,虽然只有一瞬间,但足以给人留下深刻的印象。那么关于流星雨的几点常识大家是否知道呢?实际上,流星是妥妥的灰姑娘。它源于太空中的灰尘颗粒,波音成功发射无人太空舱纽约(CNNBusiness)周四(2022年5月19日)晚上,波音公司发射了星际太空舱,测试其在无人驾驶下前往轨道,用途是运送宇航员往返国际空间站(ISS)。波音的目标是在真正执神舟凯旋谱写崭新飞天梦神舟十三号3名航天员终于回家了。神舟十三号载人飞船搭载航天员翟志刚王亚平叶光富,安全返回酒泉卫星发射中心东风着陆场。至此,中国空间站关键技术验证阶段收官之战取得圆满成功。两次出舱科你知道罗盘座T星吗?这颗超新星爆炸,足以摧毁地球的臭氧层罗盘座T星,位于南半球星座罗盘座之中,是在罗盘座的一颗复发新星和新星残骸。研究人员发现,罗盘座T星距离太阳系只有3260光年,这颗白矮星将最终变成一颗超新星。最为严重的问题是,这颗银河系中心黑洞露真容,为何如此难拍!又为何要给黑洞拍照?北京时间2022年5月12日21时07分,全国各地的天文学家和天文研究中心,几乎同时公布银河系中心黑洞人马座A(SgrA)的照片,这是关于人马座A(SgrA)的首张照片。但让人们不空间站即将变身!神舟十四有女航天员?天舟四号或已给出答案中国空间站又要变身了,这是啥情况?目前我们的空间站仍处于在轨建造的阶段,有一个天和号核心舱正在太空中飞行,除此之外还有2艘货运飞船与天和号核心舱对接着,其中一艘是天舟三号货运飞船,人类可能会灭绝以下是试图阻止它的方式和人员人类灭绝?它可能发生,但不是一定的。有时很难不去想人类的时钟还剩下多少时间。无论是战争饥荒另一份关于气候变化的严峻报告,还是迄今为止已导致600万人死亡的流行病,地球上的生命都可能宇航员在太空中怎样保证食物和饮用水充足?看完你就明白了宇航员在太空中的食物跟饮用水是分别来配置的,在宇航员进入太空完成任务之前会根据宇航员在太空中停留的时间长短来配备专门的航天食品,由于水比较重,所以宇航员会携带适量的水,在太空中通过科学家称有一棵泰坦尼克号大小的ampampquot树ampampquot,在为地球的火山提供能量科学家们所知的大多数地球活火山都位于所谓的火环内,或环太平洋火山地震带内这是太平洋上的一个区域,许多火山爆发和地震都发生在这里。但是,是什么滋养了火环外火山的火焰呢?一个国际科学家宇宙奥秘从太阳发出的光线,到底能照射到多远的地方?地球上得以产生形形色色的生命,最关键的因素就是地球和太阳之间的距离,正好处于适宜碳基生命存在的宜居带,继而奠定了适宜的温度和液态水的形成基础。经科学家计算,地球接收到的太阳辐射,仅
将一万亿桶水全部倒在太阳上,太阳会不会熄灭?如果把1万亿桶水同时倒在太阳上,会发生什么?众所周知,太阳发出的光是地球上主要的能源,也是生命延续的必备条件。太阳离我们很远,距离大约为0。0000158光年,换算为1。496亿公被黑洞吃掉的物质都去向了何方?是另一个宇宙吗?黑洞里所有的物质都去了哪里?另一个世界?黑洞可以说是宇宙中最神秘的存在,黑洞有着目前宇宙最强的引力,连光速都无法逃脱。任何靠近黑洞的物质最终都会被吞噬,那么问题来了,这些物质到了哪如果我们的太阳变成一个黑洞,会发生什么后果?如果我们的太阳被黑洞取代会发生什么?根据目前的理论,在3040亿年后,我们的太阳会变得更热,然后它将在大约50亿年内膨胀成红巨星。然后吞下内部行星,最终缩回到白矮星。变成白矮星后,爱因斯坦的智商被高估了吗?其他人的智商是否可能比爱因斯坦高?我们知道,爱因斯坦是一个极其伟大的科学家,称她为科学界的传奇也不为过。那么爱因斯坦的天才被高估了吗?其他人的智商是否可能比爱因斯坦高?其实这个答案显然取决于你对他在大众中的考虑的看如果被熊攻击,人类应该装死还是疯狂地逃跑?上海野生动物园工作人员遭熊袭击身亡熊袭击人类事件鲜有发生,如果被熊追应该装死还是逃跑?我们知道,熊是一种大型哺乳类动物,力气极大,如果人类碰上熊,想要跟他搏斗是几乎不可能的。近年来当太阳变成红巨星吞没地球时,一旦进入太阳内部,地球会怎么样?在54亿年后,太阳将进入所谓的红巨星演化阶段。一旦堆芯中的氢耗尽,堆在那里的惰性氦灰变得不稳定并在自身重量下崩塌,剧烈的温度这将导致地核变热,密度变大,导致太阳体积变大。据计算,不外星文明是否背着人类造访过地球?人类是不是被蒙在鼓里?外星文明可能造访过地球?关于这个问题,很难说,我们可以慢慢分析一下首先让我们思考一下所谓的不明飞行物,很多人声称见过他们,但是其中很多人在撒谎或者说被自己欺骗狮虎之争,终于有定论了老虎是天生的杀手为什么老虎和狮子几乎从不打架?狮虎之争谁是赢家?我们知道,对于狮子和老虎谁是百兽之王仍然存在歧义,在我国,老虎的威势似乎更胜一筹,而在西方,狮子是毫无疑问的百兽之王。但是事实胜于雄黑客帝国算神级预言吗?人类是否生活在虚拟中?电影黑客帝国可以说是一代科幻的鼻祖,放到现在,我也难以想象那个时代的思想比现在还有超前。这部电影围绕了一个核心人类生活在虚拟世界。真的有够天马行空,但是有时候我们又自顾怀疑人类真的太阳50亿年后毁灭全过程,人类可能由于二氧化碳短缺灭绝?再过几十亿年,我们的太阳将膨胀成一个红巨星,并可能在这个过程中吞噬地球。在假设人类仍在地球上的这一点上,我们能看到这种情况发生吗?还是一个瞬间的过程?首先这是一个缓慢的过程,其次遗20名美国外交官生病,或不是巧合根据南方日报报道,近期,美国大使馆发布红色预警,20名驻奥地利大使馆的外交官出现哈瓦那综合征。而在此之前,美国曾炒作中国使用微波武器攻击美国大使馆工作人员,导致他们患上哈瓦那综合征