范文健康探索娱乐情感热点
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

谷歌机器学习训练有史以来最大版本BERT模型,参数规模4810亿

  机器学习领域权威"跑分"MLPerf v1.1 训练榜单已出炉。
  这次,在 BERT 模型的成绩表上有一个"异常"的数字:1196.638(分钟),来自谷歌 。
  怎么?谷歌训练一个 BERT 要接近 1 天,别家都只要几分钟 ?
  这其实是谷歌从未透露的巨型版本 BERT,参数规模有 4810 亿 ,不是别人只有几亿参数那种的 BERT。
  它也是谷歌今年在 MLPerf"非标准区"提交的一个作品:一共花了 2048 块 TPUv4,约 20 小时训练而成!
  ▲TPUv4 芯片机架,谷歌数据中心有史以来最大版本的 BERT
  标准 BERT 模型(BERT Large)参数规模只有 3.4 亿,而此次 4810 亿的巨型 BERT 是有史以来最大的一个版本。
  这俩之间直接差了好几个数量级 。
  而谷歌表示,训练大型模型正是公司的"重中之重"(主要用于云服务)。
  所以此次他们根本没有参加任何标准分区里的跑分评比,只在非标准区"释放了自我"。
  MLPerf 竞赛有俩分区:
  Closed 区也就是标准区,参赛商在 ResNet-50 等规定模型上跑分;
  Open 区也就是非标准区,参赛商可以尝试任何规定以外的模型和方法来达到目标性能。
  在大多数参赛商都"挤"在标准区训练小规模的模型时,谷歌员工"凡尔赛"道:
  "在短短几秒内‘豪掷’4000 块芯片来训练巨型 BERT 才是真的酷(爽)。"
  谷歌由此也希望 MLPerf 基准测试能引进更多的大模型,因为他们觉得现实中才不会像非标准区的参赛作品那样用那么多芯片来训练那么小的模型。
  而此次的巨型 BERT 性能也不赖,它的预测准确率为 75%,比 MLPerf 要求的 72.2% 要高。
  同时,和标准区其他参赛商一样,谷歌也用较少的文本数据样本来达到目标精度。
  具体来说,标准区要求一个程序使用近 5 亿个 token 序列进行训练,每个序列的长度大多为 128 个 token。而 Google 只使用了大约 2000 万个序列,不过每个序列的长度为 512token。
  另外,完成这次工作的 2048 块 TPU 系统一开始也是为了迎合公司的生产和研发需要,所以它并未"束之高阁"—— 目前已用于 Google Cloud 服务。英伟达在标准区"战绩显赫"
  其余 MLPerf 结果,主要在"标准区",一如既往,英伟达战绩最高 。
  比如它使用最新一代 GPU A100 的系统在训练 ResNet-50 花费的时间上包揽前四,其中最快只需 21 秒 —— 比今年 6 月 24 秒的最高成绩还快。
  当然,此战绩一共花了 4320 个 A100,在 1080 个 AMD 的 EPYC x86 处理器的帮助下并行完成。
  但在不拼芯片和主机处理器的情况下,竞争对手可就碾压起英伟达了。
  其中英特尔 Habana 用 256 个 Gaudi 加速芯片,只需 3.4 分钟就训练好 ResNet-50。
  Graphcore 则只需 3.8 分钟,用了 256 块 IPU 加速器芯片和 32 块 AMD EPYC 主机处理器。
  英伟达在配备 16 个 EPYC 处理器的 64 路 A100 系统下,花了 4.5 分钟。
  打败了英伟达的 Graphcore,则强调自己最看重性能和成本之间的平衡。
  就比如 Graphcore 在 16 路系统上训练 ResNet-50 耗费 28 分钟,比英伟达 DGX A100 系统快一分钟,但他们用到的 POD-16 是 DGXA100 成本的一半。
  此次参赛的其他厂商中,三星在电子训练普通版 BERT 的速度上获得了第二名 ,仅为 25 秒。花了 256 个 AMD 芯片和 1024 个英伟达 A100。
  微软的 Azure 云服务首次参赛,它使用 192 个 AMD EPYC 处理器和 768 个 A100 在医疗数据上训练图像分割模型获得了最高分。
  同时 Azure 也表示后续也会像谷歌那样在非标准区提交一些成绩,虽然微软和英伟达在此前不久发布了目前最大的模型"威震天-图灵",但他们表示:
  许多公司希望将人工智能用于专一目的,而非需要 4000 块芯片才能运行的巨型语言模型。
  更多评分结果大家可以参考官网数据。
  榜单地址:点此访问

马斯克10年后在火星上开特斯拉IT之家3月15日消息今日,特斯拉举行发布会,正式揭晓了全新车型ModelY,这标志着马斯克SEXY愿景的实现。马斯克的SEXY也即S3XY,象征着特斯拉Model系列的四款车型。审查完成!NASA宇航员下周搭SpaceX载人龙飞船升空5月23日消息,据国外媒体报道,当地时间周五美国国家航空航天局(NASA)官员完成飞行准备情况审查,确认任务计划进展顺利,批准SpaceX和NASA继续为下周将两名宇航员从佛罗里达只在火星待了几天,洞察号发电量已超越老前辈12月5日消息,据国外媒体报道,虽然距离成功降落火星只有几天时间,但洞察号Insight探测器所产生的太阳能电力已经打破了纪录,达到了4588瓦时。虽然洞察号探测器只在火星上呆了几NASA公布重返月球计划投资26亿美元建月球人类基地据国外媒体报道,目前,美国宇航局公布美国返回月球的最新计划,但是该计划将依靠商业公司共同执行探月任务。美国宇航局计划投资26亿美元,与9家商业公司合作,从小型初创公司,到洛克希德马人类探测火星之路,无数探测器无功坠毁12月1日消息,据国外媒体报道,美国美国宇航局(NASA)的InSight登陆探测器通往火星的道路,在一定程度上可以说是由那些前辈登陆器的坠毁遗骸铺就的。这是一个很容易被忽视的事实第三次发射相同火箭!SpaceX再破纪录一次性携带64颗卫星北京时间12月4日凌晨消息,SpaceX周一完成了该公司今年内创纪录的第19次发射尝试,同时还尝试在美国创造一次性携带64颗卫星同时进入轨道的纪录。此外,SpaceX也因该公司第三俄航天集团总裁鼓励联盟号航天员明年春天再飞IT之家10月14日消息本月11日,俄罗斯联盟号飞船在运送两名宇航员前往太空途中遇事故,宇航员成功脱险,俄罗斯暂停所有载人航天任务。近日,俄罗斯航天集团总裁鼓励联盟号宇航员,明年春马斯克晒飞船月球着陆渲染图不锈钢外壳闪闪发光北京时间4月30日早间消息,SpaceX创始人埃隆马斯克(ElonMusk)周一在Twitter上发布了一张不锈钢星际飞船(Starship)停在月亮上的渲染图。渲染图显示,星际飞科学家发明了一台能够预测多个未来的量子计算机北京时间4月15日消息,据国外媒体报道,科学家打造了一台如同电影回到未来风格的装置,能够预测另一种现实和可能的未来。这台机器其实是一台量子计算机,能够同时生成多个未来,就好像用不同天宫二号回家时间确定IT之家7月13日消息中国载人航天工程办公室今天宣布,根据计划安排,天宫二号空间实验室已完成全部拓展试验,计划于北京时间2019年7月19日择机受控离轨并再入大气层,少量残骸将落入中国空间站任务将于2020年首飞,2022年前后建成IT之家4月25日消息本月23日,中国载人航天庆祝2019年中国航天日主题活动在京举行。活动现场,航天届相关业内人士表示,目前我国空间站研制建设稳步推进,主要系统关键技术攻关已经完
科学家称几个小的化学调整可使披萨饼的味道变得更好据外媒报道,对于那些想利用厨房化学知识来改善饮食的家庭厨师来说,食品科学是一个迷人的课题。对于那些喜欢在家里制作披萨但发现它缺乏一点东西的人来说,科学家们在这里提出了几个小的化学调科学家偶然发现具有巨大潜力的类风湿性关节炎疫苗来自托莱多大学的研究人员发现了一种潜在的治疗类风湿关节炎的新方法。这种基于疫苗的治疗策略在初步的动物研究中被证明是成功的,研究人员希望在未来进行更多的临床试验。这项研究围绕着一种叫极地冰的融化使地球本身发生变化而不仅仅是海平面据外媒报道,极地冰的融化不仅使海平面发生变化,而且还在改变地球本身。新晋博士SophieCoulson和她的同事在最近发表在地球物理研究快报上的一篇论文中解释说,随着格陵兰岛南极洲NASA为其DART小行星重定向测试任务确定了发射日期NASA已经确认了双小行星重定向测试(DART)任务的目标发射日期。该任务的目的是评估防止小行星撞击地球的技术。确认的目标发射日期是太平洋时间2021年11月23日晚上1020。D调查全球约有11的人在用餐时经常感到腹痛根据一项针对5万多人的调查,全球约有11的人在用餐时经常出现腹痛。这项研究周一在2021年虚拟UEG周上首次公布。研究发现,与吃饭有关的疼痛似乎在18至28岁的年轻人中最为常见,有MIT学院的RFusion机器人可以帮助找到你丢失的东西麻省理工学院开发了一种新的机器人,旨在帮助用户找到放错地方的物品。该机器人被称为RFusion,它由一个机器人手臂组成,其抓取机制上安装了一个摄像头和射频天线。该设计将来自射频天线科学家通过实验揭穿了蜘蛛丝的抗菌神话早在古罗马时期,蜘蛛丝就被用作治疗从皮肤病变到疣的各种疾病。在过去,医生用蜘蛛网覆盖开放的伤口。然而在现代,文献中关于蜘蛛丝是否具有抗菌特性的报告相互矛盾。在10月5日的iScie天文学家在下铁雨的巨型系外行星上发现奇怪的信号据外媒CNET报道,去年,天文学家发现距离地球约640光年的热木星WASP76b上有一个奇怪的夜间现象。每天晚上,这个星球上都会ldquo下铁雨rdquo。ldquo下铁雨rdqu基于CIMS的水产养殖技术可不断地检查水藻是否健康除了目前用于生物燃料补充剂和肥料外,海藻还有可能被用于从生物打印组织到蜜蜂饲料的各种应用。这就是一个新的系统特别重要的原因,因为它不断地检查水藻是否健康。该系统由加州大学圣迭戈分校NASAMoonWiFi计划在地球应用的一个意外好处据外媒报道,当涉及到修复传回到地球上的WiFi时,月球可能不是一个让宇航员能够保持连接的地方,但NASA正在研究未来的太空技术如何帮助人们在家里保持连接。随着永久性月球基地计划的不科学家在1600万年前的多米尼加琥珀中发现水熊新物种缓步动物也被称为水熊,是一个多样化的有魅力的微型无脊椎动物群体,它们因其在极端条件下的生存能力而最为出名。一个著名的例子是2007年的一次太空旅行,在那里水熊被暴露在太空真空和有害