范文健康探索娱乐情感热点
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

英伟达迎来最强竞争对手?

  最近,人工智能领域权威跑分榜单MLPerf更新了1.1版,主要针对云端和边缘端的推理性能。
  MLPerf是由ML Commons推出的性能测试榜单。在人工智能技术发展迅速的今天,不同的针对人工智能加速的芯片也是层出不穷,于是如何能有一个较好的标准跑分(benchmark)平台就很重要,有了这样的平台,用户才能以较为公平和合理的方式去比较不同芯片的人工智能性能。具体来说,MLPerf对于不同的测试组别(训练,服务器推理,终端推理等)提供了一系列标准的测试网络,并且由各个硬件公司上传可验证的跑分结果,这些结果在经过验证后,就由ML Commons总结整理并上传到MLPerf的榜单上。
  这次公布的MLPerf 1.1榜单中,基本可以分为几大势力:首先,是以Nvidia的GPU为核心加速卡的方案,由各种不同的厂商(包括Nvidia自己,以及超微、联想、戴尔、HP等整机厂商)实现的整机去跑分;其次是高通的云端加速卡方案,由高通自己提交跑分结果;第三类是Intel的CPU方案;第四类则是一些初创公司的方案。因此,在MLPerf 1.1的结果中,我们认为最值得关注的,就是高通与Nvidia之间的竞争。事实上,在一些测评项目中,高通的方案已经实现了比Nvidia更高的结果,这也说明在服务器推理市场,Nvidia遇到了一个强力的竞争对手,未来无法再高枕无忧。
  MLPerf:高通与Nvidia的竞争
  目前,Nvidia这一代的主要人工智能加速方案包括A100和A30。其中,A100是Nvidia的旗舰级GPU,同时针对推理和训练市场,算力高达600 TOPS (INT8精度),其功耗则根据使用内存的区别从250W-400W不等。
  另一方面,A30则是Nvidia主要针对推理市场的GPU产品,其INT8峰值算力可达330 TOPS,约为A100的一半,而Nvidia在其官方资料中称A30在运行机器学习算法时的实际性能约为A100的三分之二。功耗方面,A30的最大功耗约为165W。
  在高通方面,Cloud AI 100芯片于今年上半年正式发货,其INT8最大算力可达400 TOPS,最大功耗(PCIe版本)则75W。根据高通公布的资料,其设计采用了多核架构,每个AI Core上拥有8MB的SRAM,最多在芯片上可以集成16个AI Core,并且这些AI Core会共享LPDDR4X DRAM,以及PCIe接口。值得注意的是,高通的Cloud AI 100并没有像Nvidia一样使用HBM2内存接口,而是使用了功耗和带宽都更低的LPDDR4X接口,这意味着高通需要能更好地管理内存才能摆脱其在内存带宽方面的劣势。
  高通Cloud AI 100架构
  在MLPerf 1.1中,高通的表现可圈可点。在推理分类下的各项目中,高通提交了ResNet 50(用于图像分类),SSD(用于物体检测)以及BERT(用于自然语言处理任务)的结果。在ResNet 50的结果中,高通装有16块75W Cloud AI 100 加速卡的主机可以实现每秒342011次推理,而Nvidia提交的DGX主机结果中(包含8块400W的A100 GPU),ResNet 50的推理吞吐量为每秒313516次推理,因此高通不仅推理吞吐量比Nvidia的旗舰GPU A100结果高了10%,而且总功耗仅为Nvidia方案的三分之一左右。在和Nvidia A30的对比中,高通的Cloud AI 100同样可以以A30一半左右的功耗实现比A30高10%左右的ResNet 50推理吞吐量。
  另一方面,在目标检测SSD方面,高通16X Cloud AI 100的性能则比Nvidia 8X A100低了10%左右。而在自然语言BERT项目中,高通16X Cloud AI 100的性能则大约是Nvidia 8X A100的一半。这些结果表明,在主流机器视觉任务中,高通的16X Cloud AI 100已经能实现和Nvidia 8X A100基本相同甚至更好的性能,而在BERT等自然语言处理任务中,Cloud AI 100则仍然距离A100有相当的差距。这其实从高通Cloud AI 100的设计中也可以看出端倪,它使用8MB每核心的片上内存搭配LPDDR4X内存接口,在模型较小的机器视觉任务(例如ResNet-50和SSD)中已经够用,内存不会成为其瓶颈;然而对于模型较大的自然语言处理模型如BERT中,LPDDR4X接口仍然成为了高通AI Cloud 100的瓶颈,而使用HBM2系列接口的Nvidia A100则有优势。
  推理市场中,高通对Nvidia会造成威胁吗
  如前所述,高通的Cloud AI 100在机器视觉任务中都能以更低的功耗实现和Nvidia A100方案接近,或比A30更高的性能。虽然Cloud AI 100在自然语言处理方面离Nvidia A100方案的性能有一些差距(能效比上仍然是Cloud AI 100更好),但是目前在推理方面,事实上机器视觉已经是一块巨大的市场,因此高通在这个领域有可能会成为强而有力的竞争者。
  如果我们细数机器视觉领域对于推理性能有较强需求的领域,首当其冲的可能就是自动和辅助驾驶领域。在自动和辅助驾驶领域,需要大量的目标检测,这就需要大量的机器视觉算力支持。高通的Cloud AI 100拥有更好的能效比和相当的性能,加上其成本预计会远远低于基于HBM2内存的A100 GPU,因此可能会与Nvidia在这个领域有激烈的竞争。自动驾驶领域拥有较高的质控和渠道壁垒,而高通作为在半导体供应链中已经有非常深厚积累的巨头,在这个领域显然要比其他做自动驾驶芯片的初创公司更有竞争力,因此可能会给这个领域带来新的市场格局。当然,在自动驾驶领域高通即使能战胜Nvidia,也不代表高通能占领整个自动驾驶市场:随着目前各大智能驾驶公司都纷纷开始自研芯片,未来自动驾驶市场中究竟是第三方芯片方案还是第一方芯片方案更是主流,仍然有待观察。
  除了智能驾驶之外,另一个重要的推理市场是智能终端,例如工业机器人和智能摄像头。这些领域对于功耗和能效比都有较强的需求。高通显然在设计芯片的时候将这些市场纳入了考虑,因此Cloud AI 100除了功耗75W,400TOPS算力的PCIe版本之外,还有功耗15W,算力70 TOPS和功耗25W,算力200 TOPS的低功耗版本,这些版本非常适合工业机器人和智能摄像头应用。而Nvidia同样针对该市场的Xavier系列芯片的能效比则远逊于Cloud AI 100,因此高通在这个领域也有优势。
  当然,高通即使能在竞争中胜过Nvidia,也未必能真正主导这个市场。人工智能推理的一大市场,即中国市场,在国际形势和国内对于半导体产业大力扶持的背景下,究竟会使用外国公司的方案,还是使用国内公司的方案,对于高通究竟能在这个市场中占有多大份额也有很大影响。
  训练市场如何战胜Nvidia
  在人工智能训练市场,从MLPerf早些公布的训练跑分结果我们可以看到,Nvidia的单卡性能仍然远远领先Graphcore,Habana等竞争对手。另外,高通似乎目前尚没有公布在这个领域的计划。然而,在分布式训练结果中,我们可以看到Nvidia的训练跑分结果和谷歌的TPU类似。分布式训练结果主要考虑如何通过大规模的分布式计算来实现训练速度的提升,它一个系统工程,需要软件、网络通讯和加速卡芯片的协同设计才能实现最佳性能。虽然Nvidia的单卡性能仍然很强,但是在训练领域,分布式训练性能事实上甚至比单卡性能更有意义,因此需要很强的系统工程能力才能实现超越。
  当然,从另一个角度来说,由于这是一个系统工程,因此如果公司在系统中的其他组件有优势的话,可以弥补芯片方面的短板。例如,谷歌的芯片部门虽然成立时间远少于Nvidia,但是凭借其在系统工程领域的深厚积累,可以在分布式训练领域实现和Nvidia接近的结果。此外,来自北大和鹏城实验室基于华为Kunpeng CPU+Ascend加速卡+mindspore软件框架的分布式训练结果也值得肯定,在自然语言处理领域,BERT训练结果的跑分华为Ascend 128卡的结果与介于64卡Nvidia A100和64卡TPU之间,而在机器视觉领域,Ascend 1024卡的结果与A100 1024卡的结果接近。因此,在可使用的芯片工艺收到限制的情况下,中国芯片公司考虑从系统工程的角度(例如,通过与该领域有深厚积累的各大IT公司合作)来实现对于Nvidia GPU在训练领域的赶超或许是一个可行的思路。
  *免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。
  今天是《半导体行业观察》为您分享的第2826内容,欢迎关注。
  晶圆|集成电路|设备|汽车芯片|存储|台积电|AI|封装

十万个为什么之为什么哺乳动物的眼睛要长在前面?为什么哺乳动物的眼睛要长在前面?哺乳动物的眼睛一般都长在头的前部,这样便于观察前方的状况,利于避开敌害或捕获食物。所以当一种动物攻击其他动物时,常常会采用在侧方或后方慢慢靠近的方式CHINC专访阿里云副总裁谢维用中台解锁智慧医院4月2325日,杭州国际博览中心人声鼎沸宾客如云,2021中华医院信息网络大会(下文简称CHINC)正热火朝天举行中。23日下午,阿里云副总裁谢维发表了精彩演讲,并在现场接受了动脉2021智慧医院创新白皮书抢先看深度解读就医痛点与六大趋势今天是520,在表达爱意的同时,你是否对自己对家人的身体健康更加关注了呢?健康,是携手相伴相爱一生的前提,而医院则承担了守护健康的重要职责。随着信息技术与卫生健康领域深度融合,智慧为什么八大菜系干不过一个炸鸡薯条?每一年的国内餐饮业排名,肯德基和麦当劳即使不在榜首,也必然在最前几位。有意思的是,这两家数十年如一日的菜谱就是炸鸡薯条这类的,做法简单,味道也说不出格外有多美味,却偏偏能把号称八大关于高考填志愿那些不能不防的大坑(一)虽然由于疫情的一再推迟,一年一度的高考还是马上就要逼近了。对于高考填志愿,有些关键的问题跟大家聊聊,希望能对考生有帮助,避免被网上一些颠三倒四的文章给误导了。1录取分数线今年由于疫史上最难毕业季,莫慌,求职来这里看看(1)这一届号称史上最难的毕业生,据统计,目前有高达70的人尚未找到合适的工作,就问你慌不慌。稳住,先过来这里看看。国内随着疫情的控制,不少行业开始复工了,但是要完全复工,可能还需要较长关于高考填志愿那些不能不防的大坑(二)1专业的选择考生在选择专业的时候,大多是很为难的,不知道该选什么。很多专业包含的内容,普通人是不容易了解的。除去少部分人对某些领域感兴趣而选择相应的专业外,大部分人选择专业更看重的浅谈中外高校之差距原因50多年前的一个除夕夜,西北大沙漠深处的一个帐篷里,邓稼先举起酒杯,对另一个人说道叫了几十年王京同志,今天叫一声王淦(gn)昌同志吧。说罢两人抱头痛哭,为了保密,他不用这个名字二十要么做第一,要么做第一个挨打的从2019年开始,到今年8月,国内报道的军事演习和实弹训练次数的密集程度,是近些年前所未有的。军演不是闹着玩的,它除了检验军事训练的成果战术的演练和磨合外,还有一层重要的意义就是展5分钟印度超简史位于南亚次大陆的印度,是一个全年气候炎热地理位置十分封闭的地方。北面横亘着喜马拉雅山脉,另一面则被印度洋包围,实际上就是亚洲大陆延伸入印度洋的一个大型半岛。只有在西北角的一个隘口,1991年关于苏联那场盛宴海洋里的鲸是一种庞然大物,每一头鲸的死去,都会是一场海洋生物的盛宴。前苏联就像海里的一条蓝鲸,1991年的圣诞节,这头巨鲸经过一番挣扎后终于轰然倒下,溅起的惊天巨浪震惊全世界。19
3年后或成世界唯一!中国空间站入轨,会拒绝美国的加入申请吗?中国航天工程的空间站项目天和号核心舱,于4月29日成功发射并入轨,接下来还要通过一系列的舱段发射和货运飞船发射,进行对接与物资运输,预计空间站将于明年正式组装完成。距离50年前,苏伊朗在美国人面前秀肌肉!无人机飞越美军航母,甲板细节一览无余据伊朗媒体报道,伊朗革命卫队近日公布了一段无人机飞越美航母时拍摄到的画面。据悉,这段视频曾在伊朗官方电视台播放,是由伊军方的无人机拍摄的,画面中可以看到美军航母甲板上部署的FA18中国使馆遭轰炸22年后,世界发生了哪些改变?美国没资格再谈实力22年前的1999年5月8日,是所有中国人最不能忘却的一个时刻。以美国为首的北约组织非法干预南联盟内部矛盾,并进行以空袭为主要形式的武装侵略活动,期间对中国驻南大使馆进行了轰炸,造历史同美国开玩笑!新战舰被迫大改,否则难以在中国海军面前存活在高超音速武器领域,美国的起步虽早,但进度和成果却谈不上理想,如今总算才有了点开花结果的苗头。美国海军近日表示,将在2025年为新型驱逐舰加装高超音速武器,这型军舰就是朱姆沃尔特级能追上我们吗?中国FC31首飞9年后,俄终于开始研发第二款五代机时至今日,美国是全球唯一同时列装了两款第五代战斗机的国家,分别是F22和F35,形成了高低搭配,显示出美国军工业领域的非凡实力。相比之下,中国在公开歼20隐身战机后,第二款隐身战机在东风系列面前束手无策?美军反导测试失败,连普通导弹都拦不住反导拦截一直是美军的强项,但其也并非每次都能那么如意。美国军方表示,舰载宙斯盾弹道导弹防御系统进行了一次中程导弹拦截测试,但是目标靶弹并未被成功拦截,测试失败。此次失败的标准6DuFF上市即破发,恒大汽车趁机大赚一笔,贾跃亭的造车之路依然坎坷提起FF相信很多人都不会知道,但是熟悉贾跃亭这个人的肯定不会陌生,这家企业成立于2014年,当时还是乐视董事长的贾跃亭和莲花中国区高管聂天心前特斯拉高管尼克桑普森惺惺相惜,一起在美17国申请使用中国空间站俄罗斯获单间,老美被拒绝人类第一座空间站是由老美和俄罗斯共同主导,共有16个国家参与。虽然说是号称国际,但当时我国明确要加入国际空间站合作的时候,却被拥有主导地位的老美出于一些原因给拒绝了。美名其曰是出于方向不对?芯片产业的布局,也有问题因为老美的制裁封锁,我国掀起了一股的芯片热潮。一时间大街小巷和网络上,大家都在谈论芯片的事情。现在,似乎随便一个网友都知道5nm7nm每一个网友都在高呼着我们要追上顶尖芯片制程,要长江储存刺痛三星?三星罕见在华豪掷1200亿抢市场近些年我国产业在不断地升级转型从低端走向了高端,从上游产业走向了下游产业。我们应该认识到,这其实是当社会发展到一定水平就会出现的变化。其背后显示的损失我国综合实力在不断上升,人民的京东方的产品不合格?苹果为什么选三星和LG?在华为走下坡路之后,苹果就成为了高端市场的霸主。不过,现在的华为因为发布了鸿蒙,在手机市场的热度还是高居不下。虽然市场份额已经和苹果没有办法比了,但是华为一直没有放弃。因为华为和苹