范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

高端GPU芯片英伟达的独角戏?

  高端GPU作为通用计算的"加速神器",日渐成为大型数据中心、人工智能、超算等领域的刚需。长期以来,英伟达在高端GPU市场占据主导地位,市场占有率一度超过90%。目前来看,国内企业突破英伟达等国外公司的垄断仍然任重道远,但国内基于架构创新的DSA(特定领域架构,即针对特定领域的可编程处理器)芯片产品日渐丰富,可能会带来一些曙光。
  高端GPU与传统GPU"泾渭分明"
  20世纪90年代,Play Station等游戏主机的发布和彩色显示器的出现,催生了3D游戏的萌芽。而彼时的3D制作主要依靠计算机的CPU执行,计算任务需要串行排队,难以满足游戏画质的提升需求。英伟达的GeForce 256,将"GPU"概念推向市场。自此,光线追踪等图形图像处理任务有了专用芯片承载,在提升3D画质的同时,也提升了计算机的整体效能。
  随着超算等高并发性计算需求不断增长,GPU用于计算任务的可能性受到业界关注。英伟达首席科学家David Kirk认为,GPU的浮点运算和并行计算能力不应该局限于图像渲染。在他的倡导下,英伟达以推动GPU从专用计算芯片走向通用计算处理器为目标,推出了GPGPU(即通用GPU),并于2006年发布并行编程模型CUDA。GPGPU与CUDA组成的软硬件底座,构成了英伟达引领AI计算的根基。
  由于GPGPU专注高性能算力,也常常被业界和市场称为"高端GPU",并发展出与传统GPU"泾渭分明"的应用路径。燧原科技产品市场部总监陈超向《中国电子报》记者指出,传统GPU聚焦图像学,关注帧数、渲染逼真度、对于真实场景的映射程度等指标,主要用于运行游戏、专业图像处理、加密货币处理等场景。而高端GPU是用于计算加速的芯片产品,专注于基础科学等超算领域和训练、推理等大规模人工智能计算场景。
  2022年第二季度独立GPU市场(包括AIB 合作伙伴显卡)份额
  来源:Jon Peddie Research
  "高端GPU不涉及消费级GPU的场景,纯粹用于计算加速。高端GPU早期用于超算等高性能计算场景,真正的蓬勃兴起并大规模产生一些商业行为,是在人工智能迅猛发展产生了强有力的算力需求之后,GPU被大量应用于人工智能场景,特别是人工智能训练。"陈超向记者指出。
  目标不同则指标不同,高端GPU有着与传统GPU不同的关注点。昆仑芯科技CEO业务助理宋春晓向《中国电子报》表示,衡量高端GPU的主要维度是通用性、易用性和高性能。通用性指硬件架构要有足够的灵活性,以适应人工智能不断迭代变化的算法和场景。易用性是指较低的开发门槛,让开发者更容易上手,结合实际场景进行定制化的开发。高性能指芯片产品的基础性能和性价比要对标国际先进水平,才能进行市场开拓。
  算力大小往往是市场对GPU性能优劣的"第一印象"。但高端GPU的性能不等于纸面性能,尤其不能以单一性能的纸面数据来衡量。
  "在实际使用的过程中,GPU的通用性、易用性、实际性的重要程度远大于纸面标出的算力这一单一性能。纸面指标标得再高,也要关注内存和带宽够不够,以及芯片之间的互联等问题解决得好不好。用单一性能来衡量GPU是否高端,是一个常见的误区。"宋春晓说。
  硬件性能最终要通过软件接口被开发者感知和使用。芯动科技GPU项目总监何颖对《中国电子报》记者表示,高端GPU设计的算力,需要专门优化过的驱动和加速库。只有软硬协同,才能把高端GPU的算力真正应用到实际场景中。
  高性能计算将是主要"竞技场"
  长期以来,英伟达在高端GPU市场占据主导地位,市场占有率一度超过90%,在人工智能计算领域尤其具备垄断性优势。迄今为止,英伟达推出了面向高性能计算和AI训练的Volta、Ampere、Hopper等架构,并以此为基础推出了V100、A100、H100等高端GPU,面向向量的双精度浮点算力从7.8 TFLOPS一路来到30 TFLOPS。
  市场优势的建立,归功于英伟达GPU产品能力的均衡和生态的完善。
  "英伟达在通用性、易用性和高性能三个方面做得比较均衡,加上英伟达在每一代架构上都有所创新,为软件承接大模型训练和推理场景的人工智能计算提供了持续提升的硬件基础。"宋春晓说。
  "人工智能对于生态的要求非常高,涉及框架、应用、模型的适配等,英伟达率先基于CUDA生态将上下游打通,对于下游的算法开发商和服务商来说,它的GPU在性能具备优势的同时还保持了易用性。"陈超表示。
  作为全球第二大独立GPU供应商,AMD虽在高端GPU的整体份额与英伟达存在差距,却在超算领域闯出了一片天。在最新全球超算TOP500榜单上,世界上最快的超级计算机橡树岭国家实验室(ORNL)Frontier、世界排名第三的超级计算机LUMI,都采用了AMD EPYC处理器和AMD Instinct MI250X GPU加速器。
  AMD在超算领域的亮眼表现,是建立在针对性的软硬件设计上,基于CDNA 2架构的GPU加速器、ROCm软件平台与开源应用程序资源中心AMD Infinity Hub的组合,构成了对于科研人员更加友好的硬件性能和编程环境。
  "超算涉及许多科研探索性质的计算任务,AMD开源的软件格局为科学家探索新的计算方式提供了更多可能和便利。"陈超表示。
  "AMD针对架构和适用场景做了更细分的设计,使GPU产品能够更多地应用于科学计算场景,因为他们的双精度做得比较好。"宋春晓表示。
  但高性能计算和AI计算并不能与GPU划等号。陈超指出,高性能及AI计算本质上具有四项基本要求。一是高精度,尤其高性能计算对于FP64双精度浮点有着较高的需求;二是高性能,以满足面向超大数据量的信息处理要求;三是并发计算,大大缩短信息处理全流程延时;四是软件易用性,能支撑更广泛的应用场景,且易于编程和开发。
  "虽然直接采用GPU进行高性能或AI计算较为便利,但上层应用降本增效的核心诉求对底层算力提出了更高要求,国外AI创企推出的AI芯片往往基于全新的架构,对并行计算能力进行全面提升和重点优化。国内相关的AI芯片领先企业同样推出了一系列基于DSA架构的人工智能计算芯片,也是出于同样的考虑。"陈超说。
  燧原科技在世界人工智能大会的展台
  在国内市场,基于架构创新的DSA芯片产品日渐丰富。例如华为面向AI计算特征的自研架构达芬奇,昆仑芯科技推出的一代架构"XPU-K"和二代架构"XPU-R",燧原科技的自研架构"GCU-CARA"已进入规模落地期。随着AI计算的应用场景越来越细分和复杂,定制化、异构化的DSA有望在下一代计算平台中发挥更大效用。
  架构和软件是攻克高端GPU的核心要素
  无论是高端GPU,还是同样以优化并行计算效率为核心的各类DSA芯片,都有着技术、人才、资金密集的特征,研发难度不容小觑。
  在采访中,三位受访者均表示,架构设计是攻克高端GPU的核心要素。
  百度昆仑芯产品
  架构设计具体难在哪里?首先是各项能力的均衡性。宋春晓表示,架构设计的通用性、易用性和高性能构成了"不可能三角"。如果优先保障通用性,兼顾各个场景,就难以在某一个场景进行足够的定制化以提供更高性能。如果找到了一种兼顾通用性和高性能的路径,将是一个跨度较大的架构创新,生态上要推倒重来,易用性会受到很大影响。
  "在架构设计过程中,一方面注重有哪些巧思能够在这个‘不可能三角’中尽可能达到平衡;另一方面也要充分理解市场、客户的需求,比如客户在什么情况下,能够在通用性、易用性、高性能的哪一点去做到什么程度的取舍。了解这些情况之后,才能设计出合理、均衡、契合需求的架构。"宋春晓告诉记者。
  其次是指令集设计。"指令集是硬件的灵魂。指令集的多与少、高效与否,对于芯片架构以及微架构有着重大影响。如果指令集设计巧妙,芯片架构会更加高效,客户做开发时也能在应用、开发效率、性能、成本方面获得较为均衡的支持。"陈超说。
  此外,架构设计对于芯片企业在产业链理解能力和技术积累上提出了更高要求。
  "硬件架构层面上,高端GPU的构成极其复杂,涉及先进工艺层面的超大规模集成电路设计。头部公司积累了大量专利,对后来者构筑了极高的技术壁垒。"何颖说。
  高端GPU的另一个门槛是软件生态。可以说,软件决定了GPU生态的能力上限,也是硬件能力充分释放和灵活调度的必要条件。
  "高端GPU需要厂商提供高度优化的驱动,以及各种加速库和相关的文档,以支持用户纷繁复杂的使用场景。此外,终端用户需要厂商提供功能强大的工具以辅助问题诊断和性能调优。"何颖表示。据悉,芯动科技推出的风华系列GPU已经兼容了OpenGL4.3,并支持微软Windows10 DirectX图形框架。
  在完成硬件设计和软件栈构建的基础上,还要考虑芯片的工程实现。陈超表示,高端计算芯片对于算力性能的要求非常极致,往往会用到最先进的工艺和封装技术,运行时钟的频率也非常高,需要考虑功耗对于环境和运行可靠性的影响。同时,也要考虑芯片的生产良率。
  "良率直接影响高端GPU的成本,这个成本会最终体现到消费端,影响算力成本的高与低。所以良率是高端GPU工业化、商业化落地中非常重要的因素。"陈超说。
  除了产业链环节本身,人才作为研发的生力军,也是高端GPU研发水平的决定性因素。
  "国内专业对口人才相对稀缺,需要在2~3年甚至更长的培养时间里,有持续投入和资金支持。我们非常注重国内外人才的积累,以保障研发基础和创新迭代的能力,同时也有利于新生代的培养,进一步夯实人才基础。"何颖说。
  作者丨张心怡
  编辑丨陈炳欣
  美编丨马利亚
  监制丨连晓东

风尘四侠各自手握最难破纪录,若按难易程度该怎么排序?风尘四侠包括已经退役的韦德,现在都已是功成名遂,这四人在NBA打了那么多年,又都曾是球队的老大,在这样的环境下,必然创造了很多纪录,接下来就选出他们各自手握的最难破的纪录,并按其难三少人均20,鹈鹕大胜篮网!杜兰特空砍32分,西蒙斯六犯离场北京时间10月20日,多支球队迎来了新赛季的第一场常规赛,争取拿到新赛季的开门红。这不?篮网队主场迎战对手鹈鹕队,打响了球队在2223赛季常规赛的第一枪,以及验证球队是否具备足够强2795!超越詹姆斯成历史第3,细数NBA首战就表现惊艳的4位状元NBA新赛季的比赛,在今天已经是全面打响,有了揭幕日两场精彩对决的引导下,今天的比赛同样是精彩纷呈。如果问讨论度最高的比赛,那一定会是魔术和活塞的对决,两支队伍尽管是联盟的吊车尾,是时候动手了就在一个星期前,很多人可能就一个想法拔网线,卸载APP,销掉股票账户把钱还我,再也不玩啦现在可能又有了新想法其实,市场还是那个市场,国家也还是那个国家。当你的心里有很多恐惧,有很多限购取消2个月了,燕郊楼市到底有没有反弹?这些年我们的房地产市场非常火爆,因为大家发现了商品房保值增值的属性,在城市化的推动下,几亿农村人口向城市迁徙,给城市住房带来了很大的需求,这让不少人看到了楼市的投资商机,纷纷涌入到中共二十大为世界经济变局扮演常量(中共二十大观察)中共二十大为世界经济变局扮演常量中新社北京10月19日电题中共二十大为世界经济变局扮演常量中新社记者李晓喻当百年变局叠加世纪疫情,中国经济世界经济都面临剧烈变革。A股反弹遇阻,我选择躺平在大盘持续两天收跌沪深两市主力资金连续三日净流出后,可能有些小伙伴会不淡定了。数据来源Wind反弹会戛然而止吗?小通无法判断,不过一两根阴线或难改大趋势。在看不清未来时,或可考虑躺香港慌了,开始加入抢人大战2022年,新加坡成为淘金圣地,越来越多的人涌入这里。其中有不少是香港人。在香港从事金融行业的张同学,今年决心要换个环境工作,从三四月份开始找工作,六七月左右收到offer,8月底瑞士9月手表出口猛增,全年总出口额或创历史新高瑞士钟表业联合会10月20日发布声明称,今年9月瑞士手表出口额飙升19。1至22亿瑞士法郎(约合22亿美元),是有史以来表现最好的月份之一。今年前9个月手表出口额达到181亿法郎,没有科技与狠活,汇源果汁意外翻红告别朱新礼请易烊千玺代言,汇源果汁还能逆境翻身吗?文中国企业家记者李艳艳编辑周春林头图来源汇源果汁官网截图谁能想到,时下最火的海克斯科技,竟让这家沉寂已久的无添加老品牌摸到了流量电双11大促新玩法长虹美菱创新营销破圈家电市场一年一度的双11来啦从简单粗暴补贴折扣,到精耕细作的运营,长虹美菱本次双11力图通过变革,打破传统营销操作的藩篱,变被动跟随为主动出击,实现在双11市场的突围。长虹美菱作为
组图游园市集赏灯海口推出系列活动花式闹元宵新海南客户端南海网南国都市报2月5日消息(记者陈卫东)2月5日是中国传统佳节元宵节,海口进入游园闹元宵模式,万绿园中心草坪,市民游客在花灯前驻足欣赏拍摄,亲朋好友相聚一起共度佳节。这些画面几乎全部预演过!更多细节近日,电影流浪地球2正在热映,影片探索融入工业电影的制作理念,从生产流程上大胆创新,大量运用新技术提升影片质量。一起看幕后故事邀请20余位科学家组成顾问团队用科学推演让电影剧情形成领取养老金资格认证在家就能办本周提醒来了!国务院提醒每周知,便民TIPS望周知!业务办理提醒事关领取养老金资格认证!在家就能办目前,各地正在有序开展2023年领取养老保险待遇资格认证工作。与往年一样,参保人员可在上次认证后挖角营销老将,就能治好WEY的内伤?作者赵文华春节刚过,车圈就来了一场高管大挪移原领克汽车副总经理陈思英北上保定,担任WEY品牌CEO兼坦克品牌营销总经理,于2022年7月离开曾被称为长城二号人物王凤英则南下出任小鹏A股各板科创成色如何?科创板上市公司是近年中国企业科创大潮中的新锐力量。(人民视觉图)提及科创,多数人第一时间想起科创板。科创板企业的科创力,一定更强吗?中国国家统计局披露,2021年,中国共投入研究与(新春走基层)皖南古村展现新春活力新春里,位于安徽省黄山市黟县的世界遗产地宏村迎来众多游客,人们逛祠堂赏民俗品咖啡,旅游经济夜间经济小店经济在这座皖南古村相互融合,激发了消费活力。2月5日,游客在宏村拍照游玩。新华陈家沟记忆(七)如今的陈家沟已变了模样,温县正在建设全域旅游,陈家沟太极拳文化旅游区是核心区域。太极拳也被列为世界文化遗产。中国太极博物馆国家体育旅游示范基地中国体育旅游精品项目,陈家沟也被评为全古人养生之道之张仲景张仲景(约公元150154年约公元215219年),名机,字仲景,南阳涅阳县(今河南省邓州市穰东镇张寨村)人。东汉末年医学家,被后人尊称为医圣。张仲景广泛收集医方,写出了传世巨著伤抑郁症服药的3个误区大家好,我是精神科医生晗静。抑郁症临床最常用的是药物治疗,常用的5种药物,也就是我们常说的五朵金花,分别是氟西汀帕罗西汀舍曲林氟伏沙明以及西酞普兰。我总结了我的抑郁症患者共有的3个过年期间吃的太好了,想要养养生,怎么办!这几天刚过完年,过年期间肯定少不了大吃大喝了,喝酒吃肉熬夜抽烟,这些对身体不太友好的事情肯定做了很多!刚过完年,大家也开始陆陆续续的上班了,有的公司休的时间长,有的只休几天,想我们春三月,夜卧早起春天来了!顺时养生是中医养生的一大原则,按四季特点,春生夏长秋收冬藏按自然界属性,春属木,与肝相应。除了咬春(吃萝卜)吃春饼,春季养生的重中之重就是养肝!如果肝脏代谢不正常,人体所