范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

高端GPU芯片英伟达的独角戏?

  高端GPU作为通用计算的"加速神器",日渐成为大型数据中心、人工智能、超算等领域的刚需。长期以来,英伟达在高端GPU市场占据主导地位,市场占有率一度超过90%。目前来看,国内企业突破英伟达等国外公司的垄断仍然任重道远,但国内基于架构创新的DSA(特定领域架构,即针对特定领域的可编程处理器)芯片产品日渐丰富,可能会带来一些曙光。
  高端GPU与传统GPU"泾渭分明"
  20世纪90年代,Play Station等游戏主机的发布和彩色显示器的出现,催生了3D游戏的萌芽。而彼时的3D制作主要依靠计算机的CPU执行,计算任务需要串行排队,难以满足游戏画质的提升需求。英伟达的GeForce 256,将"GPU"概念推向市场。自此,光线追踪等图形图像处理任务有了专用芯片承载,在提升3D画质的同时,也提升了计算机的整体效能。
  随着超算等高并发性计算需求不断增长,GPU用于计算任务的可能性受到业界关注。英伟达首席科学家David Kirk认为,GPU的浮点运算和并行计算能力不应该局限于图像渲染。在他的倡导下,英伟达以推动GPU从专用计算芯片走向通用计算处理器为目标,推出了GPGPU(即通用GPU),并于2006年发布并行编程模型CUDA。GPGPU与CUDA组成的软硬件底座,构成了英伟达引领AI计算的根基。
  由于GPGPU专注高性能算力,也常常被业界和市场称为"高端GPU",并发展出与传统GPU"泾渭分明"的应用路径。燧原科技产品市场部总监陈超向《中国电子报》记者指出,传统GPU聚焦图像学,关注帧数、渲染逼真度、对于真实场景的映射程度等指标,主要用于运行游戏、专业图像处理、加密货币处理等场景。而高端GPU是用于计算加速的芯片产品,专注于基础科学等超算领域和训练、推理等大规模人工智能计算场景。
  2022年第二季度独立GPU市场(包括AIB 合作伙伴显卡)份额
  来源:Jon Peddie Research
  "高端GPU不涉及消费级GPU的场景,纯粹用于计算加速。高端GPU早期用于超算等高性能计算场景,真正的蓬勃兴起并大规模产生一些商业行为,是在人工智能迅猛发展产生了强有力的算力需求之后,GPU被大量应用于人工智能场景,特别是人工智能训练。"陈超向记者指出。
  目标不同则指标不同,高端GPU有着与传统GPU不同的关注点。昆仑芯科技CEO业务助理宋春晓向《中国电子报》表示,衡量高端GPU的主要维度是通用性、易用性和高性能。通用性指硬件架构要有足够的灵活性,以适应人工智能不断迭代变化的算法和场景。易用性是指较低的开发门槛,让开发者更容易上手,结合实际场景进行定制化的开发。高性能指芯片产品的基础性能和性价比要对标国际先进水平,才能进行市场开拓。
  算力大小往往是市场对GPU性能优劣的"第一印象"。但高端GPU的性能不等于纸面性能,尤其不能以单一性能的纸面数据来衡量。
  "在实际使用的过程中,GPU的通用性、易用性、实际性的重要程度远大于纸面标出的算力这一单一性能。纸面指标标得再高,也要关注内存和带宽够不够,以及芯片之间的互联等问题解决得好不好。用单一性能来衡量GPU是否高端,是一个常见的误区。"宋春晓说。
  硬件性能最终要通过软件接口被开发者感知和使用。芯动科技GPU项目总监何颖对《中国电子报》记者表示,高端GPU设计的算力,需要专门优化过的驱动和加速库。只有软硬协同,才能把高端GPU的算力真正应用到实际场景中。
  高性能计算将是主要"竞技场"
  长期以来,英伟达在高端GPU市场占据主导地位,市场占有率一度超过90%,在人工智能计算领域尤其具备垄断性优势。迄今为止,英伟达推出了面向高性能计算和AI训练的Volta、Ampere、Hopper等架构,并以此为基础推出了V100、A100、H100等高端GPU,面向向量的双精度浮点算力从7.8 TFLOPS一路来到30 TFLOPS。
  市场优势的建立,归功于英伟达GPU产品能力的均衡和生态的完善。
  "英伟达在通用性、易用性和高性能三个方面做得比较均衡,加上英伟达在每一代架构上都有所创新,为软件承接大模型训练和推理场景的人工智能计算提供了持续提升的硬件基础。"宋春晓说。
  "人工智能对于生态的要求非常高,涉及框架、应用、模型的适配等,英伟达率先基于CUDA生态将上下游打通,对于下游的算法开发商和服务商来说,它的GPU在性能具备优势的同时还保持了易用性。"陈超表示。
  作为全球第二大独立GPU供应商,AMD虽在高端GPU的整体份额与英伟达存在差距,却在超算领域闯出了一片天。在最新全球超算TOP500榜单上,世界上最快的超级计算机橡树岭国家实验室(ORNL)Frontier、世界排名第三的超级计算机LUMI,都采用了AMD EPYC处理器和AMD Instinct MI250X GPU加速器。
  AMD在超算领域的亮眼表现,是建立在针对性的软硬件设计上,基于CDNA 2架构的GPU加速器、ROCm软件平台与开源应用程序资源中心AMD Infinity Hub的组合,构成了对于科研人员更加友好的硬件性能和编程环境。
  "超算涉及许多科研探索性质的计算任务,AMD开源的软件格局为科学家探索新的计算方式提供了更多可能和便利。"陈超表示。
  "AMD针对架构和适用场景做了更细分的设计,使GPU产品能够更多地应用于科学计算场景,因为他们的双精度做得比较好。"宋春晓表示。
  但高性能计算和AI计算并不能与GPU划等号。陈超指出,高性能及AI计算本质上具有四项基本要求。一是高精度,尤其高性能计算对于FP64双精度浮点有着较高的需求;二是高性能,以满足面向超大数据量的信息处理要求;三是并发计算,大大缩短信息处理全流程延时;四是软件易用性,能支撑更广泛的应用场景,且易于编程和开发。
  "虽然直接采用GPU进行高性能或AI计算较为便利,但上层应用降本增效的核心诉求对底层算力提出了更高要求,国外AI创企推出的AI芯片往往基于全新的架构,对并行计算能力进行全面提升和重点优化。国内相关的AI芯片领先企业同样推出了一系列基于DSA架构的人工智能计算芯片,也是出于同样的考虑。"陈超说。
  燧原科技在世界人工智能大会的展台
  在国内市场,基于架构创新的DSA芯片产品日渐丰富。例如华为面向AI计算特征的自研架构达芬奇,昆仑芯科技推出的一代架构"XPU-K"和二代架构"XPU-R",燧原科技的自研架构"GCU-CARA"已进入规模落地期。随着AI计算的应用场景越来越细分和复杂,定制化、异构化的DSA有望在下一代计算平台中发挥更大效用。
  架构和软件是攻克高端GPU的核心要素
  无论是高端GPU,还是同样以优化并行计算效率为核心的各类DSA芯片,都有着技术、人才、资金密集的特征,研发难度不容小觑。
  在采访中,三位受访者均表示,架构设计是攻克高端GPU的核心要素。
  百度昆仑芯产品
  架构设计具体难在哪里?首先是各项能力的均衡性。宋春晓表示,架构设计的通用性、易用性和高性能构成了"不可能三角"。如果优先保障通用性,兼顾各个场景,就难以在某一个场景进行足够的定制化以提供更高性能。如果找到了一种兼顾通用性和高性能的路径,将是一个跨度较大的架构创新,生态上要推倒重来,易用性会受到很大影响。
  "在架构设计过程中,一方面注重有哪些巧思能够在这个‘不可能三角’中尽可能达到平衡;另一方面也要充分理解市场、客户的需求,比如客户在什么情况下,能够在通用性、易用性、高性能的哪一点去做到什么程度的取舍。了解这些情况之后,才能设计出合理、均衡、契合需求的架构。"宋春晓告诉记者。
  其次是指令集设计。"指令集是硬件的灵魂。指令集的多与少、高效与否,对于芯片架构以及微架构有着重大影响。如果指令集设计巧妙,芯片架构会更加高效,客户做开发时也能在应用、开发效率、性能、成本方面获得较为均衡的支持。"陈超说。
  此外,架构设计对于芯片企业在产业链理解能力和技术积累上提出了更高要求。
  "硬件架构层面上,高端GPU的构成极其复杂,涉及先进工艺层面的超大规模集成电路设计。头部公司积累了大量专利,对后来者构筑了极高的技术壁垒。"何颖说。
  高端GPU的另一个门槛是软件生态。可以说,软件决定了GPU生态的能力上限,也是硬件能力充分释放和灵活调度的必要条件。
  "高端GPU需要厂商提供高度优化的驱动,以及各种加速库和相关的文档,以支持用户纷繁复杂的使用场景。此外,终端用户需要厂商提供功能强大的工具以辅助问题诊断和性能调优。"何颖表示。据悉,芯动科技推出的风华系列GPU已经兼容了OpenGL4.3,并支持微软Windows10 DirectX图形框架。
  在完成硬件设计和软件栈构建的基础上,还要考虑芯片的工程实现。陈超表示,高端计算芯片对于算力性能的要求非常极致,往往会用到最先进的工艺和封装技术,运行时钟的频率也非常高,需要考虑功耗对于环境和运行可靠性的影响。同时,也要考虑芯片的生产良率。
  "良率直接影响高端GPU的成本,这个成本会最终体现到消费端,影响算力成本的高与低。所以良率是高端GPU工业化、商业化落地中非常重要的因素。"陈超说。
  除了产业链环节本身,人才作为研发的生力军,也是高端GPU研发水平的决定性因素。
  "国内专业对口人才相对稀缺,需要在2~3年甚至更长的培养时间里,有持续投入和资金支持。我们非常注重国内外人才的积累,以保障研发基础和创新迭代的能力,同时也有利于新生代的培养,进一步夯实人才基础。"何颖说。
  作者丨张心怡
  编辑丨陈炳欣
  美编丨马利亚
  监制丨连晓东

专家点名表扬阿里,比谷歌还大30?外媒低估了中企的决心近几年,中国科技企业发展速度惊人,不仅缩小了和欧美企业之间的差距,甚至在某些领域实现了弯道超车,比如5G云计算人工智能等等。但正因为如此,不少中国科技企业遭到了老美的打压和制裁,比足坛刺激一夜!2大豪门爆冷,2大豪门逆转拒绝冷门,皇马继续全胜202223赛季欧冠联赛继续进行,在E组至H组第2轮小组赛的比赛中,各在豪门齐登场,几家欢喜几家愁。由于年底卡塔尔世界杯赛将举办,5大联赛和欧冠联赛的赛程被迫中断并变得密集,对各大足不出户带你走进千年古镇系列无终洞京视网手机台河北频道讯(通讯员齐芳)铁厂镇位于遵化市东南部,东邻迁西,南接丰润,距城区70华里,是个边远山区镇,全镇总面积76。8平方公里,全镇辖20个行政村。铁厂村位置在遵化市的广西梧州明日起开放景区景点等非封闭公共场所,恢复公交运营来源梧州发布关于有序恢复社会生活秩序进一步做好疫情防控工作的通告(第4号)2022年9月8日以来,我市已连续6天区域核酸检测无社会面阳性感染者。为科学精准落实疫情防控措施,高效统筹柳州市周边的一些景点各景点位置如果是到柳州市区,可以参观柳州博物馆柳州工业博物馆白莲洞古人类遗址博物馆龙潭公园。晚上逛逛窑埠古镇(仿古建筑)看看江边的喷泉或者爬马鞍山看夜景,(以上景点都是免门票的)。夜市的街头,有女孩问你要不要生菜时,这是什么服务呢?随着经济全球化加速,各国之间的距离越来越近,也促进了出国旅行的发展。比如我国游客,经常到东南亚地区旅行。(此处已添加小程序,请到今日头条客户端查看)像距离我国较近的泰国,越南,缅甸世界公认的美女窝,为何我国男性很少去?网友想去又不敢俄罗斯有很多美女,她们有着很明显的欧洲人的特点,比如说眼窝深邃,鼻梁高挺,下颌瘦削,这些都让她们的五官非常的立体。(此处已添加小程序,请到今日头条客户端查看)而且她们的皮肤很白皙,遛娃版北京秋游路线Top10时间过得真快,2022的十一假期又快要到了!遛娃族们刚把娃送进校门没两天,又要盘算十一假期的行程啦,会不会有点儿措手不及?好在,咱大北京给力,北京市文化和旅游局刚刚发布了10条漫步一代传奇疤面疤面,是马赛马拉最受欢迎的一头雄狮,也是保护区最吸引游客的景点。疤面的绰号来源于2012年的一次战斗。当时疤面在同其他雄狮战斗中被打伤了眼睛,因此而得名。它独特的脸部特征,也成了它共享单车运营区域已扩大至北京全市所有行政区共享单车自2016年进入北京,至今已有6个年头。记者从市交通委获悉,共享单车运营区域已由原来的五环内逐渐扩大至全市所有行政区,形成了1N的服务格局。截至2022年8月底,全市范围内多地连锁便利店开通24小时外卖服务,带动夜间订单迅速增长外卖不止能点餐饮正在成为越来越多消费者的共识,由此催生的大规模万物到家需求,也推动各地商超便利店开拓了新的增长路径。近日,武汉62家美宜佳便利店宣布加入美团外卖24小时便利店项目,
中国新能源汽车市场将成为全球最具活力和潜力的市场2023年2月,中国新能源汽车市场表现强劲。许多新能源汽车品牌在这个月份公布了他们的销售数字,下面将分析这些数字,并讨论中国新能源汽车市场的趋势。首先,让我们来看看各品牌的表现。广多项数据创新高,光伏产业发展火热,粤港澳大湾区有何优势?南都讯作为一种清洁绿色环保的可再生能源,光伏具备资源充裕安全可靠无噪声不受资源分布地域限制等优点。绿色低碳发展背景下,光伏成为新能源中增长较快的赛道。国家能源局日前发布数据显示,2新基遇华夏基金莫一帆公募REITs稳健适宜长期持有今年是我国疫情防控政策优化后的首年,伴随着经济复苏的基本面,兔年春节后股市债市均迎来开门红,基民搞钱的心已跃跃欲试,但经历了过去两年的股市调整及去年底债市的大幅震荡,该投什么基金?2023年社保上调养老金,企退低于3000元的老人,增长15可行吗?今天看到有网友问,2023年社保上调养老金的时候,养老金低于3000元工龄满30年的企业退休人员,养老金上涨15。行不行?说实话,对于能够受益的人们来说,肯定是可行的,大力支持。对德国已基本填补俄气缺口新华社北京3月5日电德国能源监管机构联邦网络局的数据显示,德国加大从挪威等国进口天然气后,已基本实现对俄罗斯天然气的进口替代。2月1日,人们从德国柏林的一家商场走过。新华社发(斯特12世纪末13世纪初,欧洲储蓄银行出现,金融市场迈出的关键性步伐西欧从14世纪进入了货币经济时代,商品便与金融成为了市场经济的孪生兄弟。金融市场的含义是资金融通的场所,包括货币市场债券市场和股票市场,主要是通过资金价格利率来筹集集资金,将经济存光大银行高管逃逸式辞职,落马后被禁业11年监管机构的一则处罚公告,让光大银行高管逃逸式辞职有了下文。2023年2月21日,河南银保监局发布的处罚公告显示,时任光大银行郑州分行行长崔敏奎被禁业11年。崔敏奎是光大银行郑州分行全球首艘油电混动客滚船顺利出口广州海关消息,3月3日,我国制造的全球首艘油电混动客滚船PIONEER(先驱者)号在广州南沙口岸办结海关通关手续,顺利出口英国。该船将用于英国多佛港和法国加莱港之间的客货运运营。全1岁婴儿近视600度!原因出在父母身上近日父母高度近视1岁婴儿近视600度话题在热搜上引起广泛关注01。1岁婴儿近视600度此前,郑州慕女士在带1岁儿子做视力检查时发现,孩子眼睛的度数竟分别为600度和650度。慕女士卖爆1000万单!网红辛巴感动落泪扛起500亿的公司不容易近几年随着互联网行业的发展,直播带货互联网上掀起了一股浪潮,高收入已经成了直播带货这一行业的代名词。而拥有庞大粉丝群体的网红主播们,借着这一机会,也是实现了财富自由。网红主播买豪车失眠的原因及解决办法新近发生的失眠常由当时的这种焦虑所致,如都夫妻争吵人事关系工作问题以及矛盾冲突的内疚,对自身健康的关注和担忧等。如果没有这些心理或情绪方面的问题,就应该考虑具体疾病的原因。多数短暂