范文健康探索娱乐情感热点
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

1000亿晶体管!IntelXeHPC顶级计算卡秀肌肉

  我们知道,Intel Xe GPU架构分为四个层级,或者说四种微架构,其中以上是的Xe LP低功耗版仅供核显、入门独显,即将到来的Xe HPG高性能图形版面向中高端游戏显卡,Xe HP高性能版适合加速计算、AI、ML等但所知最少,  Xe HPC高性能计算版则是最顶级的存在,主攻大型数据中心、超算。
  Xe HPG微架构的Alchmest(DG2)之前已经聊过了 ,这里来看看Xe HPC和首款产品Ponte Vecchio,竞争对手是NVIDIA A系列、AMD Instinct系列。
  当然,它们距离普通人非常非常遥远,但却是技术实力的最高体现。
  Xe HPC架构的基础也是Xe核心(Xe Core)   ,但因为面向的是计算而非图形,内部结构有所不同,包括8个512-bit矢量引擎、8个4096-bit矩阵引擎,数量对比Xe HPG都减半,但位宽分别翻了一倍、两倍,算力更凶猛。
  矢量引擎每时钟周期可执行256个FP32、256个FP64、512个FP16等数据操作,矩阵引擎则每时钟周期支持2048个FP32、4096个FP64、4096个BF16、8192个INT8。
  与矢量引擎、矩阵引擎搭档的,是一个  更宽的宽加载/存储单元  ,每个时钟周期取回512字节数据。
  每个Xe核心集成512KB一级数据缓存,这是目前业内最大的  ,而且可以通过软件配置作为暂存区使用,又称共享内部显存。
  Xe核心的上一层级叫做“切片”(Slice)    ,不同于Xe HPG上的渲染器切片(Slice),毕竟一个是做计算,一个是做图形渲染。
  Xe HPC每个切片集成多达16个Xe核心  ,四倍于Xe HPG渲染切片的规模,同时还有  8MB一级缓存、16个光追单元、一个硬件上下文(Hardware Context)单元  ,其中光追支持光线遍历、边界框相交、三角形相交,提供固定函数计算。
  硬件上下文单元大家可能比较陌生,它能让GPU同时执行多个应用,而无需昂贵的基于软件的文本切换。
  切片的上一级则是“堆栈”(Stack),至此才算一个完整的GPU。
  一个堆栈包含4个切片,因此总计64个Xe核心、64个光追单元、4个硬件上下文。
  同时,堆栈内还有  大规模二级缓存、4个HBM2e内存控制器、1个媒体引擎、8个Xe链路  ,以及拷贝引擎、PCle控制器。
  Xe HPC架构是可以轻松扩展的,  支持多堆栈设计,属于业内首创,依靠的是EMIB封装和堆栈间互连通道  ,可保持堆栈之间的内存一致性。
  比如  这是双堆栈,整体规模直接翻番  ,它就是后边要说的首款Ponte Vecchio,但看架构图,似乎不支持四堆栈。
  不同的Xe HPC GPU之间通过Xe链路互连,支持最多8颗并行  ,算力直接暴力乘以8。
  Ponte Vecchio作为基于Xe HPC架构的首款产品,一切的一切都是全新的,包括验证方法、软件、可靠性方法、信号完整性机制、互连、供电、封装、I/O架构、内存架构、IP架构、SoC架构。
  Ponte Vecchio是个庞然大物,集成晶体管数量突破1000亿个,使用5种不同的制造工艺,在内部封装了多达47个不同的单元(Tile),包括计算单元、Rambo缓存单元、Foveros封装单元、基础单元、HBM单元、Xe链路单元、EMIB单元,等等。
  如此复杂的芯片设计,面临的挑战自然是空前的,  首席架构师Masooma Bhaiwala直言这是她30年来设计的最复杂的芯片,堪称制造奇迹。
  其中,Foveros 3D封装是一个关键,最终的数据传输速度不得不提高到最初规划的1.5倍,以便以把Foveros连接数量降至最低,但依然比之前任何设计都高了两个数量级。
  开发团队还必须在设计初期就锁定Foveros在所有单元上的位置,这意味着必须一开始就搞定整个平面图布局,中途也不允许有明显变更。
  芯片设计和验证也是全新流程,为此开发了大量新的工具、方法、脚本,并独立安排4个主要单元,开发各自的调试软件包,分而治之,加速开发,最终在SoC整体封装完成几天内就成功启动,运行了Hello World。
  再来看几个关键的部分,  计算单元采用台积电N5 5nm工艺,每个集成8个Xe核心、4MB一级缓存  ,Foveros封装凸点间距36微米。
  基础单元是一个连接器,所有复杂的I/O和高带宽组件都在这里汇聚  ,包括PCIe 5.0总线、HBM2e内存、MDFI链路、EMIB桥接,几乎是在挑战物理极限。
  它采用  Intel 7工艺、Foveros封装,面积达640平方毫米  ,集成了多达144MB二级缓存。
  Xe链路单元是台积电N7 7nm工艺制造  ,负责不同GPU之间的连接,是面向HPC、AI的纵向扩展的关键,每个单元有8条,实现了最高90G Serdes,  可以满足“极光”(Aurora)这样百亿亿次级级超级计算机的需求。
  Ponte Vecchio目前处于  A0版本阶段  (一般到A1就投入量产),成功运行了数百个工作负载,实测FP32吞吐性能超过45TFlops,Memory Fabric缓存带宽超过5TB/s,互连带宽超过2TB/s。
  Ponte Vecchio将有多种产品形态,最基本的单芯片做成OAM模块,集成到一个载体基板上,AMD Instinct也有这种。
  四芯并联组成一个子系统,再搭配双路的下一代Sapphire Rapids至强处理器  ,就是一个超算节点,将用于“极光”超算。
  【来源:快科技】【作者:上方文Q】

2022年上半年一加全球产品推出时间表泄露消息人士YogeshBrar透露了一加今年上半年在全球发布产品的时间表,继在中国市场率先发布OnePlus10Pro之后,该公司将在未来几个月内推出更多的智能手机,以及智能电视和耳监管数据库披露苹果新产品iPhoneSE和iPadAir法国博客Consomac发现,苹果今天在欧亚经济委员会的数据库中提交了未发布的iPhone和iPad型号。这些文件可能代表了传闻中的第三代iPhoneSE第五代iPadAir,以及更多源自官方的三星GalaxyS22图像泄露在昨天即将到来的GalaxyS22的详细图片之后,我们得到了另一批图片,展示了这个尚未发布的设备的三种配色黑色白色和绿色,当然这没有什么令人惊讶的,我们早就知道了,但本次图像中更多疑似OPPOReno8Pro官方渲染图首次现身Oppo公司会以不同的产品线销售面向不同人群的产品,经济型的机型被置于A系列中,Reno型号容纳了中端设备,而高端型号则由Find领军。2022年3月左右,Oppo预计将推出Fin人类史上最贵最强!韦伯太空望远镜主镜成功展开镜面全镀金迄今为止人类建造的最贵最强大的红外波段太空望远镜詹姆斯middot韦布太空望远镜,成功完成了主反射镜最后一部分的展开,并完成锁定。这标志着造价100亿美元的詹姆斯middot韦布太万达进军汽车领域首家红旗旗舰店正式落地营业在万达集团与中国一汽宣布双方战略合作启动三个月后,双方的合作项目首家万达红旗旗舰店正式落地营业,这也是万达迈入汽车圈的又一次重要动作。全国首家万达红旗体验中心位于北京中关村丰台科技LG加入IBMQuantumNetwork推进量子计算的应用IBM昨日宣布,韩国LG电子加入IBMQuantumNetwork,以推进量子计算的行业应用。加入IBMQuantumNetwork后,LG电子将会获得IBM量子计算系统IBM量子缴税近700亿马斯克出售10股票计划已完成特斯拉创始人马斯克最近一直在出售股票,一度引发特斯拉股价大跌,然而现在股价涨回来了,市值也重回1万亿美元,因为马斯克出售股票的计划已经在12月28日完成,光是缴税就要接近700亿,相互宝正式宣布将于2022年1月28日关停业务相互宝正式宣布,将于2022年1月28日关停。相互宝表示,过去一年,互助行业发生了重大变化,为了更长远地保护所有成员权益,相互宝将于2022年1月28日24时停止运行,我们将全力做标志性甜甜圈不见了!索尼发布LinkBudsS蓝牙耳机早些时候,索尼推出了LinkBuds蓝牙耳机,它采用了独创的ldquo甜甜圈rdquo开放式设计,虽然牺牲了降噪性能,但换来了更轻便的佩戴体验。目前,索尼推出了这系列耳机的新品Li爱立信宣布重大业务重组及执行团队调整爱立信公布了对业务进行全面改革的计划,包括创建一个特定的企业无线解决方案业务部门合并云和数字服务部门,以及执行团队的调整。爱立信在一份股市声明中表示这一结构调整将从6月初开始生效,
华硕高性价比之选TUFGAMINGZ590PLUSWIFI来了随着第11代英特尔酷睿处理器的亮相,华硕也率先发布新一代Z590系列主板,包括ROG玩家国度ROGSTRIX猛禽TUFGAMING电竞特工以及PRIME大师四大系列。我们快科技已经微信Mac版更新可以看朋友圈了微信朋友圈已经成为一种生活方式,大家不管是出去玩还是吃东西,大部分人都是让朋友圈先ldquo吃rdquo。在今年1月份举行的2021微信公开课Pro版微信之夜上,腾讯高级副总裁,微联想小新Pro142021锐龙版最高搭载锐龙75800H联想小新Pro142021已经推出了Intel独显版和Intel集显版,很多小伙伴在期待锐龙版的到来。联想小新官微终于带来了好消息联想小新Pro142021标压锐龙版将于本月底发布12nm16核龙芯3系列最新处理器即将出货来自统信软件的消息,日前他们联合龙芯中科副总裁张戈倪光南院士等人举行了一次小型会谈,谈到了国内的OS系统及处理器进展。龙芯中科副总裁张戈高翔向倪院士汇报了龙芯产品最新进展,基于自主德国大陆集团巨亏近百亿芯片短缺将持续今年全年日前,德国汽车零部件巨头大陆集团公布了2020财年的财务报告。该集团2020年营业额达377亿欧元,由于受到疫情影响,同比2019年下滑了15。2。其中,大陆集团2020财年经营性特斯拉大涨价!ModelSPlaidPlus上调6。5万元特斯拉涨价已经屡见不鲜,据媒体统计,自特斯拉进入中国市场以来已经累计调价近60次。但如果要说新车未上市,就先大涨价,还是十分罕见的。3月11日,我们从特斯拉官网获悉,ModelSPEUV光刻机门槛极高7nm以下工艺才能买对先进工艺来说,ASML的光刻机必不可少,最先进的EUV光刻机售价将近10亿元,投资巨大,而且购买EUV光刻机门槛也很高,全球也只有三家公司购买。报道指出,目前ASML的EUV光刻京东发布2020年财报一年净增近1。1亿用户!3月11日,京东集团发布了2020年第四季度和全年业绩,主要核心业绩指标均超出市场预期。2020年第四季度,京东集团净收入为2,243亿元人民币,同比增长31。4,其中净服务收入为Win103月份更新可导致蓝屏微软确认新补丁暂停每个月的第二个星期二是微软的补丁日,3月份是3月9日发布的,然而这些新补丁又给大家惹麻烦了,可能导致蓝屏。现在有越来越多的Win10用户发现了问题,如果安装累积更新补丁KB5000百度宣布香港二次上市发行9500万股股票代号9888这一年来有关百度在香港二次上市的传闻终于尘埃落定了,今晚百度官方确认3月12日正式在港股开启全球发售。根据百度的计划,该公司将在香港联交所主板上市,全球发售和上市9500万股公司A三大百亿基金大幅放宽限购规模超过370亿据媒体报道,3月11日晚些时候,交银施罗德基金中欧基金等ldquo顶流rdquo基金率先调整大额申购上限,涉及3只百亿级主动权益基金,合计规模超370亿元。此前随着基金市场大幅上涨