黄仁勋向台积电放核弹!干掉40000台CPU服务器,计算光刻
作者ZeR0程茜
编辑漠影
芯东西3月22日报道,全球AI计算技术盛会、一年一度的英伟达GTC大会如期而至!
英伟达CEO黄仁勋(昵称老黄)一如既往穿着标志性的皮衣进行了78分钟演讲,满面笑容地分享英伟达又闷声干了哪些大事。
总体来看,此次演讲可总结成一大亮点和一大重点。
亮点是英伟达秘密研发四年,向芯片制造业甩出一枚技术核弹通过突破性的光刻计算库cuLitho,将计算光刻加速40倍以上,使得2nm及更先进芯片的生产成为可能。全球最大晶圆厂台积电、全球光刻机霸主阿斯麦、全球最大EDA巨头新思科技均参与合作并引入这项技术。
老黄还直接上了一堂光刻机小课堂,配合动画讲解芯片制造的最关键设备光刻机是如何运作的。
重点毫无疑问是生成式AI。
老黄对OpenAI的ChatGPT赞不绝口,夸它震惊世界,代表着崭新的计算平台已经诞生,AI的iPhone时刻已经到来。
据英伟达透露,OpenAI将在微软Azure超级计算机上使用英伟达H100GPU,AI文生图明星创企Stability。ai是H100GPU的早期访问客户。
为了加速生成式AI开发及部署,老黄宣布推出3款全新推理GPU,分别擅长AI视频、图像生成、ChatGPT等大型语言模型的推理加速。
此外,英伟达还发布了AI超级计算服务DGXCloud、加速企业创建大模型和生成式AI的云服务NVIDIAAIFoundations等,并宣布与日本三菱联合打造了日本第一台用于加速药研的生成式AI超级计算机。
英伟达也发布了一系列面向元宇宙、汽车、量子计算领域的新进展,包括PaaS服务NVIDIAOmniverseCloud现已向特定企业开放、与宝马集团扩大合作建设虚拟工厂、比亚迪更多车型将采用NVIDIADRIVEOrin平台,以及与QuantumMachines合作推出了全球首个GPU加速量子计算系统。
老黄宣布,英伟达已经更新了100个加速库,目前英伟达全球生态系统已覆盖400万开发人员、4万家公司和1。4万家初创公司。一、芯片制造炸场!将计算光刻提速40倍,三大半导体巨头站台
我们先来看看今天的惊喜弹:英伟达发布了一个造福先进芯片制造的突破性技术NVIDIAcuLitho计算光刻库。
光刻是芯片制造过程中最复杂、最昂贵、最关键的环节,其成本约占整个硅片加工成本的13甚至更多。计算光刻模拟了光通过光学元件并与光刻胶相互作用时的行为,应用逆物理算法来预测掩膜板上的图案,以便在晶圆上生成最终图案。
简而言之,计算光刻是提高光刻分辨率、推动芯片制造达到2nm及更先进节点的关键手段。
计算光刻是芯片设计和制造领域中最大的计算工作负载,每年消耗数百亿CPU小时。黄仁勋讲解道,大型数据中心247全天候运行,以便创建用于光刻系统的掩膜板。这些数据中心是芯片制造商每年投资近2000亿美元的资本支出的一部分。
而cuLitho能够将计算光刻的速度提高到原来的40倍。老黄说,英伟达H100GPU需要89块掩膜板,在CPU上运行时,处理单个掩膜板需要两周时间,而在GPU上运行cuLitho只需8小时。
此外,台积电可通过在500个DGXH100系统上使用cuLitho加速,将功率从35MW降至5MW,替代此前用于计算光刻的40000台CPU服务器。使用cuLitho的晶圆厂,每天可以生产35倍多的光掩膜,仅使用当前配置电力的19。
全球最大晶圆厂台积电、全球最大光刻机制造商阿斯麦(ASML)、全球最大EDA公司新思科技(Synopsys)都为这项新技术站台。老黄透露道,cuLitho历时四年研发,与这三家芯片大厂进行了密切合作。台积电将于6月开始对cuLitho进行生产资格认证。
台积电CEO魏哲家夸赞它为台积电在芯片制造中广泛地部署光刻解决方案开辟了新的可能性,为半导体规模化做出重要贡献。阿斯麦CEOPeterWennink说阿斯麦计划将对GPU的支持集成到其所有的计算光刻软件产品中。
新思科技董事长兼CEOAartdeGeus称,在英伟达的cuLitho平台上运行新思科技的光学邻近校正(OPC)软件,将性能从几周加速到几天。
cuLitho将有助于晶圆厂缩短原型周期时间、提高产量、减少碳排放,为2nm及更先进的工艺奠定基础,并使得曲线掩模、highNAEUV、亚原子级光刻胶模型等新技术节点所需的新型解决方案和创新技术成为可能。二、发布ChatGPT专用推理GPU,登浏览器即可访问AI超级计算机
围绕生成式AI,英伟达发布了一系列加速模型训练和推理的软硬件新品及服务。
老黄首先讲述了英伟达在生成式AI革命之初是如何进入AI领域的。
英伟达加速计算始于DGX(AI超级计算机),这是大型语言模型实现突破背后的引擎。他谈道,(2016年)我亲手将全球首款DGX交给了OpenAI,自此以后,《财富》100强企业中有一半安装了DGXAI超级计算机。DGX已成为AI领域的必备工具。
生成式AI将重塑几乎所有行业。老黄说,ChatGPT、StableDiffusion、DALLE和Midjourney唤醒了世界对生成式AI的认知。
在他看来,生成式AI是一种新型计算机、一种可以用人类语言进行编程的计算机,与个人电脑(PC)、互联网、移动设备和云类似,这种能力影响深远,每个人都可以命令计算机来解决问题,现在每个人都可以是程序员。
1、训练:生成式AI明星企业都在用,AI超级计算机已全面投产
训练方面,英伟达H100GPU基于Hopper架构及其内置TransformerEngine,针对生成式AI、大型语言模型和推荐系统的开发、训练和部署进行了优化,利用FP8精度在大型语言模型上比上一代A100提供了快9倍的AI训练和快30倍的AI推理。
DGXH100拥有8个H100GPU模组,在FP8精度下可提供32PetaFLOPS的算力,并提供完整的英伟达AI软件堆栈,助力简化AI开发。黄仁勋宣布,NVIDIADGXH100AI超级计算机已全面投入生产,很快将面向全球企业。微软宣布Azure将向其H100AI超级计算机开放私人预览版。
黄仁勋说,云计算巨头现在正在提供英伟达H100GPU,生成式AI领域的多家明星企业都在用H100加速工作。
比如,OpenAI用H100的上一代A100训练和运行AI聊天机器人ChatGPT,并将在微软Azure超级计算机上使用H100;AI文生图明星创企Stability。ai是AWS上的H100早期访问客户。
最近刚推出开源大模型的社交软件巨头Meta开发了基于Hopper架构的AI超级计算机GrandTeton系统。相比其前代Zion,该系统的算力大幅提升,可同时支持推荐模型和内容理解的训练和推理。
英伟达与其主要合作伙伴宣布推出强大的GPUNVIDIAH100TensorCoreGPU新产品和服务,以满足生成式AI训练和推理需求。
AWS宣布即将推出的EC2超级集群(EC2P5实例)可扩展至20000个互连的H100。OracleCloudInfrastructure(OCI)宣布限量推出采用H100的全新OCICompute裸金属GPU实例。
为企业和开发者提供多模态视频理解的平台TwelveLabs计划在OCISupercluster上使用H100实例来即时、智能和容易搜索视频。
2、推理:发布3款GPU、3类云服务
推理方面,英伟达推出全新GPU推理平台:4种配置(L4TensorCoreGPU、L40GPU、H100NVLGPU、GraceHopper超级芯片)、一个体系架构、一个软件栈,分别用于加速AI视频、图像生成、大型语言模型部署和推荐系统。
(1)L4:针对AI视频设计的通用GPU,可提供比CPU高120倍的AI视频性能,能效提高99;优化了视频解码与转码、视频内容审核、视频通话等功能,如背景替换、重新打光、眼神交流、转录和实时翻译等。一台8GPUL4服务器将取代100多台用于处理AI视频的双插槽CPU服务器。
(2)L40:用于图像生成,针对图形和AI支持的2D、视频和3D图像生成进行了优化,推理性能是英伟达最受欢迎的云推理GPUT4的10倍。
(3)H100NVL:针对ChatGPT等大型语言模型的大规模部署,配备双GPUNVLink,将两张拥有94GBHBM3显存的PCIeH100GPU拼接在一起,可处理拥有1750亿参数的GPT3大模型,同时支持商用PCIe服务器轻松扩展。
老黄说,目前在云上唯一可以实际处理ChatGPT的GPU是HGXA100。与适用于GPT3处理的HGXA100相比,一台搭载4对H100及双GPUNVLink的标准服务器的速度要快10倍,H100可将大型语言模型的处理成本降低一个数量级。
(4)GraceHopper超级芯片:适用于推荐系统和大型语言模型的AI数据库,图推荐模型、向量数据库和图神经网络的理想选择,通过900GBs的高速一致性芯片到芯片接口连接英伟达GraceCPU和HopperGPU。
谷歌云是第一个向客户提供英伟达L4推理GPU的云服务提供商。谷歌还将L4集成到其VertexAI模型商店中。
3、云服务:登浏览器即可访问AI超级计算机
英伟达推出了一项名为DGXCloud的AI超级计算服务,与微软Azure、谷歌OCP、OracleOCI合作,通过一个Web浏览器就能访问,以便企业为生成式AI和其他开创性应用训练先进的模型。
DGXCloud实例的起价为每个实例每月36999美元。其每个实例都具有8个NVIDIAH100或A10080GBTensorCoreGPU,每个节点共有640GB的GPU内存。DGXCloud提供了专用的NVIDIADGXAI超级计算集群,并配备了NVIDIAAI软件。
英伟达还推出了全新云服务及代工厂NVIDIAAIFoundations,使企业能够构建、改进、运营使用其专有数据训练的、用于特定领域任务的定制大模型和生成式AI模型:
(1)NeMo:文本生成模型构建服务,提供从80亿到5300亿个参数的模型,会定期更新额外的训练数据,帮助企业为客服、企业搜索、聊天机器人、市场情报等生成式AI应用进行模型定制。
(2)Picasso:视觉语言模型构建服务,具有先进的文生图、文本转视频、文本转3D功能,可为产品设计、数字孪生、角色创建等使用自然文本提示的应用快速创建和定制视觉内容。
(3)BioNeMo:生命科学服务,提供AI模型训练和推理,加速药物研发中最耗时和成本最高的阶段,可加速新蛋白质和治疗方法的创建以及基因组学、化学、生物学和分子动力学研究。
直接在浏览器上或通过API,均可访问这些运行在NVIDIADGXCloud上的云服务。NeMo、BioNeMo云服务已开放早期访问,Picasso云服务正在私人预览中。
英伟达也宣布了一系列跟生成式AI相关的合作进展,包括与Adobe合作开发新一代先进的生成式AI模型;与GettyImages合作训练负责任的文生图、文本转视频基础模型;与Shutterstock合作,训练从简单文本提示中创建生成式3D模型,将创作时间从几小时减少到几分钟。
此外,英伟达与三菱联合发布了将用于加速药物研发的日本第一台生成式AI超级计算机Tokyo1。通过在Tokyo1上使用NVIDIABioNeMo软件,研究人员能运行高达数十亿参数的先进AI模型,包括蛋白质结构预测、小分子生成、姿态估计等。
三、BlueField3DPU已投产,打造全球首个GPU加速量子计算系统
数据处理单元(DPU)方面,黄仁勋宣布英伟达BlueField3DPU已投入生产,并被百度、CoreWeave、京东、微软Azure、OracleOCI、腾讯游戏等领先的云服务提供商所采用,以加速其云计算平台。
面向量子计算,要从量子噪声和退相干中恢复数据,需要对大量量子比特进行纠错。对此,英伟达与QuantumMachines合作推出了一个量子控制链路,它可将英伟达GPU连接到量子计算机,以极快的速度进行纠错。
双方合作研发的全球首个GPU加速量子计算系统NVIDIADGXQuantum,将强大的加速计算平台(由NVIDIAGraceHopper超级芯片和CUDA量子开源编程模型支持)与全球最先进的量子控制平台OPX结合在一起,使研究人员能够构建强大的应用,将量子计算与最先进的经典计算结合起来,实现校准、控制、量子纠错和混合算法。
NVIDIADGXQuantum的核心是NVIDIAGraceHopper系统,通过PCIe连接到通用量子控制系统QuantumMachinesOPX,实现QPU和量子之间的亚微秒延迟处理单元(QPU)。
DGXQuantum还为开发人员配备了一款强大的混合GPUQuantum编程模型NVIDIACUDAQuantum,可以在一个系统中集成QPU、GPU、CPU并进行编程。多家量子硬件公司将CUDAQuantum集成到他们的平台中。
美国通信巨头ATT宣布与英伟达合作,使用英伟达全套AI平台改进运营并提高可持续性。ATT将使用英伟达AI平台进行数据处理、优化服务排队、创建员工支持和培训的对话式AI数字化形象。四、推出新一代元宇宙服务器,引入生成式AI和模拟仿真更新
面向元宇宙领域,英伟达推出了第三代OVX计算系统和新一代工作站,为基于NVIDIAOmniverseEnterprise的大规模数字孪生提供动力。
第三代OVX服务器通过组合双CPU平台、BlueField3DPU、L40GPU、两个ConnectX7SmartNIC和NVIDIASpectrum以太网平台,提供了突破性的图形和AI性能,可加速大规模数字孪生模拟等应用,进而提高运营效率和预测性规划功能。
企业可以利用OVX性能在可视化、虚拟工作站和数据中心处理工作流程等方面进行协作。
此外,新一代NVIDIARTX工作站RTX4000SFFAdaGeneration采用英伟达AdaLovelaceGPU、ConnectX6DxSmartNIC和英特尔至强处理器。最新发布的RTX5000Ada一代笔记本电脑GPU使专业人士能随时随地访问Omniverse和工业元宇宙工作负载。
黄仁勋还宣布了英伟达用于构建和操作元宇宙应用的平台NVIDIAOmniverse的相关更新,增加了一系列生成式AI、模拟仿真相关功能,让开发者能够更轻松地部署工业元宇宙应用。
平台即服务(PaaS)NVIDIAOmniverseCloud现已面向特定企业开放,使企业能够在其核心产品和业务流程中统一数字化。
从大型物理设施到手持消费品,每一个人造物体都有一天会拥有一个数字孪生,用来建造、操作和优化物体。黄仁勋说,OmniverseCloud是用于工业数字化的从数字到物理的操作系统,它的出现正好赶上了正在建设的价值数万亿美元的新电动汽车、电池和芯片工厂。
英伟达选择微软Azure作为OmniverseCloud的首个云服务提供商。由NVIDIAOVX计算系统提供支持的OmniverseCloud将于今年下半年与微软Azure一起推出。企业可访问Omniverse软件应用程序的全堆栈套件和NVIDIAOVX基础设施,并享有Azure云服务的规模和安全性。
Azure上OmniverseCloud的新订阅服务使汽车团队可轻松实现工作流程的数字化,无论是连接3D设计工具以加速汽车开发,还是构建汽车的数字孪生工厂或运行闭环模拟来测试车辆性能。
老黄在演讲期间分享了一个视频,展示亚马逊如何用英伟达Omniverse平台构建完全逼真的数字孪生机器人仓库,以节省时间和金钱。
英伟达与宝马集团宣布扩大合作,为汽车制造商开设了第一个完全虚拟工厂。宝马集团将英伟达Omniverse平台用在其全球生产网络中构建和运行工业元宇宙应用。
此外,英伟达与其合作伙伴发布了全新的OmniverseConnections,通过通用场景描述(USD)框架连接更多世界更多先进应用。结语:生成式AI引发了全球企业紧迫感
生成式AI正在推动AI的快速应用,并重塑无数行业。老黄说,我们正处于AI的iPhone时刻,初创公司竞相构建具有颠覆性的产品和商业模式,老牌公司则在寻求应对之策,生成式AI引发了全球企业制定AI战略的紧迫感。
从今日英伟达的一系列软硬件发布,可以看到英伟达对先进AI计算的支撑已经覆盖到从GPU、DPU等硬件到帮助企业加速构建定制生成式AI模型的云服务,进而推动释放人类的创造力。
这已经不是老黄第一次跳预言家了。英伟达的加速计算产品可以说是与AI产业的发展共生共荣。英伟达不断为更大规模的AI模型训练提供更强大的算力基座,对AI训练和推理的前沿发展起到了重要推动力,蓬勃而生的AI热潮又为英伟达带来了更广阔的市场和机遇。
如今,生成式AI所展现出的商用前景几乎激励着每个行业重新设想其商业战略和实现这些战略所需的技术。英伟达正与其合作伙伴迅速行动,为AI应用提供更强大的计算平台,让更多人从生成式AI等前沿应用的变革性力量中受益。
郑智胆子太大了!拒绝跟恒大刺头服软,本轮中超半场就将他换下日前,广州队在本轮中超跟河南嵩山龙门狭路相逢。这场比赛,广州队主帅郑智非常胆大,安排饱受争议的李学鹏首发出战。李学鹏上一轮在广州队比赛中,替补出战之后,就表现平平。李学鹏当时给球迷
西甲最新积分榜皇马三连胜榜首,巴萨两连胜紧追,6队未尝胜绩西甲第三轮还剩两场比赛还没有进行,加的斯PK毕尔巴鄂竞技瓦伦西亚PK马德里竞技。我们一起看看已经结束了的比赛和最新积分榜变动。西甲最新积分榜卫冕冠军皇马继续客场作战,挑战中下游球队
F1比利时大奖赛后车手和车队积分榜红牛独一档F1比利时大奖赛落下帷幕,红牛车队独一档的存在,感觉车子比其他车队快了一个世纪一样,在场上碾压的存在。比赛最大的笑料反而是最后一圈的法拉利,真是奇闻,笑柄。你要刷最快圈,那要提前准
曼联削减了罗纳尔多的薪水,引起了葡萄牙人的不满据每日邮报报道,曼联管理层已经削减了前锋克里斯蒂亚诺罗纳尔多的薪水。葡萄牙人的薪水根据合同中的相应条款进行了削减,该条款规定,如果曼联在202122赛季结束时不进入冠军联赛,球员的
一夜10大转会动态曼联1亿欧敲定安东尼,福法纳转会即将官宣北京时间8月29日,昨夜今晨欧洲足坛转会市场重磅消息不断,在转会窗口即将关闭之际,各支球队都在对阵容进行最后的优化。曼联队接近签下安东尼,福法纳签约切尔西的交易即将官宣,巴萨仍未放
缅甸巩发党主席退休?政党发言人正式通知还没有出来近期,网络上有消息传出,缅甸联邦巩固与发展党(简称巩发党(USDP))主席吴丹特,因健康原因将辞去主席职务,临时主席职务由前移民部联邦部长吴钦依担任。9月中旬,巩发党在内比都塞苗迪
下赛季东部前十排名下赛季的东部战力前十排行榜来了,杜兰特欧文不走,东部的格局基本定了。第十黄蜂,有点实力,但球队乱七八糟啊。第九骑士,季后赛789名,边缘实力,内线防守极其强悍,但还缺少稳定的持球得
秋季如何调节自身经常将室内的窗户打开通风,保持空气的流通,并且要规律作息,不要熬夜,避免导致免疫力下降。因为秋季早晚的气温差异比较大一些,所以应该适当地进行衣物的增减。适当的锻炼加强对疾病的抵抗力
童心夏梦弘扬奥运精神,点亮志愿之光青少年正处于价值观形成的重要阶段,他们的思想与行为正确与否,关乎中华民族能否朝着实现伟大复兴的目标前进,因此用正确的价值观引导青少年尤为重要。奥运精神宣讲习近平总书记在北京冬奥会冬
欧冠0送巴萨两连败恰尔汗奥卢破门佩德里进球无效北京时间10月5日凌晨3点,202223赛季欧洲冠军联赛小组赛第三轮,C组中意甲豪门国际米兰坐镇主场迎战西甲球队巴塞罗那。上半场,科雷亚进球越位在先,恰尔汗奥卢远射破门下半场,登贝
凌晨重磅!马斯克放大招,一夜暴涨22中国基金报记者伊万加息预期降温,风险资产狂欢!美东时间10月4日周二,市场进一步预期美联储加息将放缓,美债收益率美元走低,美股高开高走,集体收涨,道指暴涨超820点。龙头科技股飙涨