芯东西(公众号:aichip001) 作者 | ZeR0 编辑 | 漠影 芯东西3月23日凌晨报道,今日,NVIDIA(英伟达)携基于最新Hopper架构的H100 GPU系列新品高调回归! 英伟达创始人兼CEO黄仁勋依然穿着皮衣,不过这次他没有出现在几乎已成GTC大会"标配"的厨房场景中,而是在一个更具科幻感的虚拟空间。 延续以往风格,黄仁勋在主题演讲中继续秒天秒地秒空气,公布多个"全球首款"。这次他带来一系列堪称"地表最强"的AI重磅新品,随便一个精度的AI性能,都比上一代A100高出3~6倍。 虽然英伟达并购Arm的计划刚刚告吹,但它的数据中心"三芯"总路线(GPU+DPU+CPU)依然不动摇——继去年推出其首款数据中心CPU后,今天,英伟达又亮出一款基于Arm架构的Grace CPU超级芯片。 此外,黄仁勋再次派出自己的虚拟数字人化身"玩偶老黄"Toy Jensen,并跟这个表情生动的玩偶进行了一番流畅的实时问答对话。 凭借押中图形处理和人工智能(AI)两大赛道,英伟达已经成为全球半导体市值TOP1。截至文章发布时间,英伟达的市值超过6600亿美元,比第二名台积电足足多了近1100亿美元。 下面就让我们来看看本场GTC大会的完整干货: 1、H100 GPU: 采用台积电4N工艺,拥有800亿个晶体管,实现了首个GPU机密计算,相比A100,FP8性能提升6倍,FP16、TF32、FP64性能各提升3倍。 2、全新NVLink Switch系统: 高度可扩展,支持256块H100 GPU互连。 3、融合加速器H100 CNX :耦合H100 GPU与ConnectX-7和以太网智能网卡,可为I/O密集型应用提供更强劲的性能。 4、DGX H100: 配备8块H100 GPU,总计有6400亿个晶体管,在全新的FP8精度下AI性能比上一代高6倍,可提供900GB/s的带宽。 5、DGX SuperPOD: 最多由32个DGX H100组成,AI算力可达1EFLOPS。 6、Eos超级计算机: 全球运行速度最快的AI超级计算机,配备576台DGX H100系统,FP8算力达到18EFLOPS,PF64算力达到275PFLOPS。 7、Grace CPU超级芯片: 由两个CPU芯片组成,采用最新Armv9架构,拥有144个CPU核心和1TB/s的内存带宽,将于2023年上半年供货。 8、为定制芯片集成开放NVLink: 采用先进封装技术,与英伟达芯片上的PCIe Gen 5相比,能源效率高25倍,面积效率高90倍。 英伟达还将支持通用小芯片互连传输通道UCIe标准。 9、CUDA-X: 60多个针对CUDA-X的一系列库、工具和技术的更新。 10、Riva 2.0: 对话式AI服务Riva全面发行,2.0版本支持识别7种语言,可将神经文本转换为不同性别发声的语音。 11、Merlin 1.0: 可帮助企业快速构建、部署和扩展先进的AI推荐系统。 12、Sionna: 一款用于6G通信研究的AI框架。 13、OVX与OVX SuperPod:面向工业数字孪生的数据中心级服务器和超级集群。 14、Spectrum-4: 全球首个400Gbps端到端网络平台,交换吞吐量比前几代产品高出4倍,达到51.2Tbps。 15、Omniverse Cloud: 支持协作者们随时随地实现远程实时协同工作。 16、DRIVE Hyperion 9: 汽车参考设计,拥有14个摄像头、9个雷达、3个激光雷达和20个超声传感器,总体传感器数量是上一代的两倍。 17、DRIVE Map: 多模态地图引擎,包含摄像头、激光雷达和雷达的数据,同时兼顾安全性。 18、Clara Holoscan MGX: 可供医疗设备行业在边缘开发和部署实时AI应用的计算平台,AI算力可达每秒254~610万亿次运算。 19、Isaac for AMR: 提供自主移动机器人系统参考设计。 20、Jetson AGX Orin开发者套件: 在边缘实现服务器级的AI性能。 黄仁勋还介绍了英伟达创建的NVIDIA AI加速计划,通过与AI生态系统中的开发者合作,开发工程化解决方案,以确保客户放心部署。 一、 H100 GPU:800亿晶体管、六大创新 每次英伟达的GPU新架构都会以一位科学家的名字来命名,这次同样如此。 新Hopper架构的命名取自美国计算机科学家格蕾丝·赫柏(Grace Hopper),她是耶鲁大学第一位数学女博士、世界上第三位程序员、全球首个编译器的发明者,也是第一个发现"bug"的人。 格蕾丝·赫柏正在教学COBOL编程语言 1945年9月9日,格蕾丝使用的Mark Ⅱ机出现故障,经过近一天的排查,她找到了故障的原因:继电器中有一只死掉的蛾子。后来,"bug"(小虫)和"debug"(除虫)这两个词汇就作为计算机领域的专用词汇流传至今。 基于Hopper架构的一系列AI计算新品,被冠上各种"全球首款"。按行业惯例,但凡比较AI算力,必会拿英伟达最新旗舰GPU作为衡量标准。 英伟达也不例外,先"碾压"一下自己两年前发布的上一代A100 GPU。 作为全球首款基于Hopper架构的GPU,英伟达 H100接过为加速AI和高性能计算(HPC)扛旗的重任,FP64、TF32、FP16精度下AI性能都达到A100的3倍。