Don’tMissThisDefiningMomentinAI,中文意为切勿错过AI的决定性时刻。北京时间2023年3月21日23:00,皮衣刀客黄教主在GTC2023发表主题如上的Keynote演讲,并称这将是我们迄今为止最重要的一次GTC,英伟达官方Twitter也放出了本届GTC的AIWaveTop5,事实如何?一起来看看今年Keynote都有哪些重磅发布吧 AIWaveTop5关键词之一:生成式AI 生成式AI技术,提供学习数据的基础模式和结构,生成新的内容,例如图像、音频、代码、文本、3D模型等。专业的生成式人工智能工具可以提高创作者的生产力,让对技术不太熟悉的用户也能受益。GTC2023上宣布了NVIDIAAIFoundations云服务及NVIDIAPiccasso。 AI技术正在革命性地改变3D内容创作,GTC2023上,黄仁勋宣布生成式AI领域新版本OmniverseAudio2Face应用程序的到来。 OmniverseAudio2Face应用人工智能,让3D艺术家通过音频文件快速制作出逼真的面部动画,避免了通常费时费力的手动过程。Audio2Face现在可以预览普通话中文语言支持,同时改进了唇形同步质量、更强大的多语言支持新的预训练模型。 第一代医药行业生成式AI超算系统问世 日本MitsuiCo。宣布打造基于NVIDIADGX的超算系统Tokyo1。Tokyo1是全球首款针对医药行业的生成式AI超算系统,将用于探索分子动力学模拟与生成式AI模型。该项目预计于2023年下半年上线,由MitsuiCo。子公司Xeureka负责运营,Xeureka希望借助Tokyo1改变日本制药行业领域长期以来面临的药物开发滞后等问题。 Tokyo1基于NVIDIADGXH100,第一期包括16个NVIDIADGXH100系统,每个系统配备8个NVIDIAH100TensorCoreGPU。后续Xeureka还将持续扩充系统规模,并提供日本相关产业客户的节点连接能力,提供分子动力学模拟、大型语言模型训练、量子化学、潜在药物创新分子结构的AI生成等,同时Tokyo1用户还能透过NVIDIABioNeMo提供药物探索与服务。关键词之二:数字生物学 英伟达发布一套生成式AI云服务,用于定制AI基础模型,以加速蛋白质及疗法、基因组学、化学、生物学和分子动力学等领域的研究。 生成式AI模型可以快速识别潜在的药物分子,在某些情况下还可以从零设计化合物或基于蛋白质的治疗方法。通过对小分子、蛋白质、DNA和RNA序列的大规模数据集进行训练,这些模型可以预测蛋白质的三维结构以及分子与目标蛋白质对接的程度。 全新的BioNeMo云服务针对AI模型训练和推理,加速药物研发。它使得科研人员能够在自有数据上对生成式AI应用进行微调,并直接在浏览器中运行AI模型推理,或通过新的云端API轻松集成到现有应用中。 BioNeMo云服务包括预训练AI模型,有助于帮科研人员创建药物研发的AIPipeline,目前已被Evozyne和InsilicoMedicine等生物制药公司用于药物设计。 接入BioNeMo服务的新型生成式AI模型包括: MegaMolBART生成式化学模型 ESM1nv蛋白质语言模型 OpenFold蛋白质结构预测模型 AlphaFold2蛋白质结构预测模型 DiffDock用于分子对接的扩散生成模型 ESMFold蛋白质结构预测模型 ESM2蛋白质语言模型 MoFlow生成式化学模型 ProtGPT2生成新蛋白质序列的语言模型关键词之三:CV CVCUDA是一个用于云端计算机视觉的开源GPU加速库,旨在帮助企业在GPU上建立和扩展端到端、基于AI的计算机视觉和图像处理Pipeline。 微软必应的视觉搜索引擎使用AI计算机视觉在网上搜索图像(图示为搜索图中的狗粮) CVCUDA将预处理和后处理步骤从CPU转移到GPU,从而在单个GPU上处理4倍的stream,处理相同的工作负载,它的成本只有云计算的四分之一。 CVCUDA库为开发人员提供了30多种高性能的计算机视觉算法,包括本地PythonAPI、以及与PyTorch、TensorFlow2、ONNX和TensorRT等机器学习框架的zerocopy集成,从而提供更高的吞吐量、更低的计算成本以及与云端AI业务相比更少的碳足迹。 自CVCUDAalpha版本发布以来,已有超过500家公司创建了超过100个用例。关键词之四:自主机器 2021年,英伟达提出了cuOpt,一个实时路线优化软件,为企业提供了适应实时数据的能力。cuOpt通过每秒分析数十亿个可行移动,优化交付路线。 cuOpt现在是一个蓬勃发展的合作伙伴生态系统的中心,该生态系统包括系统集成商和服务提供商、物流和运输软件供应商、优化软件专家和位置服务提供商。cuOpt在LiLimpickupanddeliverybenchmark(Li和Lim提出的接货和交付问题基准测试集合中设定的基准测试,用于衡量路线的效率)中创造了三项记录。 针对LiLim基准测试,研究人员已经在二十年前规划出了最佳路线,发明了设置并重新设置世界上最著名的解决方案的算法,以前的获奖者则专注于对先前路线进行小的调整。cuOpt创建的路线与以前的获奖者创建的路线不同。cuOpt提供的改进比基准测试上先前记录的改进高出7。2倍,比之前创纪录的成果获得的改进高出26。6倍。关键词之五:对话式AI 各行各业的公司都希望利用交互式avatar来增强数字体验。但创建它们是一个复杂耗时的过程,需要应用能看、听、理解及与用户交流先进的人工智能模型。 为了简化这个过程,英伟达通过OmniverseAvatarCloudEngine(ACE)为开发者提供实时的人工智能解决方案,这是一个云原生的微服务套件,用于交互式avatar的端到端开发。NVIDIA正在不断改进,为用户提供所需的工具,轻松设计和部署从交互式聊天机器人到智能数字人类的各种avatar。 ATT公司正计划使用OmniverseACE和TokkioAIavatar工作流程来构建、定制和部署用于客户服务和员工服务台的虚拟助理。与英伟达的服务交付合作伙伴之一Quantiphi合作,ATT正在开发互动avatar,可以用当地语言提供跨地区的全天候支持。这有助于该公司降低成本,同时为其全球员工提供更好的体验。除了客户服务外,ATT还计划为公司的各种用例构建和开发数字人。 本届GTC2023上,除了以上五大关键词贯穿Keynote,值得关注的还有黄仁勋在线带货的GraceSuperchip超级芯片。GraceCPU:为数据中心的节能计算铺平道路 实际测试中,在主要数据中心CPU应用程序的包络相同的情况下,GraceCPUSuperchip比x86处理器性能高2倍,这表明数据中心可以处理2倍的高峰流量或削减一半的电费。 三大CPU创新 在单一裸晶(Die)中,GraceCPU用ultrafastfabric连接72ArmNeoverseV2core,在fabric带宽中sport3。2TBs,一个标准的吞吐。 用NVIDIANVLinkC2C互连将其中两个芯片连接到一个超级芯片(superchip)封装中,提供900GBs的带宽。 GraceCPU是第一个使用服务器级LPDDR5X内存的数据中心CPU。这提供了高达50的内存带宽,成本类似但功率是典型服务器内存的18,尺寸紧凑,密度是典型的基于卡的内存设计的2倍。 老黄现场展示GraceSuperchip 测试发现,与数据中心中使用相同功耗的领先x86CPU相比,GraceCPU: 微服务的速度提高了2。3倍; 内存密集型数据处理速度提高2倍; 计算流体力学速度提高了1。9倍。英伟达:AI世界的引擎 从去年年底开始,ChatGPT一经推出就将生成式AI、大语言模型推到了风口浪尖,在黄仁勋看来,ChatGPT开启了AI的iPhoneMoment,但在今天的keynote直播中,他也坦言生成式AI令人印象深刻的能力让公司产生了一种紧迫感,需要重新构想他们的产品和商业模式,可以看到英伟达已经从AI训练到部署,从半导体到软件库,从系统到云服务等方面开始进行多维度突破。 目前,全球英伟达生态系统涵盖NVIDIAInception中的400万开发人员、40,000家公司和14,000家初创公司,或许正如GTC2023前夕,黄仁勋在CNBS访谈中所说的,英伟达要成为这样一家公司: Becauseofwhatwedo,wecouldmakewhatisbarelypossiblepossible,orwecouldmakesomethingthatisveryenergyconsuming,veryenergyefficient,orwecouldturnsomethingthatcausealotofmoney,andmakeitmoreaffordable。