英伟达推DGXCloud通过浏览器就能即时接入AI超级计算机
雷递网乐天3月22日
英伟达(NVIDIA)日前发布NVIDIADGXCloud。DGXCloud实例的价格为每实例每月36,999美元起。
这项AI超级计算服务使企业能够即时接入用于训练生成式AI等开创性应用的高级模型所需的基础设施和软件。
英伟达称,DGXCloud可提供NVIDIADGXAI超级计算专用集群,并配以NVIDIAAI软件。这项服务使得每个企业都可以通过一个简单的网络浏览器就能访问自己的AI超级计算机,免除了购置、部署和管理本地基础设施的复杂性。
企业可按月租用DGXCloud集群,以便能够快速、轻松地扩展大型多节点训练工作负载的开发,无须等待需求量通常很大的加速计算资源。
NVIDIA创始人兼首席执行官黄仁勋表示:我们正处于AI的‘iPhone’时刻。初创企业正在竞相打造颠覆性的产品和商业模式,老牌企业则在寻求应对之法。DGXCloud使客户能够在全球规模的云上即时接入NVIDIAAI超级计算。
NVIDIA正在与云服务商联合托管DGXCloud基础设施,OracleCloudInfrastructure(OCI)将通过其OCI超级集群,提供专门构建的RDMA网络、裸金属计算以及高性能本地块存储,可扩展到超过32,000个GPU所组成的超级集群。
微软Azure预计下个季度开始托管DGXCloud。这项服务还将在不久之后扩展到谷歌云等。
英伟达称,企业可以使用NVIDIABaseCommand平台软件管理和监控DGXCloud训练工作负载,该软件可实现DGXCloud以及本地NVIDIADGX超级计算机之间用户体验的无缝衔接。通过使用BaseCommand平台,用户可根据每项工作所需的DGX基础设施的数量和类型,将工作负载与之相匹配。
DGXCloud包含NVIDIAAIEnterprise。NVIDIAAIEnterprise作为NVIDIAAI平台的软件层,通过提供端到端AI框架和预训练模型,来加速数据科学流程,并简化生产级AI的开发和部署。今日发布的NVIDIAAIEnterprise3。1提供新的预训练模型、经过优化的框架和加速数据科学软件库,可进一步帮助开发人员启动他们的AI项目。
DGXCloud的每个实例都配有8个NVIDIAH100或A10080GBTensorCoreGPU,每个节点共有640GBGPU内存。使用NVIDIA网络解决方案构建的高性能、低延迟结构确保了工作负载能够在互连系统集群中扩展,使多个实例就像一个巨型的GPU,以满足高级AI训练性能要求。集成在DGXCloud中的高性能存储为AI超级计算提供了完整的解决方案。
DGXCloud特有的来自NVIDIA专家的支持贯穿整个AI开发流程。用户可以直接与NVIDIA工程师一起优化模型,并迅速解决各种行业用例中的开发难题。
雷递由媒体人雷建平创办,若转载请写明来源。