范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

GPU池化如何帮助AI业务混合部署

  前情提要
  在之前的文章《对比,还原真实的GPU池化》中,我们通过对比,论述了GPU池化的多业务安全隔离、资源动态释放、多平台支持的优势。这些优势有助于解决GPU共享问题,从根源上提高GPU利用率,降低TCO,提高业务效率。
  然而,GPU池化不仅仅只是GPU共享,在共享的基础之上,GPU池化还提供很多实用的功能,帮助人工智能业务更好的落地,实现对GPU资源的高效管理。今天,我们从业务的角度来看一下GPU池化的高级功能。 业务类型与业务现状
  AI业务按类型大致可以分成以下几种:
  1. 在线推理类业务,这类业务时效性要求较高,比如身份证识别、人脸识别、智能外呼等;
  2. 离线推理业务,这类业务时效性要求没那么高,比如文档智能抽取、资料审核、量化分析等;
  3. 模型训练任务,主要用于上述各种算法模型的更迭,运行时间较长,运行时段灵活。
  通常,为了确保业务的隔离性、相互之间无干扰、保障服务的SLA,大多数企业都是将各个业务分别部署在独立的GPU卡上,如下图:
  这个部署方式SLA是有保障了,但是也带来了一些问题:
  1. 闲置资源较多。
  2. 业务数量与GPU数量深度绑定,随着大规模AI应用的上线,GPU数量容易成为业务扩展的瓶颈。
  3. 扩容GPU服务器成本高昂,交付周期长。
  4. 在线、离线、训练业务交叉轮流使用,变动流程繁琐,协调成本高,交付速度慢,体验不佳。
  5. 缺少全局统一的GPU资源配置和监控中心。 GPU池化优化的场景一:多个在线推理混合部署
  通常在大多数推理场景下,GPU卡很难发挥100%的性能,如果简单的按卡为单位进行分配,会有很多资源闲置浪费。
  为此,我们可以将GPU卡的算力和显存根据实际业务需求进行切分,分成若干个虚拟GPU,每个虚拟GPU给到一个业务使用。这样,多个在线推理业务可以部署在同一张GPU上。
  业务收益:①充分挖掘和有效利用了现有GPU资源,可以服务和支撑更多业务,满足了业务对弹性并发的需求。②提高GPU利用率,消除硬件瓶颈。
  OrionX池化能力关键词:化整为零,动态释放。
  GPU池化优化的场景二:在/离线推理混合部署,算力超分,昼夜复用
  某些在线推理业务,在时间维度有着非常显著的时间分布特性,比如OCR模型、身份识别等。它们在白天上班时间有着频率极高的业务请求量,在晚上下班之后请求量变得极低。与之相对应的是对GPU算力的占用也呈现出强烈的波峰波谷效应——在业务请求密集的时间段,GPU算力几乎100%运转;到了夜晚几乎无任何业务请求,算力100%闲置。
  为了复用这部分算力资源开展离线业务,运维人员需要在夜晚手动调整在线业务部署,再拉起离线推理业务。在线/离线业务变更涉及资源分配、网络调整等一系列动作,变动流程繁琐,需要一定的资源、人力协调成本。同时,算力资源运维监控缺乏统一界面呈现,运维人员无法第一时间获取资源利用情况。
  为了削峰填谷,错峰运行,我们可以有更简化,更智能的办法。OrionX支持任务级别的自动化管理,可以设定任务的自动上线时间及运行周期。在夜间在线业务低谷期,离线业务定时上线,开始执行离线审核类业务,业务完成后,离线业务自动下线。
  与此同时,在线业务无需下线,可以不间断运行。OrionX支持算力超分,允许单个GPU卡分配超过100%的算力资源。因此,我们可以将在线与离线两个业务同时调度到一个GPU卡上同时运行。由于在线与离线业务存在客户响应时间的差异,因此我们支持对这两个业务设置不同优先级。夜晚,当在线业务有请求到来时,OrionX优先保障高优先级的在线业务所需的算力资源,离线业务应用此时暂时挂起,等待在线业务处理完成后再继续执行。
  业务收益:①无需人工干预。②在线业务无需中断。③充分释放算力,提升GPU整体使用效率。
  OrionX池化能力关键词:化整为零,动态释放,算力超分,任务优先级。
  GPU池化优化的场景三:训练/推理混合部署,显存扩展,分时复用
  在削峰填谷这个路径上,我们还可以向前进一步探索更大的扩展空间,比如加载训练任务进行复用。推理业务主要在上班时间运行,而训练任务的运行时段则比较灵活,通过合理搭配训练和推理业务,就可以利用二者呈现出的运行时段的互补性,极大的提高GPU资源的利用率。
  然而,训练任务需要的显存通常比推理要大得多,如果要把两者同时加载在一起复用,很大概率会超过显存上限。那么这个时候就要使用显存超分。
  显存超分是一个用系统内存补充显存的技术,补充进来的内存将被用作显存的"缓存",冷/热数据可以自动的在显存与"缓存"之间进行切换。该技术可以突破物理GPU卡显存的上限,再叠加上算力超分,可以赋予虚拟GPU更从容的分配能力。同时再结合OrionX的任务调度与任务优先级,即可实现GPU资源合理分配。
  白天,推理业务优先占用GPU,保证在上班高负载下的服务质量。到了晚上或节假日,推理业务请求量很少,系统自动将显存数据切换至内存上,把GPU资源调度给训练业务。晚间或次日白天有推理业务请求时系统自动将推理业务的数据从内存中加载到显存中,GPU算力资源又调度回推理业务。
  如果在非工作时间,推理业务有请求达到,系统会自动调度以保证高优先级的推理业务的及时响应,系统会即刻将缓存在内存中的推理数据切换至显存,保障推理业务的优先权。
  整个切换过程可以全程自动化、周期化、不改变系统部署、不影响业务的正常运行,从而实现训练+推理叠加的模式。
  业务收益:①突破显存限制,提升扩展能力。②增加业务吞吐量。③无需人工干预。
  OrionX池化能力关键词:化整为零,动态释放,算力超分,显存超分,任务优先级。
  结语
  技术的道路从来都不是一蹴而就的,需要持续不断的努力与探索。软件定义GPU的道路也是一样。GPU虚拟化解决了GPU共享的问题,降低了硬件成本。在虚拟化技术之上延伸而出的GPU池化技术,能够扩展出更多实用的功能,这些技术可以帮助企业解决业务规模化与自动化问题,进一步提高其开发及工作效率。
  随着软件定义算力的普及,我们还将不断深入探索,加大技术与业务的融合力度,让GPU池化技术惠及更多AI企业!
  关于OrionX AI算力资源池化软件:
  趋动科技的OrionX AI算力资源池化解决方案帮助客户构建数据中心级AI算力资源池,使用户应用无需修改就能透明地共享和使用数据中心内任何服务器之上的AI加速器。OrionX不但能够帮助用户提高AI算力资源利用率,而且可以极大便利用户AI应用的部署。OrionX通过软件定义AI算力,颠覆了原有的AI应用直接调用物理GPU的架构,增加软件层,将AI应用与物理GPU解耦合。AI应用调用逻辑的OrionX vGPU,再由OrionX将OrionX vGPU需求匹配到具体的物理GPU。OrionX架构实现了GPU资源池化,让用户高效、智能、灵活地使用GPU资源,达到了降本增效的目的。
  OrionX通过构建GPU资源池,让企业内的AI用户共享数据中心内所有服务器上的GPU算力。AI开发人员不必再关心底层资源状况,专注于更有价值的业务层面,让应用开发变得更加便捷。根据客户测算,OrionX猎户座软件可以每年提升50%AI算法工程师人效、提升AI资源利用率3-8倍以及让客户总体拥有成本下降80%。

HUAWEIHiCar车载智慧屏发布了小伙伴们期待已久,我们如约而来!就在刚刚,华为消费者业务CEO余承东给大家带来了华为全屋智能及智慧屏新品发布会!这其中,就有大家期待已久的HUAWEIHiCar车载智慧屛!车载智慧为什么智能建筑必须有更智能的入口控制自进入21世纪以来,智能建筑及其内部技术创新的发展突飞猛进。从建筑自动化到网络安全等等,智能建筑市场只会继续增长和完善自身,未来的发展将从根本上改变建筑及其使用者对未来办公室和校园智慧城市101开启转型新时代ByIsaacSutton如今,智慧城市已成为新的流行语。虽然就普遍受欢迎程度而言,这可能是件好事,但该主题的实际价值往往在翻译中丢失。通常被误解为一个能自动控制一切的魔法按钮,或HUAWEIHiCar最值得称赞的地方请想了解更多,请关注我白眼在EMUI11版本中,HUAWEIHiCar的音频应用通过模板方案接入,体验大大的提升!经过多次重复无差别的检验,本仙女个人最喜欢的,HUAWEIHiCa你的手机支持HUAWEIHiCar吗?快点开来看看吧目前官方支持手机型号大全,快来查看有没有你的手机型号吧!(10。28最新版本)Mate系列Mate40Mate40ProMate40ProMate40RS保时捷设计MateXMatHUAWEIHiCar官方答疑记录徐哥很有sense在花粉论坛11月10日组织的产品总监在线畅谈HUAWEIHiCar的活动中,华为消费者BG智慧出行总监徐镜进,徐总在线解答了花粉关于HiCar的众多疑问。链接htHUAWEIHiCar讲堂之ongoing卡片分享HiCar小知识,有趣有用!比心今天小仙女来分享ongoing卡片HiCar互联之ongoing卡片在连接HiCar车机后,用户可以看到一张音乐卡片导航卡片等这个就是ongoi为什么位置对网络运营商很重要联网设备在我们周围无处不在,提供各种各样的功能。每种网络的构建和设计都不同,并适用于各种网络类型,其中最常见的是蜂窝网络。由专门的运营商运营,客户订阅蜂窝网络,在他们连接的设备上提如何将您的物联网想法变为现实与从头开始构建内部物联网开发团队相比,一个富有创造力透明和巧妙的物联网开发合作伙伴可以更快更高效地交付成功的产品。物联网在过去几年中占据了技术发展的主要阶段。技术的进步和不断变化的香城号主题列车上线地铁5号线带你耍转新都珠链锦绣一座座村落如同珍珠,一条条绿道将其串联9月13日,一列名为香城号主题列车正式登陆地铁5号线。据悉,该主题列车以新都区乡村振兴代表项目珠链锦绣为主题,8节车厢分门别类呈现该景区网红打你还会喜欢吗?全新宝马7系或不再配备V12发动机日前,外媒曝光了全新宝马7系的动力配置信息。全新7系将搭载不同调校的3。0T发动机,其中的低功率版本将采用735i标识,高功率版本则采用740i标识。新车还将提供搭载4。4TV8发
海外租车市场趋热,安全教育成为平台新痛点近年,关于海外租车领域新风口的声音此起彼伏。Analysys易观发布的中国在线出境游市场专题分析2017提到,自驾游占出境游比例呈现爆发式增长,国人对海外租车的需求日益旺盛。从出境比亚迪联手华为推NFC车钥匙,明年再办全球开发者大会汽车的两大核心在于电动化和智能网联,汽车的个性不再是动力,也不再是造型。事实上,智能网联已经成为90后00后最看重的购买点。12月20日,2019年比亚迪技术体验创享会在广州召开,藤编花篮,让花草绿植成为一门艺术拥有古老发展历史,传统制作工艺的藤编,除了融合新的设计语言,成为时尚圈和家居圈的宠儿以外,它还可以回归本真,成为我们生活中最常见的手工艺品。老式藤椅菜篮手持蒲扇花篮等等,朴实无华的智能驾驶对标华为?智己汽车放出市区40分钟0接管视频关注并标星电动星球News每天打卡阅读更深刻理解汽车产业变革出品电动星球News作者毓肥今天上午,智己汽车微信视频号发布了一个视频,标题是自动驾驶离我们还远吗?本以为是个科普视频,一秒增添室内艺术气息,只需要一片艺术玻璃印象中,玻璃一直都是通透的模样,偶有磨砂和条纹样式,也依旧是素面的高雅款。但其实,在艺术家的眼中,玻璃不应该如此单一化,于是有了艺术玻璃的出现。艺术玻璃ArtGlass,选用彩色玻视频监控制造商IDIS收购KTPowertel44股权近日,韩国知名的视频监控制造商IDIS宣布,已经收购韩国电信公司KTCorp的无线通信子公司KTPowertel44。84的股权。KTPowertel作为韩国LTE宽带无线技术的领aampampamps视频监控品牌调查中国品牌全面占优IP摄像机是视频监控系统的核心,为了更好地了解市场,asmag。com进行了一项调查,让读者从三个维度(低照度全景网络安全)中选出他们最认可的三个IP相机品牌。调查结果显示,中国品基于雷达定位的视频联动系统的那些事雷达,是英文Radar的音译,源于radiodetectionandranging的缩写,意思为无线电探测和测距,即用无线电的方法发现目标并测定它们的空间位置。其应用范围从航空天气Rimac发布全球最速电动超跑C2,百公里加速1。85秒Rimac是一个克罗地亚的电动超跑生产商,咋一听大家可能不知道是哪个无名小厂。但Rimac最令世界瞩目的事情竟然是,theGrandTour三贱客的鼹鼠(RichardHammon微软精巧鼠标迷彩特制版发布重量78g售价179元近日,微软中国发布了微软精巧鼠标迷彩特制版,并且即日在中国市场正式上市。全新微软精巧鼠标迷彩特制版延续了微软对于用户体验以及生产力的追求,在为消费者带来舒适体验的同时,更是通过精准小鹏首次开放工厂,老车主说这是信心背书,更是智能标签出品电动星球News作者蟹老板毓肥这是信心和背书,也刷新了我对智能驱动理念的认知,小鹏就是一家追求极致产品力的企业,而这正是我想要的。直播完后,大包子狸这样跟我说。网名为大包子狸的