范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

芯片设计上云弹性计算篇

  引言:
  心之官则思,思则得之,不思则不得也。
  -- 《孟子·告子章句上·第十五节》
  1- 弹性计算的需求
  在芯片项目研发过程中,随着设计流程的推进,在不同的项目阶段,对算力的需求呈现非线性的需求特征。
  项目资源需求曲线
  一般来说,后端算力需求大于前端算力需求,以一个开发周期为11个月的14nm芯片项目为例,分别从全项目、全后端、STA这三个需求场景来看,其对算力和存储的需求体现为下面的图表:
  图二:项目算力需求曲线
  图三:项目存储需求曲线
  可以看出,在芯片设计过程中,从成本优化、运维管理、资源调度等方面来说,"弹性计算"是一个不可回避的"刚性需求"。
  伴随着2006年"云计算"这个新模式术语的出现,芯片设计上云给芯片设计"弹性计算"的需求提供了一个可行的技术解决方案。随着2016年半导体行业出现典型性上云案例以来,如何实现"弹性计算"就一直是一个吸引从业人员在研究和探索的专题。
  从2018年起,笔者基于各大云厂商的芯片设计上云方案进行了大量的测试研究和项目实践,并于2019年和2020年发表了两版关于芯片设计上云的技术白皮书。本文我们将基于Azure的弹性云计算方案进行阐述。
  左图:芯片设计云计算白皮书1.0
  右图:芯片设计云技术白皮书2.0
  2- 基于Azure实现弹性计算方案
  在传统的芯片设计环境中,计算平台管理是CAD六大管理核心职能之一,它依赖IT硬件底层的支撑,解决了计算集群配置与运维的核心问题,并与其它五个方面进行配合,从而满足更高效、更安全的大量EDA计算的需要。
  图六:CAD管理核心职能图
  大多数芯片设计公司仍以本地计算集群为主构建计算平台,他们大多数是采用集群调度工具IBM LSF来搭建整个HPC高性能计算集群。CAD管理内容的其他几个方面,往往也都是基于这样的底层架构来进行定制化管理,包括设计流程自动化、EDA工具与调度工具的集成、设计环境标准化、设计数据管理的标准化、License管理和调度等。
  图七:EDA高性能计算平台的逻辑架构图
  在本地化的静态计算集群的方案中, IBM LSF这类作业调度工具已经是非常成熟的方法了,在行业中已经沿用了20年。然而对于弹性计算来说,仅仅IBM LSF还不够,还需要云端有一个可以配合的HPC部署和管理工具,将LSF的指令与云端的对象进行联动,才能实现真正的无缝无感的弹性方案。
  Azure云平台上提供了一个Cyclecloud工具,Cyclecloud是一个帮助在云上构建HPC系统的工具。它对这些系统进行了编排,使它们能够根据手头的HPC任务灵活地调整大小,而无需管理基本的云构建模块。Cyclecloud是由一个经验丰富的HPC专业团队为HPC管理员和用户设计的,特别是那些希望在云中构建类似他们熟悉的内部HPC基础设施的HPC系统的用户。
  Cyclecloud提供了一个丰富的声明性模板语法,使用户能够描述他们的HPC系统,从集群拓扑(集群节点的数量和类型),到将部署在每个节点上的挂载点和应用程序。Cyclecloud设计用于与IBM LSF、PBSPro、Slurm、Sun Grid Engine和htcondor等HPC调度程序一起工作,允许用户在每个调度程序中创建不同的队列,并将它们映射到Azure上不同VM大小的计算节点。此外,autoscale插件与调度器头节点集成,调度器头节点侦听每个系统中的作业队列,并通过与应用服务器上运行的autoscale rest api交互来相应地调整计算集群的大小。
  3-Cyclecloud 相关介绍
  功能详解
  AzureCyclecloud 是在 Azure 中部署 HPC 集群并管理其工作负载的工具。它提供各种 HPC 功能,包括:
  基于模板的 HPC 集群部署。AzureCyclecloud 为最常见的作业调度程序(包括 Slurm、OpenPBS、LSF、Grid Engine 和 HTCondor)的部署提供可自定义的内置模板。Cyclecloud GitHub 存储库中提供了许多其他预定义模板,你可以将其导入 AzureCyclecloud 实例中。
  图八:Azure CycleCloud用户图形界面
  模板是 INI 格式的文件,使用声明性语法来描述节点在Cyclecloud 集群中的组织方式,包括其各自的关系。模板包含对定义节点配置的项目的引用。
  手动和自动缩放集群节点。AzureCyclecloud 允许根据作业队列的长度和治理策略,手动和自动对托管集群进行水平缩放。它还提供了用于为自定义作业调度工具开发自动缩放适配器的 REST API。
  通过 cloud-init 脚本进行节点配置。AzureCyclecloud 支持基于自定义脚本的配置管理,在所有其他特定于Cyclecloud 的配置任务之前,这些脚本在托管集群节点中运行。
  管理内部和外部集群存储。AzureCyclecloud 允许你通过预配、装载和格式化 Azure 托管磁盘和网络连接存储(例如 NFS 服务器或 BeeGFS 集群)来配置集群存储。
  监视、记录和警报。AzureCyclecloud 提供内置的集群监视功能,并与 Azure Monitor 集成。还可以将Cyclecloud 集群中的日志数据存储到 Log Analytics 并创建自定义指标仪表板。还可以创建由遥测数据触发的自定义警报和电子邮件通知。所有 AzureCyclecloud 活动都会记录。
  图九:Azure CycleCloud集群监控界面
  身份验证和授权。AzureCyclecloud 支持内置的本地身份验证。或者,可以将它与 Active Directory Domain Services (AD DS) 或其他基于轻型目录访问协议 (LDAP) 的标识提供程序集成。默认情况下,本地定义的用户可以访问托管集群节点上的操作系统,但也可以单独管理集群用户。
  准实时成本报告和控制。AzureCyclecloud 跟踪集群使用情况并估算相应的成本。此功能允许你设置当集群成本超过指定货币金额时触发的预算警报。AzureCyclecloud 也可与 Azure 成本管理集成。
  弹性计算集群生命周期
  用户可以根据芯片设计需求自定义"弹性计算集群生命周期":
  集群的生命周期从选择包含其定义的模板开始。可选择使用其中一个内置模板,也可以创建一个自定义模板,然后将其导入Cyclecloud 应用程序。该模板通常包含多个参数,可用于在其创建期间自定义集群配置。
  创建集群后,可启动它。启动集群将为基于集群模板的定义中的每个节点触发一系列任务。此序列包括对请求预配 Azure VM 的 ARM 的调用,称为"获取"状态。接下来是 VM 的配置,包括执行在相应项目中定义的初始化项,执行脚本以安装和配置计划软件,以及预配和装载文件系统卷。序列完成后,节点将进入"已启动"状态。
  集群节点运行后,可以通过作业调度系统提交集群作业。
  在集群完成所有已提交的作业后终止集群。终止集群会停止和删除其节点,并删除任何非永久性卷,使集群处于"关闭"状态。
  与作业调度系统集成以及自动缩放
  自动缩放资源数量以满足用户使用模式是"云计算"敏捷性的核心组成部分,用户可充分利用 Azure 的超大规模功能,同时最大限度地降低与使用计算资源相关的运营成本。通常,作业调度工具(IBM LSF)负责协调集群节点的缩放,Azure Cyclecloud负责向提供计算资源的平台传达其需求。
  Azure Cyclecloud 允许将托管集群的自动缩放行为与集群作业队列的长度关联起来,用户可以定义用于控制空闲节点终止前的时间长度或自动停止检查频率等的模板参数,进一步自定义此行为。所有内置模板直接在 Azure Cyclecloud 图形界面中公开自动缩放设置。在每种情况下,这些设置包括用于指定自动缩放范围下限和上限(以 CPU 核心数表示)的选项。上限可最大程度地降低意外收费的可能性。
  如果将下限阈值设置为 0,则创建集群只会配置作业调度工具头节点。当作业调度工具检测到已排队的作业时,它将启动执行相应工作负载所需的计算节点的预配,直至达到定义的限制,并将在第一个节点可用时立即开始运行作业。在作业队列清空时长超过了允许的空闲时长后,计算节点将开始自动停止,并且集群将再次只包含作业调度工具头节点。
  实现与Azure Cyclecloud自动缩放集成的两个主要组件是AzureCyclecloud自动缩放库和需求计算器。Azure Cyclecloud还提供基于REST API的编程接口和基于Python的客户端库,简化了相应作业调度工具的自动缩放功能的开发。
  IBM LSF已利用这些API做了很好的集成,对于LSF管理员来说,只要在LSF的配置文件中做相应的设置,便能在Azure上直接实现"弹性计算"的功能,并且这种"弹性计算"对于用户来说是无感透明的,用户无需关心所使用的计算资源是本地的还是Azure上的。
  4- 案例分析
  今年我们刚刚帮助一家大型芯片设计公司完成了基于Azure的弹性算力方案,采用的就是LSF 与Cyclecloud的组合工具,实现了一个完全自动化伸缩的动态集群方案
  图十:LSF +Cyclecloud案例图
  需求背景:
  用户ITCAD部门打造混合云,利用本地的机房进行运算,弹性高峰期间会启用云上服务,给设计部门提供灵活的算力供给方案,芯片设计业务以后端设计为主。
  采用机型:
  E48sv4(48vCPU/384GiB RAM)
  M64s(64vCPU/1024GiB RAM)
  M128s(128vCPU/2048GiB RAM)
  弹性伸缩策略:
  1)集群的负载(cpu或者内存使用率)阈值超过90%或者无可用slot时启动新节点安装.
  2)针对不同队列或特定任务,配置对应机型:
  轻量任务队列Light:E48sv4
  中型任务队列Medium:M64s
  大型任务队列Lager:M128s
  3)集群设定总可使用vCPU核数来限定动态节点数目:
  比如将集群总核数限定在5000核,则单E48sv4机型最大可用104台,单M64s机型最大可用78台,单M128s机型最大可用39台。集群中机型共享总可使用核数。
  4)静态集群和动态集群的动静结合策略:
  将谷峰资源使用量配置为静态部署,波峰资源使用量配置为按需动态生成。
  5)动态集群缩容策略:
  设定动态计算节点空闲时间可以有效回收资源,节约成本。
  图十一:创建动态节点的系统过程
  计量计费方法:
  CPP+OnDemand 组合:
  CPP(Compute Pre-Purchase):年预付费计算实例价格,不同机型具有不同的优惠折扣,所有机型均支持一年CPP,部分机型支持3年CPP。适用固定任务需求场景。
  OnDemand(即用即付):标准预付费价格,无最低使用时间限制,适用临时型需求场景。(作者:摩尔精英王汉杰 )
  随时联系我们 MooreElite
  官网:www.MooreElite.com;
  邮箱:info@MooreElite.com;
  电话:021-51137892
  如果您有
  芯片设计
  流片封测
  教育培训
  等业务需求
  今天是《半导体行业观察》为您分享的第2826内容,欢迎关注。
  晶圆|集成电路|设备|汽车芯片|存储|台积电|AI|封装

看清资本的套路贪心恐惧心金融和借贷想看明白一个人的真实目的,不要听他在说什么,一定要看他在干什么,就是钱最后被谁拿走了,这就是利益分析法!一般说得越冠冕堂皇慷慨激昂的人,背后都有不可告人的目的!一资本的尽头是金融,婚姻是为保护女人,不是为伤害女人!建立自己的家庭福利保障体系女权主义经济独立物质享受现在女权主义宣扬嫁人就是免费保姆,生孩子更是吃大亏,很多女人不结婚不生孩子离婚出轨,追求经济独立物质享受,已经成了很多女人的价值观。我们不先说这种观念是对是让好人赚钱,让有良心的人发财!从人在做天在看,到人在做数在算清华北大,不如胆大过去想赚钱发财,需要的胆大脸厚心贪,什么清华北大都不如胆大,是野蛮生长的时代,有钱就是大爷!而在数字化时代,是好人赚钱,有良心的人才能成为社会上的有钱人!一科技改怎么现在感觉科技越来越发达,赚钱却越来越难了,为什么呢?无人驾驶科技越发展,赚钱越简单,因为科技带来更多的机会!但是为什么现在的人感觉工作越来越不好找了哪?未来工厂都是自动化机器,高速没有收费员,超市都是扫脸收费,快递都是无人机配送,出做生意是为了赚钱还是创造价值?做生意是为了赚钱还是创造价值?有人说,那不是废话吗?不为赚钱做什么生意!但是你看今天,做生意的人赚到钱的人多吗?大街上多少倒闭的店铺,多少人做生意负债累累,多少人是靠银行贷款维持生不卖东西!现在做什么生意,既不用投资又能快速地赚到钱?现在有没有一种生意,既不用投资又能快速地赚到钱呢?很多人说,这种事都写在刑法里了,赚这个钱的人都在吃牢饭了。其实不是不可能!大家想一想,哪些主播凭什么一场直播下来能赚成百上千万哪?免费送!2000个社区,3000位嘉宾的大会展位火热征集中前段时间中央的讲话带动了区块链的蓬勃发展,交易所的需求更加旺盛,市场竞争之大可想而知,此时域名就显得尤为重要。一个简短好记的域名,会更得终端和投资人的青睐而且也能让用户印象深刻。在得客户者得天下,客多多携极品域名ke。cn重磅上线!近日,域名圈与房产行业又发生了一个重磅新闻客多多创始人王总收购了极品两字母域名Ke。cn,将建站客多多找房平台。现在访问Ke。cn,就已经显示客多多找房即将上线的消息了。众所周知,生鲜电商争相上市,夺取第一股的关键是?随着疫情对消费习惯的改变,生鲜电商似乎迎来了第二春。近日来,生鲜电商领域的玩家们相继传出IPO消息。近日,叮咚买菜每日优鲜多点DMALL美菜网等多家生鲜电商或相关企业,纷纷与融资赴中国行,我也行?莫迪立志造印度卫星导航系统,誓言抢走中美生意科技的发展给民众的日常生活带来了诸多的便利,例如从前你要去一个陌生的地方,可能需要一个熟悉路线的人带领你去,但是现在你只需一部智能终端,输入目的地,然后卫星导航系统就可以为你规划线美国生意被中国搅黄?英企撕毁美企合同,美媒发生在中企收购后据美媒CNBC8月13日报道,日前一家美国半导体公司自曝被英国公司毁约,对方在被中资企业收购后突然变脸宣布终止与其的商业合同。这家美企还抱怨,按照市场惯例,在终止合同前对方通常会提
人造太阳的成功只是一个时间问题TokamakEnergy16November2021InterestingEngineeringByChrisYoung,Dec13,2021在上月举行的美国物理学会等离子体物理长征火箭助力探月工程在中华民族敢上九天揽月的追梦征程中,中国运载火箭技术研究院负责研制的长征三号甲运载火箭长征三号丙运载火箭长征三号乙运载火箭长征五号运载火箭凭借出色的适应能力强大的运载能力丰富的发射想过你是由什么组成的嘛?人类和其他物体在理论上来说,都只是原子的集合。成年人的身体大概有7,000,000,000,000,000,000,000,000,000个原子。(7后面有27个0)原子众所周知,火星有地球没有的一个特征极地大沙丘对于天文摄影爱好者来说,KevinM。Gill无需介绍。即使您不了解最新的天文新闻和发展,这些年来您很可能仍然看过他的一些照片。从美丽的艺术家演绎到令人惊叹的遥远行星照片,Gill天文学家可能已经解决了2018年的蓝色宇宙牛之谜2018年,全世界的天文学家都在盯着他们望远镜上的一个奇怪的信号在虚无的太空中出现的耀眼蓝色闪光。它看起来像一个恒星爆炸,但它的亮度却莫名其妙地高出几个数量级。它不符合任何已知的超NASA(美国宇航局)计划10年内在月球上建造一座核电站借用欧洲航天局的永久月球基地假想图(图片来源ESAFosterPartners)如果您或您的朋友知道如何建造一个铀动力核反应堆发电站,可以装入12英尺长x18英尺宽(4x6米)的火俄罗斯成功发射两颗电信卫星据塔斯社12月13日报道,俄罗斯国家航天公司Roscosmos首席执行官德米特里罗戈津(DmitryRogozin)12月13日宣布,俄罗斯质子M运载火箭正常从拜科努尔航天港发射了智人的智慧有多强?导读时间倒回约十多万年前,多种古人类和我们的智人祖先共同生活在地球上,这些古人类包括我们的近亲尼安德特人和丹尼索瓦人,还有不久前被中国科学家发现并命名的龙人。他们在外观和生活方式上在中子星内部的奇异物质,是如何形成的?有何特性?宇宙中存在着许多的奥秘,人类现在的科技就连带人离开太阳系都做不到,更别提探索广袤无垠的宇宙了。出于对宇宙的好奇,科学家发明了射电望远镜,让人类的眼睛看得更远。于是我们发现了黑洞中子宇宙中什么样的物质是最为坚硬?有不少人都会认为在地球上的金刚石或许是目前硬度比较大的一种物质,可是如果把金刚石放到宇宙上,显然微不足道。宇宙中最硬的物质,即便是中子星的岩石,再加上它飞快的旋转速度,就能够在短时维特根斯坦错了,螺旋即真理真空是空无一物吗?很长时间物理学家认为真空里什么都没有。直到狄拉克的相对论性量子力学方程。预言了正电子和反粒子的存在。虚粒子包含正反粒子,用虚数表述。发明虚数的笛卡尔没想到虚粒子真