范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

从芯片到系统FPGA加速卡的发展历程与展望

  《AI先锋周刊》是—家关注人工智能学术研究、产业生态链、技术落地、边缘应用等维度的先锋电子新媒体。欢迎广大热爱AI的同道中人阅读、评论、转发、投稿,记得点击"关注",随时获取全球AI最新讯息。
  来源:老石 谈芯 半导体行业观察
  一个重要的趋势
  作为加速云数据中心的重要组件,FPGA已经开始了它在数据中心领域的广泛使用。除了像微软、亚马逊这样的大型云服务提供商之外,FPGA也逐渐开始进入其他类型和规模的数据中心,并在大数据处理、AI、网络功能加速等领域扮演者重要的角色。
  (图片来自英特尔)
  在这些基于大数据浪潮的全新应用中,FPGA厂商也在不断的探索和尝试新的FPGA推广方法。他们的最终目的非常简单,就是让更多的用户使用自己的FPGA产品。但在这个过程中,我们可以发现一个重要的发展趋势,那就是FPGA厂商正在逐渐的从单纯的芯片提供商,转变为系统级解决方案提供商。
  回首过去,在传统的FPGA业务模型里,FPGA厂商通常只负责卖给客户两样东西:一个是FPGA芯片,另外一个是FPGA的开发工具。两件东西一旦售出,客户开发何种应用就与厂商无关。虽然厂商也会提供详尽的技术支持,但主要的开发过程往往还是由客户完成。
  如今,FPGA厂商更倾向于提供给客户一个完整的系统级解决方案。两大FPGA厂商英特尔和赛灵思目前纷纷推出的各类FPGA加速卡,就是这个趋势的典型代表。
  总体而言,FPGA厂商在硬件层面已经不单单提供芯片级的产品,而是进一步提供板卡级的产品组合。与开发板不同,FPGA加速卡是针对特定领域和应用的专业板卡,通常以PCIe扩展卡的方式进行部署。板卡上设计有丰富的高速I/O接口与存储资源,但往往不会配备太多开发板上常见的调试功能与资源,例如通用I/O等。
  在软件层面,FPGA厂商除了提供传统的开发套件之外,现在还会提供与FPGA加速卡配套的驱动、各类软件库、编程接口(API),甚至还有下文会提到的完整的软件开发栈以及软硬件参考设计。
  通过提供这些完整的开发环境,大大简化了FPGA的开发难度,使得软件开发人员也能在短时间内完成算法模型的FPGA实现。FPGA厂商的主要目的,是在不断提供原厂软硬件解决方案的同时,也在不断吸收第三方的IP与应用,从而构建一个完整的FPGA生态系统。
  同时我们也注意到,除了FPGA原厂的加速卡方案之外,很多第三方厂家,比如华为、浪潮和Mellanox等,也相继推出了各自的FPGA加速卡产品。这些第三方加速卡虽然采用的都是英特尔或赛灵思的FPGA芯片,但都针对各自的细分领域做了优化设计,以适应目标应用的需要。
  在下文中,我将详细介绍一下当前在市场上主要的FPGA加速卡产品,以及各个厂商基于加速卡的FPGA生态系统布局。
  英特尔的FPGA加速卡布局
  早在2017年10月,英特尔就官宣了旗下的首款FPGA加速卡产品,名为"Programmable Acceleration Card",简称PAC。同时发布的,还有与之配套的软硬件开发框架与加速栈系统。这不仅是英特尔FPGA的首款通用FPGA加速卡产品,也是当时市场上的首款面向大数据、AI、高新能计算等新兴领域的数据中心FPGA加速卡,因此PAC的意义非同小可。
  (图片来自英特尔)
  在硬件规格方面,PAC使用了英特尔的Arria10 GX FPGA,它基于英特尔的20纳米工艺制造,拥有115万个可编程逻辑单元,是当时性能和容量最强大的英特尔FPGA。PAC集成了8GB的DDR4内存和128MB闪存,有一个QSFP+接口,能满足最高40Gbps的网络连接带宽,同时有PCIe Gen3 x8接口与主机CPU互联。
  (图片来自英特尔)
  值得注意的是,PAC的板级功耗约为45W~60W,因此得以采用了被动散热设计,从而将板卡的尺寸控制在了半高半长,方便在各类服务器的部署。
  PAC的主要应用场景是加速数据中心的各类应用,作为英特尔的原厂产品,PAC在数据中心里有着得天独厚的优势。它天生可以作为英特尔Xeon处理器的硬件加速单元,用于卸载和加速原本在CPU上实现的各类应用,从而构成英特尔CPU+FPGA的高性能数据处理组合。
  作为生态系统构建的重要组成部分,英特尔还发布了面向Xeon和FPGA的加速堆栈(Acceleration Stack),见下图。这个加速堆栈本质上是一个软件开发框架,包含了FPGA板卡的驱动、API、接口管理、软件库与开发工具等,从而为CPU与FPGA的联合开发提供了通用的编程接口,简化了开发流程,缩短了开发时间。
  (图片来自英特尔)
  为了向软件开发者进一步抽象底层的FPGA硬件资源,英特尔开源了名为"开放可编程加速引擎(Open Programmable Acceleration Engine - OPAE)"的技术。OPAE是一个层次化模型,提供了一系列标准的软件接口,以及常见硬件功能的FPGA实现,比如各类寄存器与内存分配逻辑等等。同时,也提供了很多操作系统内核空间的FPGA支持,使得开发者可以专注于用户空间的应用开发。
  (图片来自英特尔)
  PAC发布一年后,英特尔在2018年10月发布了另一款基于Statix10 SX FPGA的加速卡。相比前一代产品,这款加速卡在硬件性能上有了质的飞越。Stratix10作为英特尔的高端FPGA系列,基于英特尔的14纳米工艺制造,并采用了3D系统级封装技术,有着更高的集成度。在这款PAC采用的Stratix10 FPGA上,有280万可编程逻辑单元,244Mb片上内存以及高达26Gbps的串行收发器。
  (图片来自英特尔)
  板上资源方面,这款PAC包含32GB DDR4内存、两个最高支持100Gbps网络带宽的QSFP28接口,以及PCIe Gen3 x16接口。由于这个板卡面向更高性能的数据中心应用,因此在功耗和尺寸方面都有所增加,其中板级功耗约为225W,尺寸为全高、3/4长的双槽设计。
  (图片来自英特尔)
  在2019年MWC大会的第一天,英特尔又推出了一款针对5G应用的FPGA加速卡PAC N3000,见下图。这款加速卡可以实现高达100Gbps的网络流量的加速处理,同时支持9GB DDR4和144MB QDR IV板上内存。
  (图片来自英特尔)
  对于英特尔的FPGA加速卡产品而言,它们最大的优势之一就是英特尔在数据中心处理器领域的核心支配地位。由于英特尔Xeon处理器占据了数据中心市场的x86处理器的绝大部分市场份额,因此无论何家的FPGA加速卡都必须针对Xeon处理器做大量的兼容性设计和优化,而英特尔FPGA在这方面有着先天的血统优势。这也使得英特尔成为目前唯一一个能够提供全栈式数据中心解决方案的公司。
  此外,英特尔与各大服务器制造商保持着良好的合作关系,因此包括戴尔、HPE、富士通等服务器制造商会很自然的在自家的服务器产品中加入并销售基于英特尔FPGA的加速卡。然而,这对于其他FPGA厂商而言就没有那么水到渠成,他们往往很难说服服务器厂商或者客户在已经内置了FPGA的服务器中,再花费额外的成本,并冒着兼容性的风险去添加其他的FPGA加速器。
  赛灵思的FPGA加速卡布局
  赛灵思的FPGA加速卡产品起步相对较晚。在2018年10月,赛灵思才正式发布了旗下首款面向数据中心应用加速的FPGA加速卡产品,名为Alveo。首批推出的Alveo U200和U250板卡均基于赛灵思的16纳米UltraScale FPGA器件,分别拥有89.2万和134.1万个可编程逻辑单元。在FPGA器件方面,这两款Alveo卡与英特尔的PAC相比,可以说在伯仲之间。
  这两款板卡主要针对的都是大型数据中心应用,因此板上集成了64GB DDR4内存,以及两个QSFP28网络接口和一个PCIe Gen3接口。与PAC相比,这两款板卡的板级资源要丰富的多。然而,这也导致Alveo板卡的外形尺寸和功耗都比较大。当采用主动散热时,板卡尺寸为全高全长,标准功耗为100瓦~110瓦,功耗峰值可达225W,远超过PAC的45W~60W。
  (图片来自赛灵思)
  在生态系统建设方面, Alveo加速卡将主要基于赛灵思的SDAccel软件进行开发。SDAccel是一个集成的开发环境,它的主要结构层次如下图所示。
  SDAccel最主要的特点之一是包含针对诸如C/C++和OpenCL等高层次语言的FPGA编译器、软件库和API等基础架构,以期帮助软件开发者更快的对FPGA硬件进行开发。这一点,与英特尔的面向Xeon和FPGA的加速堆栈有异曲同工之妙。这也印证了当前FPGA软件系统发展的趋势,就是需要不断降低FPGA开发的门槛,通过尽量多的提供高层次语言的支持,以提高FPGA的开发效率,缩短产品面世时间。
  (图片来自赛灵思)
  第三方的FPGA加速卡
  除了英特尔和赛灵思推出的原厂FPGA加速卡之外,很多第三方厂商也在近年相继推出了基于FPGA的硬件加速卡产品。其中比较典型的有我国浪潮、华为等公司推出的加速卡,以及国外Mellanox公司推出的基于FPGA的智能网卡产品。
  浪潮的F10A FPGA加速卡是目前在售的一款FPGA加速卡产品,见下图。它采用了英特尔Arria10 FPGA,最多包含115万个片上可编程逻辑单元。加速卡上提供了两个SFP+ 10Gbps以太网端口,PCIe Gen3x8接口,以及最高32GB板载DDR内存。
  (图片来自浪潮)
  在2018年10月底的赛灵思开发者大会上,浪潮和华为都发布了自己的新FPGA加速卡产品,分别叫做浪潮F37X和华为FX系列,如下图所示。
  (图片来自浪潮)
  (图片来自华为)
  这两款加速卡都采用了赛灵思的16纳米UltraScale+ FPGA器件。相比赛灵思的原厂Alveo加速卡,这两款加速卡产品的主要特点是功耗得到了进一步削减,这可能得益于FPGA芯片规格的提升。例如,浪潮的F37X加速卡的典型功耗只有75瓦左右,而华为的FX系列的中端加速卡的典型功耗最大为75瓦,高端卡为200瓦。
  在其他技术规格方面,浪潮F37X加速卡使用的FPGA集成了8GB的HBM2片上高速缓存,相比DDR而言,能大幅提高存储带宽和访存效率。相比Alveo,新推出的这两类第三方加速卡都有着更高的片上逻辑单元数量,足以应对各种新兴的数据中心计算与应用场景,比如机器学习、视频编解码、NFV、图像与语音识别等等。
  老石在之前的文章《Mellanox为何让多家巨头公司趋之若鹜》中介绍过,Mellanox是一家总部位于以色列的著名的网络设备供应商,旗下产品包括网络控制芯片、网卡、线缆、交换机、软件等等,可以说几乎涵盖了数据中心网络产品的各大门类。Mellanox的基于FPGA的智能网卡产品名为Innova-2 Flex,见下图。
  (图片来自Mellanox)
  这款智能网卡上包括两个主要芯片,一个是Mellanox的ConnectX-5以太网控制器,另一个是Xilinx的Kintex UntraScale FPGA。板上包含两个25G以太网端口,都与ConnectX-5相连,然后再通过PCIe Switch连接Host和FPGA。ConnectX-5本身就可以实现不少硬件加速功能,比如常见的虚拟交换、SRIOV、QoS与流量控制等。因此FPGA在这个卡上更像是一个"辅助"的加速单元,主要的设计目的是用来实现和加速各种CPU上不支持、或性能较低的定制化需求。
  结语
  在今天,FPGA厂商已经从单纯提供FPGA芯片和底层开发工具,逐渐转变成提供基于FPGA加速卡和完整软件开发环境的全栈式解决方案。同时,第三方FPGA加速卡的出现,也极大的丰富了FPGA加速卡产品的可选择性,以针对不同应用场景下的用户需求。
  这些转变背后的主要动力,就是当前FPGA在诸多领域的广泛而深入的使用。只要FPGA还能不断推动AI和大数据时代的发展,这个趋势就会继续前行。

小米鼻孔屏专利曝光动刀前置摄像头,挑战刘海屏当下智能手机市场都在追求极致全面屏化的高占屏比。自从苹果iPhoneX大胆地启用宽刘海开槽之后,Android厂商也八仙过海各显神通,推出了水滴屏,美人尖,前后双屏,升级摄像头和滑iPadmini5被吐槽为最没有创新的产品,而现实是真香啊在苹果今年春季新品发布会上iPadmini5正式亮相,在外观来看并没有融入当今的全面屏趋势,依旧是苹果的老样子。但在这7。9英寸机身里面蕴含着非常强大的性能,配备了更强悍的A12处老二必死,人人车面临倒闭,优信瓜子二手车疯狂烧钱,谁是老大?懂财帝原创作者朱琼华去年,二手车平台人人车创始人李健曾与滴滴创始人程维有过一番对话。程维问你们2016年Q3出现失误,原因是什么?李健的首次回答并未让程维满意。当时,人人车正在寻求全球最赚钱公司出炉!这家超级巨头净利润达1110亿美元是苹果两倍谁是全球最赚钱的公司呢?近日,国际评级机构惠誉的一份账目摘要公布了这个答案,这家公司就是沙特阿拉伯国家石油公司(简称沙特阿美)。它是目前世界上探明储量最大的石油公司,拥有全世界最大屏占比93!诺基亚X71发布骁龙6604800万蔡司三摄这个应该是目前诺基亚屏占比最高的手机了。就在刚刚,HMD在台湾地区发布了新的中端机型NokiaX71。这款手机最明显的特征,就是正面这块今年颇流行的打孔全面屏。官方表示屏占比高达9任正非要求HR改革每个HR都要上战场去开几炮,打不准就下岗猎云网(微信号)北京4月2日报道近日,华为最新发布了任总在总干部部务虚会上的讲话,要求人力资源及干部管理勇于改革适当改革,并不是否定过去,而是时代所迫,是追求更高的目标。任正非强调7212亿人民币!华为一年营收超腾讯阿里总和3月29日上午,华为发布了2018年财报。财报显示华为2018年全球销售收入为7212亿元人民币,超过腾讯与阿里总和。首次迈过1000亿美元大关2018年华为全球销售收入7212亿格力股权变更突停牌,解析背后的神秘买家格力电器选择在4月1日这一天突然停牌,理由非常很简单目前正在计划控制权变更事项,所以要停牌。控制权的变更,对于这个家电巨无霸来说,是一个影响重大的事情,关键的问题是怎么变。有消息传捷利交易宝(8017。HK)获重要股东自愿禁售两年承诺,彰显长期发展信心4月22日,领先的金融科技公司捷利交易宝(8017。HK)发布了两则自愿性公告。公告称,为了表明对公司长期发展充满信心,若干有关股东已各自自愿向公司就彼等于公司股份中所直接及间接持虚拟货币在非洲受青睐来源参考消息网参考消息网4月24日报道据日本经济新闻4月21日报道,在非洲,加密资产(虚拟货币)用户激增。在截至1月的过去一年内,包括比特币在内的虚拟货币用户数增至原来的25倍,个这些App违规违法!快看你手机上有吗国家计算机病毒应急处理中心近期通过互联网监测发现17款移动App存在隐私不合规行为,违反网络安全法个人信息保护法等相关规定,涉嫌超范围采集个人隐私信息。1未向用户明示申请的全部隐私
亚马逊ERP系统是什么?如何管理亚马逊店铺?赛狐erp是美云集网络科技有限公司基于多年的跨境电商软件服务经验,为亚马逊卖家量身打造的一款精细化运营系统。赛狐为亚马逊卖家提供一站式服务,主要功能有运营分析财务核算广告管理进销存香港维多利亚港上空出现的UFO究竟是什么?从80年代起,香港每年都会有UFO的目击事件报告,不过这么多年来,也从来没有人拍到清晰的UFO图片,也没有人目击过UFO降落。所以所有的真相还有待后续的相关公告。12月6日下午4点如何评价Windows10呢?题主您好,小白系统为您解答问题,如果对您有帮助,请关注小白系统头条号全新的Windows10将是一个大一统的操作系统,无论任何设备都能获得极佳的体验,而且微软正式修改了Window现在去营业厅买手机,老是要送个号码,用一段时间可以取消,这是什么套路啊感谢您的阅读!办卡容易,但是注销困难!虽然欠费停机三个月后,运营商会对你的电话卡进行注销,可是所产生的欠费和违约金可需要你支付,你不知付的话,不但会被标上黑名单用户,而且可能将你拉尼康D800还能打吗?尼康D800自2012年初上市,后续陆续又发布了该系列的D800ED810D810AD850,我于2014年初购买D800,现在依然是我拍照片的主力。拥有1424F2。8G2470富可敌国!苹果市值逼近3万亿,库克打造了乔布斯无法做到的神话谈起苹果,很多人都说乔布斯之后再无苹果,那么事实上真的如此吗?并不然!要看你用什么样的眼光去看它。你说如今的iPhone13没有设计吗?它却能够卖爆销量,甚至官网都被中国消费者抢到iPhone将会支持微软xCloud云游戏目前微软的xCloud云游戏已经来到众多的设备平台上,比如说PC手机平板以及XboxOne都可以通过xCloud游玩到新一代的游戏,不过对于苹果用户来说却不是一个好消息,原因是之前听力下降不戴助听器可以吗?您好!如果听力下降已经定性,建议您早发现早干预,因为听力下降了生活中很多声音听不到了或者变弱,会影响交流,会导致听觉功能退化,分辨能力下降。建议您早期佩戴助听器,延缓听力的衰退,可各品牌5000元以上的手机盘点,哪个更优秀?如今各厂商都想在高端手机领域分一杯羹,纷纷发布5000元以上的手机,而5000元就成了手机价位的分水岭,在市面上超过5000元的基本都是各家品牌的高端旗舰机型,也是各厂商科技实力的为电动爹加装柴暖!那群盖着被子开车的车主也扛不住了近日,在北方地区,有一些车主开始为自己的电动汽车加燃油空调。这些人大部分都是出租车司机或者网约车司机,其中还有红旗的eQM5为了吸引司机换车,宣传可以免费为车主加装柴暖。很多网友都哪个瞬间让你突然觉得社会生产力进步了很多?高举毛泽东思想伟大祺帜,坚定走社会主义道路,使全国人民共同富裕,使共产党人的初心。毛主席时代社会生产力发生空前史诗般的进步,是新中国不同于旧社会质的巨变,是人类社会与一切剥削社会形