范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

瀚博首款AI推理芯片出炉,性能超越英伟达T4,年内即将量产

  机器之心报道
  作者:泽南
  瀚博推出的 AI 推理芯片,性能超过英伟达最新的 A10 与 T4,同时使用成本还更低。
  7 月 7 日,在上海举行的首场发布会上,芯片创业公司瀚博半导体展示了旗下最新产品,SV100 系列云端通用 AI 推理芯片和 VA1 通用 AI 推理加速卡。刚刚推出的芯片实现了业内领先的性能指标。
  瀚博半导体 CEO 钱军在发布会上展示 SV102 芯片。
  「我们要做的是服务器级别的芯片,SV100 系列是全方位超过英伟达同类产品的芯片解决方案。」瀚博半导体创始人、CEO 钱军在发布会上说道。
  本次推出的产品包括芯片 SV102,以及基于该芯片的 AI 加速卡 VA1,即将在今年第四季度投入量产。
  云端通用 AI 推理芯片
  瀚博推出的 SV102 是 SV100 系列的首款芯片,它面向云端的 AI 的通用化推理任务,INT8 算力高达 200TOPS,其内含多颗瀚博自主设计的 IP 核,配备通用软件栈,对于云计算客户提供了完整的解决方案。
  选择推理作为突破点,是瀚博对于市场和业内竞争力分析之后作出的决定。
  随着 AI 应用的逐渐成熟,落地业务的增多,目前云服务市场上推理任务的需求逐渐超过训练。相关数据显示,2021 年 AI 推理市场已超过训练市场,未来其差距还会逐渐拉大。高通则认为到 2025 年将有 90% 的算力将被用于机器学习推理。
  而在推理任务上,相对更加专精的 DSA 芯片性能显著超过目前业内普遍采用的 GPU,前者可能会成为芯片领域的下一个发展方向。
  瀚博提出的 SV100 系列芯片,对于视频任务进行了特别的优化。当前,计算机视觉任务占据了 AI 市场的大部分,视频流占据数据流的 70%,而且比例持续攀升。这些任务需要强大的视频解码能力,对于处理延迟、吞吐量和能耗效率提出了较高要求。
  SV102 是一款高性能人工智能与视频处理芯片,深度学习推理性能指标数倍于现有主流数据中心 GPU(如英伟达 T4、A10)。基于瀚博自研的,针对多种深度学习推理负载而优化的通用架构,该芯片支持计算机视觉、视频处理、自然语言处理和搜索推荐等推理应用场景,同时集成高密度视频解码,广泛适用于云端与边缘解决方案,节省设备投资、降低运营成本。
  通用 AI 推理加速卡,效率超越英伟达
  基于 SV102 芯片,瀚博推出了适用于云服务器的 VA1 机器学习加速卡,其提供高效率深度学习 AI 推理加速,在同等能耗下可以实现 2-10 倍于 GPU 的最高 AI 吞吐率,适合实时应用,同时兼备良好的通用性和可扩展性,支持 FP16, BF16 和 INT8 数据类型的众多主流神经网络快速部署——包括检测,分类,识别,分割,视频处理,LSTM/RNN,NLP/BERT,搜索推荐等。
  瀚博半导体 CTO 张磊向我们介绍了 VA1 加速卡的性能指标。
  VA1 具备强大的视频处理性能:支持 64 路以上 H264,H265 或 AVS2 1080p 解码,分辨率支持最高达 8K。另一方面,作为标准半高半长 75W 功率的 PCIe 4.0 板卡,VA1 适用于绝大多数服务器,被动散热且无需额外供电,可实现高密度的部署。
  和英伟达最新发布的安培架构 A10 板卡对比,在 ResNet-50(int8)任务上,瀚博芯片在 75W 功率时效率是对手的两倍以上。「即使英伟达的产品运行在 150W,我们的芯片运行在 75W 功率时性能也是超过它的,」张磊介绍道。「在 BERT int8 任务上,VA1 的性能也是 A10 在 75W 上的两倍,T4 的两倍多。」
  如果以整体运行成本 TCO 的方式来计算,采用 VA1 的服务器整机算力可以达到 T4 设备的 2.5 倍以上,功耗却相对更低,可以节省超过 60% 的服务器成本。
  除了硬件产品外,瀚博也搭建了自己的 VastStream 软件平台,支持 TensorFlow、PyTorch、Caffe2 等主流深度学习框架模型。
  今年 6 月,SV100 系列芯片宣布测试成功。瀚博创造的几个数字引人关注:在开始测试后 8 分钟全部点亮,在 40 小时之内,芯片所有功能模块基础测试全部完成。对于全新设计的高端芯片来说,这是一个奇迹。
  「我们与重要合作伙伴快手的合作非常紧密。打造芯片必须理解客户的实际需求,我们打造了高性能的数据中心,会把最新的板卡插在服务器里,跑各类实际应用,验证产品的性能。」钱军表示。据介绍,目前已有多家国内外科技公司正在和瀚博合作,并等待芯片的大规模量产。
  除了 SV102 以外,瀚博半导体还计划推出功率为 15W 和 150W 的推理产品,覆盖更多市场。
  「我们不是一个国产替代的故事,我们希望打造国际级别的产品。为了这样的目的,我们组建了有能力的团队。」钱军说道。
  瀚博半导体于 2018 年底成立于上海,目前在北京、深圳、多伦多等地均设有研发中心。
  这家公司的核心团队源自于 AMD,部分成员曾设计了业界首款 7nm 制程 GPU。自公司创立起,瀚博一直致力于核心 IP 的自主研发,至今已完成多个 IP、高端设计流程,并拥有完善的数据中心构建能力。目前,瀚博的员工总数已超过 200 人。
  在融资方面,2019 年 3 月,瀚博获得了来自真格基金的天使轮融资,2019 年 7 月完成 Pre A 轮。2020 年 7 月,红点、快手领投了该公司的 A 轮融资;最近一轮则在今年 3 月,由中国互联网投资基金和经纬中国联合领投,融资金额高达 5 亿元人民币。
  瀚博旗下首款芯片的推出,宣告了国内 AI 芯片业内又加入了一股强大的势力。随着各家的 DSA 芯片不断出炉,国内造芯的竞争已经进入了全新的阶段。

NASA的机智号火星直升机,在第四次空中冒险中打破了先前记录美国宇航局的火星直升机不断超出预期。Ingenuity(机智号)在周五完成了第四次飞行,在火星表面的飞行距离比以往任何一次都要远。(图源Unsplash)美国宇航局的工程师们已经准基于五大原因火星上飞直升机难度大侨报记者李青蔚洛杉矶报道在火星上飞直升机要比在地球上飞直升机难很多,美国国家航空航天局喷射推进实验室(JPL)首席工程师彭家彦博士说,两者之间的难度之比超过5倍。这主要是基于一火星3年后或成世界唯一!中国空间站入轨,会拒绝美国的加入申请吗?中国航天工程的空间站项目天和号核心舱,于4月29日成功发射并入轨,接下来还要通过一系列的舱段发射和货运飞船发射,进行对接与物资运输,预计空间站将于明年正式组装完成。距离50年前,苏机智号火星直升机有了新使命寻找生命外媒称,美国国家航空航天局(NASA)的小型火星直升机机智号将进行更多飞行,将预先为毅力号火星车进行侦察,协助它寻找以往的微生物生命迹象。据美国纽约时报网站4月30日报道,机智号在量子物理里程碑华人科学家制备首个分子BEC近日,华人物理学家在量子物理领域取得了重大突破。来自芝加哥大学与山西大学的研究人员,首次通过原子玻色爱因斯坦凝聚体产生了具有固有角动量的分子玻色爱因斯坦凝聚体。在这种方法下,数千个研究剧烈黑洞中子星碰撞可能有助于解决关于宇宙膨胀的争论据外媒报道,考虑到我们目前估估算宇宙膨胀速率的两种最佳方法测量脉动和爆炸恒星的亮度和速度以及观察早期宇宙辐射的波动给出的答案非常不同,这表明我们的宇宙理论可能是错误的。第三种测量方这个假期,有好戏天文科普专家介绍,5月4日和5日这两天凌晨,下弦月将来到土星和木星的附近停留,上演三英会,助兴五一假期。届时如果天气晴好,我国感兴趣公众面向东南方天空,将会观看到这幕趣味天象。北京种植1万亿棵树能抵消气候变化吗?近年来,气候变化就像一个黑暗的幽灵笼罩着全球。围绕这一问题的紧迫性在2018年达到了新的高度,当时联合国政府间气候变化专门委员会表示,为了在2030年之前降低二氧化碳水平,防止灾难白色垃圾变燃料!MIT李巨教授领衔开发等离子体微波法专访塑料降解不需要再等500年!辐照8秒,微波330瓦,就能实现塑料变燃料!近期,麻省理工学院(MIT)李巨教授课题组联合东华大学朱美芳院士中国石化集团公司乔金樑教授蒋海斌教授等,共同天和核心舱发射!空间站柔性太阳翼耐原子氧技术路线独家分析4月29日11时23分,我国在文昌航天发射场使用长征五号B遥二运载火箭,将中国航天科技集团五院抓总研制的空间站天和核心舱成功送入预定轨道。这标志着中国空间站在轨组装建造全面展开,我宇宙文明的实力是如何划分的?高等级的文明实力会有多么强大?地球诞生46亿年了,而人类诞生地球只有几百万年,新石器时代至今也只有1万年。而且新石器时代才算是人类文明的开端,人类才算是真正开始大发展。想知道人类发展最快的时候是在哪一段时间,一
镀锌不锈钢纯铜三种材质测钉的优缺点及适用场景点击上方大水牛测绘关注我们测钉在测绘工作中使用十分广泛,距离角度水准测量可作为基准点工作基点导线点图根点监测点等点位使用。镀锌测钉一特点1高强度优质A3钢淬火打造,热镀锌处理,美观测斜管在基坑工程监测中的埋设方法位置及要求,你都知道吗?点击上方大水牛测绘关注我们深层测斜在基坑的土体变形监测中能直观的反应变化的趋势,在基坑变形监测中起到重要的监测作用,因此我们要对此必须重视。在前面测斜仪工作原理的文章中,提及了相关CASS怎么进行坐标转换?具体操作步骤在这,值得学习点击上方大水牛测绘关注我们随着CASS软件的广泛应用,软件中的很多功能也被大家所熟知,现介绍一下坐标转换的方法。绘图处理展野外测点点号(把转换前后的控制点展到图上)选择控制点文件打压缩机功率计算1。公式压缩机功率计算1。1简化公式对于理想气体的1个压缩级,等熵压缩如下Pis2。31(k(k1))(TdisTsuct)MQm公式1简化的压缩功率计算公式当压缩由理想的压缩机进女宇航员在太空工作时,如何保护自己的隐私?方法其实很简单自从人类进入太空以来,在太空生活就成了宇航员所需面对的一个基本问题。太空中的失重环境,使得一些生活作息行为变得不再像地面那样方便。一个问题是,男女宇航员如何在航天器密闭的环境中保证想提高工作效率?你需要做五件事情过年回家,一个刚读研的小弟弟给我电话,问我是怎么做到三年时间博士毕业CFA兼职的,毕业已经快三年了,回想起来读博的三年真的是我成长最快的时间。三年时间能够同时兼顾学业和其他,离不开科普丨激光雷达技术是如何工作的?赛维测绘带你去了解点击上方大水牛测绘关注我们激光雷达遵循一个简单的原理向地球表面的物体发射激光,并计算其返回光源所需的时间。考虑到光的传播速度(大约每秒300000公里),使用激光雷达测量精确距离的中国高温合金之父师昌绪科研成果转化要一竿子到底在科学研究中,有些人只重视论文,将其称为绣花工作科技推广被视为低水平劳动,是织麻袋的活儿。但被国外同行称为中国高温合金之父的2010年国家科学技术最高奖得主师昌绪不这么看。他倡导材深圳大学近期科研成果一览一微纳光电子学研究院苏陈良教授课题组在NatureCatalysis发表论文近日,我校微纳光电子学研究院教育部二维材料光电科技国际合作联合实验室苏陈良教授课题组联合九州工业大学横野中国科学院微生物研究所所长钱韦把小我融入科技强国的时代洪流在建党百年之际这个特别的时间加入中国共产党,中国科学院微生物研究所(以下简称微生物所)所长钱韦觉得,这是一件非常幸运和荣幸的事。近些年,他亲眼见证我国科技创新飞速发展,精准扶贫让乡关于台湾省,你知道多少?台湾省位于中国疆域内的东南是我国神圣领土不可分割的一部分台北101大楼台北故宫博物院图虫创意台北故宫馆藏东坡肉奇石图虫创意台北故宫馆藏翠玉白菜图虫创意台湾省由台湾岛澎湖列岛钓鱼岛等