范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

研究关于内存计算的电阻存储器

  文|前程说
  编辑|前程说前言
  内存计算是一种将数据存储和算术计算功能集成在一起的计算解决方案。其中,电阻式随机存取存储器(RRAM)阵列具有创新的外围电路,能够执行矢量矩阵乘法等超出基本布尔逻辑的操作。这种内存计算的对偶性为矩阵乘法相关的神经网络和相关应用提供了一种高效的硬件解决方案。RRAM存储器计算的电路设计和系统组织对于打破冯·诺依曼瓶颈至关重要,这为实现超低功率和密集型神经网络加速器提供了道路指引。
  内存计算的意义
  冯·诺依曼体系结构是一种最初于1945年提出的数字计算机基本架构,它将中央处理器(CPU)和存储设备分离。在该架构中,数据处理过程需要通过传输接口在存储器和CPU之间传输数据。然而,随着数据量的增加,数据传输的高延迟和高能耗成为了冯·诺依曼架构的瓶颈,被称为"冯·诺伊曼瓶颈"。为了解决这个问题,现代系统采用了集成多个处理核心和设计专用加速器等解决方案,以提高数据处理速度。但这些解决方案进一步加剧了计算和数据传输之间的差距。
  内存计算是一种将内存模块和数据处理单元结合在一起的计算方法,也被称为内存计算(CIM)或内存中处理(PIM)。其目的是减少或消除现代计算机中内存与数据处理单元之间频繁的数据传输,从而构建节能的计算系统。这种构建方式与巴克斯1978年提出的想法相呼应,即需要一种不那么原始的方法对存储进行大规模的更改,而不是通过不断地推送大量数据来克服冯·诺依曼瓶颈。实际上,内存计算的概念并不是新鲜的。几十年前,在数据库中,内存数据管理就是一个关键问题,特别是在数据量惊人的企业数据仓库中。然而,当时用于处理数据的本地存储设备的研究仍然局限于统一级别的研究。
  当前,人们已经研究出各种纳米级存储设备,为设计大规模、高性能和节能的存储器计算提供了多种选择。静态随机存取存储器(SRAM)、8-10闪存、11,12磁随机存取存储器、13,14磁道存储器、15,16相变存储器(PCM)、17-19和电阻式随机存取存储器被广泛认为是具有巨大潜力的随机或顺序存取存储器类型。除了SRAM,所有这些存储器类型从20到22都是非易失性的,这意味着即使没有电源,存储器设备也可以保持存储的数据。
  大规模系统集成
  在现有的存储器技术中,SRAM具有最快的读/写速度(亚纳秒)和更成熟的制造工艺。非易失性存储器技术除了持久数据存储外,通常具有MRAM强调快速写入速度(与SRAM的顺序相同)和随机编程。轨道存储器是一种具有23-26年历史的存储器类型,以其极高的密度(20纳米宽的纳米线)和沿轨道的顺序存取而闻名。 PCM提供线性电导率更新特性。RRAM提供多功能性,包括高电阻率(MΩ数量级)、支持3D集成、随机编程和多级单元(最多6位)。
  随着神经网络模型的规模不断增长,需要实现大规模的内存计算系统。在基于RRAM的大型系统中,外围电路和RRAM阵列通常主导总体功耗、芯片面积和能耗。因此,需要新的时序控制和数据转换电路来实现高效的内存计算。此外,更复杂的神经网络拓扑结构需要大量的数据管理和调度,以更好地利用内存计算系统。本节介绍了存储器计算的宏设计,其中包括不同的数据转换接口电路,以及基于RRAM的存储器计算的最新微体系结构。
  1.基于模数转换器的设计
  内存计算宏是执行VMM操作的基本处理核心。基于RRAM的存储器计算以模拟形式进行,并且需要进行数据转换才能将这些宏与周围的数字系统接口相连。成熟的数模转换器(DAC)和模数转换器(ADC)设计已成为首选。最近提出了一种方法,利用128 纯模拟点积引擎(DPE)对64个RRAM阵列进行处理。61个数字输入向量被转换成模拟电压队列,DPE执行计算。输出电流通过交叉电阻放大器转换为电压,然后通过ADC转换为数字输出向量。DPE的工作频率为10MHz,由于2μm晶体管技术中存在多条转换路径和高寄生效应的限制,因此存在一定的局限性。使用Ta/HfO2 RRAM实现的DPE具有6位精度,单层感知器在MNIST数据集上使用该DPE产生了89.9%的准确率。
  2.基于电平检测放大器的设计
  使用RRAM阵列的DPE纯模拟方法需要花费大量精力微调每个模拟的RRAM单元电阻。相比之下,数字化的方法可以简化内存计算宏中的数据转换。对基于RRAM的存储器计算宏的仔细观察揭示了基于矢量乘法的数字化的三个部分:两个操作数G和V以及计算结果I。为了将V数字化,将多个数字输入逐位应用于RRAM阵列,每个位具有相同的电压。随后,对结果进行显著性加权和求和。通过这种方式,可以去除输入端的DAC,以增加计算周期为代价。该方法通常用于隔离输入驱动性能和输入数据,否则,具有特殊驾驶性能要求的DAC将消耗更多的面积。
  G的量化方式对于将神经网络中的浮点权重映射到有限电导率的RRAM设备上具有重要影响。在CMOS逻辑平台上,将RRAM集成到单片上需要使用二进制或三进制的RRAM设备,因此需要将浮点突触权重调整为相应的位宽。为了适应RRAM内存计算宏,研究人员提出了一些调整突触权重的方案,包括分布感知量化、定量正则化和偏差调整等。通过降低激活精度要求,可以简化ADC设计,从而降低多达4位的输出精度。
  与传统的流水线ADC和逐次逼近ADC等架构不同,高精度ADC可以使用多个二进制检测放大器,并设置不同的参考阈值来实现。RRAM阵列由1T1R单元组成,编程时可以设置为任意值在HRS和LRS之间。输出检测放大器是二进制的。对于需要多位激活精度的神经网络,可以通过累积1位MAC结果,然后添加额外的数字非线性激活函数电路来实现神经元计算。这种设计方案不需要ADC模块,因此可以减少面积和功耗,同时增加延迟/操作开销。
  1.基于尖峰的设计
  虽然有许多算法层研究致力于开发纯二进制神经网络(输入、输出和权重都是二进制),但是对于复杂的数据集和应用程序来说,仍然需要一定程度的数据精度(例如8位)以满足精度要求。 考虑到电压表示的电感容限有限,因此使用脉冲表示数据,因此最近演示了一种基于RRAM的紧凑型非易失性存储器计算处理引擎(PE)。
  该阵列大小为64KB(256 256),RRAM设备处于二进制状态。PE具有存储和计算的双重功能。在存储器模式下,读写逻辑、驱动器和放大器能够进行数据编程和检测。在计算模式下,RRAM阵列执行矩阵乘法,而原位非线性激活(ISNA)电路将输出电流转换为脉冲。 在这种存储器计算PE设计中,ISNA动态地执行激活函数计算,从而消除了用于计算激活函数的额外电路,并减少了设计成本。
  基于尖峰的ISNA使用不同的方法来降低功耗,延迟 200 ns,从而提高能源效率。与使用具有不同阈值的多个检测放大器不同,ISNA电路与IFC类似,通过连续充电和放电电容器来执行数据转换。 这种受生物学启发的尖峰生成只需要大约十个带电容器的晶体管。由于ISNA的占用空间小,它可以包括更多基于尖峰的ISNA传感电路,从而实现更高的执行并行性和更高的吞吐量。 这款 RRAM 内存计算 PE 实现了每秒 16 万亿次操作/瓦 (TOPS/W) 的最高能效,并提供了在 1 到 8 位之间配置激活精度的灵活性。
  基于 RRAM 的内存计算微架构
  根据冯·诺依曼的观点,计算机可以分为基本的算术运算和逻辑流程。内存计算宏设计提供了基本的算术运算功能,而微体系结构的研究则着重于利用内存来有效地控制宏计算。
  ISAAC是一款专门为CNN基准测试量身定制的加速器,采用基于交叉开关的架构。ISAAC的分层结构由芯片、瓦片、原位乘法累加器(IMA)和阵列组成。专用的片上网络用于连接芯片中的瓦片以进行数据传输。 在每个瓦片中,嵌入式动态随机存取存储器(eDRAM)缓冲区用于结果聚合。
  IMA由一组RRAM阵列和数据转换接口组成,可以执行向量矩阵乘法。输出寄存器用于存储聚合结果。其他数字组件在神经网络中执行池化和激活操作。ISAAC提出了基于网络特性的管道设计,可以在IMA和切片中应用流水线来实现数据访问和计算的重叠。此外,ISAAC还配备了数据编码和分配方案,以减少高精度数字模拟转换器和数字转换器的开销。
  近期出现了一些专为各种网络设计的基于RRAM的存储器计算器,专门用于加速无监督机器学习应用程序和生成对抗网络(GAN)。GAN训练的挑战在于两个方面:1)鉴别器网络和生成器网络之间存在复杂的数据依赖性,2)生成器网络层内存在非传统的计算模式。为了解决这些问题,这些计算器提供了跳过生成器网络中无效计算的机会,从而提高计算效率。同时,它们采用基于3D的层连接来优化鉴别器层和生成器层之间的数据传输效率。这些计算器首先将生成器中的卷积分解为几个子矩阵乘法,然后通过权重映射和执行调度设计来平衡它们的计算延迟。通过消除与零相关的无效计算,相较于以前的基于RRAM的内存计算加速器,性能提高了近2.1倍。
  小结
  RRAM内存计算系统的最新发展涵盖了从机械层到系统层的各个方面。在设备层面,研究人员正在专注于利用单个RRAM设备或者使用新型设备结构的简单电路来实现电突触和神经元。为了进一步提高密度和可扩展性,诸如3D集成等技术也成为了重要的研究方向。在电路和体系结构层面,基于RRAM的内存计算已经天然地集成了数据存储和处理操作,并得到广泛的研究。这些研究的重点主要集中在提高能源效率、降低设计成本以及满足系统性能要求,例如运行速度、吞吐量和准确性等方面。此外,新的ISA和编译器也成为将内存计算模块扩展到各种应用程序的新研究方向。但随着RRAM器件尺寸的缩小和密度的提高,鲁棒性问题也开始浮现。
  采用新兴的RRAM技术在实现更高效的计算系统方面显示出巨大的潜力,特别是在认知应用方面。然而,为了将其应用于大规模集成系统中,仍然存在许多关键挑战需要克服。例如,设备数量有限和神经网络模型规模增大之间的不平衡,实现在线训练解决方案的困难,以及将算法转移到给定硬件平台的自动化过程等问题。仅仅依靠设备级的缓解是不够的,而在电路、系统甚至算法层面上的缓解可能是解决这些问题的唯一途径。
  现如今,为了开发高效的计算系统,各个层次,包括设备处理、电路组件、微体系结构和应用算法之间都有着紧密的关联。基于RRAM内存计算的研究反映了这些概念,不同领域的研究人员对于如何开发内存计算有着不同的理解,这是一个跨学科的领域。例如,计算单元的扩展导致了原始的冯·诺依曼架构的修订,以实现更高效的性能和效率,同时,生物类的计算解决方案也应运而生,以满足不断增长的人工智能计算需求。RRAM内存计算引起了业界的关注,无疑将为计算能力的进一步发展提供支持。
  参考文献
  《忆阻器的定量硬件神经网络的结构和规模分析》
  《电阻开关器件的量化硬件深度神经网络研究》
  《RRAM的混合突触的神经网络加速训练》
  《导电桥接随机存取存储器开关机制的影响》

两极归化!高拉特在巴甲被炒鱿鱼,国足征战东亚杯晒蒋光太训练照随着2022卡塔尔世界杯开幕式越发临近,中国男足的出局再一次被球迷谈论起来。而作为那个时期糟蹋的归化计划,也是成为冲击世界杯失败的罪魁祸首。如今,归化球员各奔东西,但也出现了两极分祝贺!国乒晋级决赛坐等伊藤美诚,王曼昱带伤出战,令人感动北京时间7月16日晚,国乒世界冠军组合孙颖莎王曼昱再次登场,在女双半决赛中大获全胜,30横扫跨国配对斯佐科斯(罗马尼亚)波尔卡诺娃(奥地利)晋级最后一轮,其中王曼昱是带伤作战,状态10秒15,恭喜苏炳添,世锦赛半决赛名单!太难了,粉丝却笑不出来10秒15,苏炳添世锦赛10秒15晋级半决赛恭喜苏炳添,世锦赛半决赛名单!太难了,粉丝却笑不出来苏炳添跑10秒15秒,拿到小组第5名,最终晋级四强!苏炳添这个组只跑了小组第五名。当苏炳添以0。003秒优势晋级半决赛!美国名将科尔利飚出9秒79北京时间7月16日,尤金田径世锦赛迎来首个比赛日的争夺,男子100米预赛上演,苏炳添在预赛第二组出场,跑出10秒15的成绩,最终凭借0。003秒的优势,成功跻身半决赛。美国名将科尔排球名宿评价中国女排自由人十二个队最差,蔡斌在等朱婷今年女排的第一个赛事世界女排联赛总决赛激战正酣,但是中国女排却已经成为看客,因为她们在八进四的比赛中以1比3输给了老对手意大利女排,最终仅仅排名第六名,创造了中国队参加这项赛事最差7换1,再见杜兰特!篮网更换交易目标,詹姆斯将无缘联手欧文自由市场已经开启了一段时间了,可是并没有像往年一样热闹,多支球队推迟了手中的交易计划,主要就是因为杜兰特申请了交易,再加上欧文也被摆上了货架,这吸引了很多球队前来询问价格。篮网总经波波维奇文班亚马是我离开马刺前的临别赠礼格雷格波波维奇作为NBA历史上最著名的主教练之一,在2022年3月12日,迎来了执教生涯常规赛的第1336场胜利,成功超越老尼尔森,独占NBA历史第一的宝座!加上执教生涯中的170交易受阻!篮网报价遭拒,嫌弃杜兰特没领袖气质,蔡崇信目的达成布鲁克林篮网队为了解决球队两大麻烦(杜兰特和欧文),正四处寻找适合的交易目标,以如今篮网队情况来看,其实大可不必如此,主动权掌握在球队手中。杜兰特才处于合同初期,没有交易决定权,欧巽寮湾顶级酒店放大招,双早下午茶私家泡池嬉水池玫瑰礼堂夏日下午茶之旅仅限300套!999抢巽寮湾星河山海半岛星度假酒店高级园景房!奢享双早精选下午茶阳台私家泡池畅享网红嬉水池玫瑰礼堂有效期到8月点击我的头像,再点击底部优惠分享,搜索关黑鲨5凭实力大火,黑鲨4Pro跌至超冰点低价,别犹豫马上买黑鲨4Pro这款手机是一款电竞游戏手机,三星E4屏幕,刷新率144Hz,触摸采样率720Hz。它有非常好的游戏体验。采用增强型UFS3。1SSD磁盘阵列系统,读写速度更快。机身采用自动模式下实现5000万像素输出,motoX30Pro样张首曝让人很惊喜如今的手机像素可以说是越来越高,不少都已经过亿了,但在日常拍摄的时候,相信很多人也感受到了,根本就没有达到过亿像素的清晰度,这又是怎么回事呢?从劲哥发布的微博了解到,手机在自动模式东亚杯中国男足新队长是谁?主帅将会三选一按照计划,中国队将于7月17日一早启程离开青岛,飞赴日本名古屋,准备参加即将于7月下旬在日本举办的新一届东亚杯足球锦标赛。而出行前,球队方面将确认东征的最终人选。从目前情况看,来自央视拒播男篮亚洲杯,我们看清了5件事,希望不会沦为私人工具男篮亚洲杯继续进行,在已经结束的小组赛第二场比赛中,中国男篮以1分险胜巴林男篮,避免了遭遇2连败的尴尬。在B组中,中国男篮以1胜1负位列第3,7月16日晚上9点中国男篮对阵中国台北前重量级拳王塞尔登境况堪忧,如今无家可归,住在收容所里前世界重量级拳王布鲁斯塞尔登境况堪忧,如今已经无家可归了,不得不居住在新泽西州纽瓦克的一处收容所中。塞尔登的同乡已经退役的超轻量级拳手丹尼尔麦克德莫特组织了一场募捐活动。麦克德莫特真没想到!上赛季他还是最佳主帅提名,如今却成为了下课热门中超第一阶段的比赛已经顺利拉下帷幕,各支球队也返回了自家大本营,进行着短暂的调整以及第一阶段的复盘总结。而随着转会窗口的展开,各支俱乐部该引援的引援,而部分表现不佳,带队远不如预期男篮险胜巴林一分,值得开心?男篮险胜巴林一分!但是我心里却没有一点激动感,没有一点开心感!巴林,一个只有百来万人口的国家,台北队打他们都轻轻松松,我们一个国家队竟然靠着绝杀球赢了人家一分!以往打打巴林,场均能甩锅?杜锋赛后点名批评赵睿孙铭徽引起争议!暴脾气致更衣室内讧北京时间7月14日消息,北京时间7月14日消息,2022年男篮亚洲杯小组赛,中国男篮8079险胜巴林队,赛后,中国队主教练杜锋总结了球队的表现。首先我觉得这场比赛打得糟透了,大家在男篮亚洲杯最新积分榜韩国5分险胜巴林三连胜小组第一直通8强北京时间7月16日,男篮亚洲杯继续进行,今天进行A组和B组小组赛第三轮的比赛。率先结束了第一场比赛是韩国男篮7873险胜巴林男篮,豪取三连胜,小组赛三战全胜以头名的身份直通8强,巴76人三方交易曝光!哈里斯塞布尔换戈登北京时间7月16日,随着一年一度选秀大会的结束,NBA也正式进入交易活跃期。继戈贝尔默里等多位联盟一线球星先后被交易之后,联盟现役第一人杜兰特也被篮网摆上货架。至此,所有媒体关注度点睛之笔!安帅确定挽救1亿巨星,或焕发第二春,皇马获新援在早早确定吕迪格和琼阿梅尼的转会后,皇马在转会市场上忽然没了动静,虽然皇马夏窗拥有高达4。5亿欧元的转会预算,但银河战舰早已经不起曾经那位只会买买买的球队了,更加注重实力和适合球队我们要走的路还长2022女排世联赛总决赛第二日比赛观感之二其实在我们和意大利的这场比赛中,意大利的一传和防守体系也并没有恢复到她们的最佳状态,比赛里我们经常看到奥罗满世界的找艾格努,完完全全就是其他队员做好兜底工作,交给艾格努在网上一个劲蔡崇信拒绝续约篮网总经理,纳什成潜在接替者,主教练将更换人选篮网在最近两个赛季的阵容看起来十分恐怖,但是由于阵容缺乏整体性,比如缺少合适的投手,缺少防守悍将,这支球队牌面虽然华丽但是却无法夺冠,而今天篮网队的随队记者KristianWinf
欧佩克联手限产和美国决战油价挑战200美元的历史高位吗?十月五号欧佩克和俄罗斯,都相继发出即将大幅减产稳定石油价格的信号,全球油气价应声暴涨,美国将于近期通过相关法案,将欧佩克定义为垄断组织,展开对欧佩克的围剿和所有成员国的打压,如果说品读历史绕不开的邯郸三千年文化灿烂,八百里山川秀美头条带你乐享河北河北文旅看图识景这么近那么美周末到河北醉骑白花马,西走邯郸城在悠远漫长的历史进程中邯郸孕育出多条文化脉系是一座历史绕不开的城沿着太行山风景线享三千年灿烂文化赏八百里改写历史科学家公布首个具同形孢子蕨类植物的全长基因组蕨类植物因拥有大量的染色体和大量的DNA而闻名。目前,一种不比餐盘大的蕨类植物保持着最高的染色体数量记录,它的每个细胞核中都有720对染色体。科学家们一直对蕨类植物囤积DNA的倾向历史新低!354元抢购梅捷1TB固态硬盘梅捷SSD固态硬盘SATA3。0接口1TB活动价仅需359元,售价低至白菜价,性价比非常不错,有需要的小伙伴儿可以买起来了。梅捷SATA3。0固态硬盘1TB精选TLC颗粒,2。5寸河北井陉县与山西平定县交界处,百年古村落里隐藏着千年古槐树井陉县南障城镇有座百年古村落,名叫大梁江古村落,大致是明清时期的民居建筑,至今保存完好。其实像大梁江这样的古村落在河北省境内还真不少,而唯一不同的是大梁江村还保留着山西民俗风格,一早读社丨这22项政务服务将跨省通办涉公积金提取等事项有志者自有千计万计,无志者只感千难万难。浙江新闻客户端的读者朋友早上好!今天是2022年10月6日,农历九月十一,星期四。10月5日,浙江工业大学数十名留学生走进湖州德清开展乡村行国庆节后,部分退休人员养老金将迎来重算补发,4类人补发更多点击上方蓝色按钮,即可收听全文。国庆节后,部分退休人员养老金将迎来重算补发,4类人补发更多时间进入10月6日,国庆节接近尾声,国庆节后,部分退休人员将迎来养老金重新核算和补发,而且打消里程焦虑,国庆无忧出行这几款续航千公里新能源车值得一看随着汽车新能源技术的飞速发展,各款新能源车型在消费者最关心的续航上也进行着不断比拼。特别是在国庆期间大家长途出行时,消费者越是注重车型的燃油经济性和续航问题。在这样的背景下,长续航补脾,是治疗一切疾病的关键脾胃不好的人,从外表上就能看出来。有的面色苍白,口唇没有一点光泽有的过于消瘦,好像一阵风就能吹倒了有的很胖,看似体格庞大,但一点都不结实还有的说话有气无力,精神不振,年纪轻轻却未老热效应是艾草的价值体现艾草较为干燥的特征,赋予了其悠久的历史。在远古,无论是钻木取火还是透镜取火或是火折子取火,离不开艾绒作为取火引生活在实践之中。火是艾灸的由来,火给人温暖以消除寒冷与疲倦,在火焰的直常吃猕猴桃有什么好处?提醒这5类人不建议吃猕猴桃,是一个典型的呼吸跃变型水果,也是我们口中经常说的后熟水果。大多数猕猴桃都不是在树上熟的,而是还不熟的时候就摘下来,放到库里,进行销售。消费者购买到的猕猴桃,也多是这种。作为