专栏电商日志财经减肥爱情
投稿投诉
爱情常识
搭配分娩
减肥两性
孕期塑形
财经教案
论文美文
日志体育
养生学堂
电商科学
头戴业界
专栏星座
用品音乐

浅学CNN

  头条创作挑战赛
  当前人工智能领域的先进技术层出不穷,诸如计算机视觉、自然语言处理、影像生成,深度神经网络等先进技术日新月异。然而,从计算能力、内存或能源消耗角度来看,这些新技术的成本可能令人望而却步,其中某些成本对于大多数硬件资源受限的用户来说,则完全负担不起。所以说,人工智能许多领域将对神经网络进行必要的修剪,在确保其性能的同时降低其运行成本。
  这就是神经网络压缩的全部要点,在这一领域,有多种方法来实现神经网络的压缩,如量化、分解蒸馏等等,本文的重点在于阐述神经网络的剪枝。
  神经网络剪枝旨在去除性能良好但花费大量资源的多余部分网络。尽管大型神经网络的学习能力有目共睹,但事实上,在训练过程结束后,并不是所有的神经网络全部有用,神经网络剪枝的想法便是在不影响网络性能的情况下去除这些无用的部分。
  在这个研究领域,每年均有几十篇,甚至数百篇论文发布,众多的论文揭示了这一想法蕴含的复杂性。通过阅读这些文献,可以快速识别出神经网络的无用部分,并在训练前后去除它们,值得强调的是,并不是所有的修剪都可以提速神经网络,某些工作甚至会事倍功半。
  本文在阅读原生神经剪枝论文的基础上,提出了解决神经网络修剪的解决方案,依次回答了三个这一领域中的核心问题:应该对哪部分进行修剪?、如何判断哪些部分可以修剪?以及如何在不损害网络的情况下进行修剪?。综上所述,本文将详细介绍神经网络剪枝的结构、剪枝准则和剪枝方法。1剪枝的结构1。1非结构化剪枝
  当涉及神经网络的成本时,参数的数目和FLOPS(每秒钟的浮点操作次数)是其中最广泛使用的指标之一。看到网络显示出天文数字的参数(对某些人来说会花费高达数十亿美元的成本),这的确令人生畏。通过直接删除参数,从而直观地减少参数数目,这一方法肯定有效。实际上,这一方法在多个文献中均有提及,修剪参数是文献中提到的应用最为广泛的示例,被视为处理剪枝时的默认框架。
  直接修剪参数的方法有诸多优点。首先,它很简单,在参数张量内,将其权重值设为零,便可以实现对参数的修剪。在Pytorch深度学习框架中,可以轻松地访问到网络的所有参数,实现起来非常简单。尽管如此,修剪参数的最大优势是:它们是网络中最小、最基本的元素,因此,只要数量足够多,便可以在不影响性能的情况下,对它们进行大量修剪。这种精细修剪的粒度使得可以在非常精密的模式下实现剪枝,例如,可以对卷积内核内的参数进行修剪。由于剪枝权值根本不受任何约束条件的限制,而且是修剪网络的最好方法,因此将这种方式称为非结构化剪枝。
  然而,这种方法的致命缺点是:大多数深度学习框架和硬件无法加速稀疏矩阵的计算,这意味着无论你为参数张量填充多少个零,都不会对实际训练成本产生实质的影响,仅仅是一种直接改变网络架构的方式进行剪枝,而不是对任何框架都放之四海而皆准的方法。
  非结构化(左)和结构化(右)剪枝之间的区别:结构化剪枝会同时删除卷积过滤器和内核行,而不仅仅是修剪参数。从而使得中间特征映射的数目更少。1。2结构化剪枝
  结构化剪枝专注于对更为庞大的结构进行修剪,比如修剪整个神经元,或者,在更现代的深度卷积网络中,直接修剪卷积过滤器。大型网络往往包含许多卷积层,每个层中包含数百或数千个过滤器,可以对卷积层过滤器进行细粒度的修剪。移除这种结构不仅使得深度神经网络的层结构更为稀疏,而且这样做还可以去除过滤器输出的特性映射。
  由于减少了参数,这种网络不仅存储起来更为轻便,而且计算量也得以降低,生成更为便捷的中间表示,因此在运行时需要更少的内存。实际上,有时降低带宽比减少参数数目更有益。对于涉及大型图像的任务,如语义分割或对象检测,中间表示可能比网络本身更加消耗内存,出于这些原因,可以将过滤器修剪视为默认的结构化剪枝。
  在应用结构化剪枝时,应注意以下几方面:首先,应考虑如何构建卷积层,对于Cin输入通道和Cout输出通道,卷积层由Cout过滤器构成,过滤器分别对Cin内核进行计算;每个过滤器均输出一个特征映射,每个输入通道为一个内核专用。基于这种架构,卷积网络为堆叠的多个卷积层,当对整个过滤器进行剪枝时,可以观察到对每一个过滤器剪枝的过程,随后输出特征映射,这一过程也会导致对后续层内核的修剪。这意味着,当修剪过滤器时,在第一次删除参数之后,实际删除的参数数量是最初认为要删除的参数数量的数倍。
  下面来考虑一下这种特殊情况,当一不留神把所有卷积层都修剪掉之后(虽然卷积层被修剪掉了,但神经网络并没有被摧毁,这由神经网络的架构来决定),无法链接到前一层的输出,这也可以是神经网络的一种剪枝方式:修剪掉所有卷积层,实际上等于修剪掉了所有上一层的输出,所以只能连接到其他地方(如残余连接或并行通道)。
  在对过滤器剪枝时,首先应该计算出实际参数的确切数量,再根据过滤器在神经网络架构中的分布,修剪相同数量的过滤器,如果实际参数的数量与修剪参数数量不同,结果将不具备可比性。
  在进入下一个主题之前,需要提及的是:依然有少数工作集中于剪枝卷积内核、核内架构乃至是特定的参数结构。然而,这些架构需要用特殊的方法来实现(如非结构化剪枝)。此外,另一种方法是对每个核中的某个参数进行修剪,将卷积层转换为移位层,这可以通过一次移位操作和一次11卷积的组合来实现。
  结构化剪枝的缺点:输入和输出维度的改变会引发某些偏差。2剪枝原则
  在决定了采用何种结构进行剪枝之后,下一个问题便会是:现在,如何找出保留哪些部分,哪些部分需要修剪?为了回答这个问题,通过对参数、过滤器或其他特性进行排序基础上,生成一个恰当的剪枝准则。2。1权重大小准则
  一个非常直观而又有效的准则是:修剪掉那些权重绝对值最小的参数。事实上,在权重衰减的约束条件下,那些对函数没有显著贡献的参数在训练期间,它们的幅度会不断减小。因此,那些权重比较小的参数便显得多余了。原理很简单,这一准则在当前神经网络的训练中被广泛使用,已成为该领域的主角。
  尽管这个准则在非结构化剪枝的实现中显得微不足道,但大家更想知道如何将其应用于结构化剪枝。一种简单的方法是根据过滤器的范数(例如L1或L2)对过滤器进行排序。这种方法实现起来简单粗暴,即将多个参数封装在一起:例如,将卷积过滤器的偏差和批归一化参数封装到一起,将在并行层的过滤器输出融合起来,从而减少通道数目。
  其中一种方法是:在无需计算所有参数的组合范数的前提下,为需要修剪的每一层的特征映射插入一个可学习的乘法因子,当它减少为零时,有效地删除负责这个通道的所有参数集,该方法可用于修剪权重幅度较小的参数。2。2梯度大小剪枝准则
  权重大小剪枝准则并非唯一流行的准则,实际上,还有另一个重要准则,即梯度大小剪枝准则,也非常适用。根据上世纪80年代的一些基础理论,通过泰勒分解去消除参数对损失的影响,某些指标:如反向传播的梯度,可提供一个不错的判断方法,来确定在不损害网络的情况下可以修剪掉哪些参数。
  在实际项目中,这一准则是这样实现的:首先计算出小批量训练数据的累积梯度,再根据这个梯度和每个参数对应权重之间的乘积进行修剪。2。3全局或局部剪枝
  最后一个需要考虑的因素是,所选择的剪枝准则是否适用于网络的所有参数或过滤器,还是为每一层独立计算而设计。虽然神经网络全局剪枝可以生成更优的结果,但它会导致层垮塌。避免这个问题的简单方法是,当所使用的全局剪枝方法无法防止层垮塌时,就采用逐层的局部剪枝。
  局部剪枝(左)和全局剪枝(右)的区别:局部剪枝对每一层分别进行剪枝,而全局剪枝同时将其应用于整个网络3剪枝方法
  在明确了剪枝结构和剪枝准则之后,剩下就是应该使用哪种方法来剪枝一个神经网络。这实际上是最令人困惑的话题,因为每一篇论文都会带来自己的独有的剪枝方法,以至于大家可能会对到底选用什么方法来实现神经网络的剪枝感到迷盲。
  在这里,将以此为主题,对目前较为流行的神经网络剪枝方法作一个概述,着重强调训练过程中神经网络稀疏性的演变过程。3。1经典的框架:训练、剪枝和微调
  训练神经网络的基本框架是:训练、剪枝和微调,涉及1)训练网络2)按照剪枝结构和剪枝准则的要求,将需要修剪的参数设置为0(这些参数之后也无法恢复),3)添加附加的epochs训练网络,将学习率设为最低,使得神经网络有一个从剪枝引起的性能损失中恢复的机会。通常,最后两步可以迭代,每次迭代均加大修剪率。
  具体剪枝方法如下:按照权重大小剪枝原则,在剪枝和微调之间进行5次迭代。实验表明,通过迭代可以明显提高训练性能,但代价是要花费额外的算力和训练时间。这个简单的框架是许多神经网络剪枝的基础,可以看作是训练神经网络的默认方法。3。2经典框架的拓展
  有一些方法对上述经典框架做了进一步的修改,在整个训练过程中,由于删除的权重越来越多,加速了迭代过程,从而从迭代的优势中获益,与此同时,删除整个微调过程。在各个epoch中,逐渐将可修剪的过滤器数目减少为0,不阻止神经网络继续学习和更新,以便让它们的权重在修剪后能重新增长,同时在训练中增强稀疏性。
  最后,Renda等人的方法指出:在网络被修剪后进行重新再训练。与以最低学习率进行的微调不同,再训练采用与原先相同的学习率,因此称这种剪枝方法为学习率重绕。这种剪枝后再一次重新训练的方法,比微调网络的性能更优。3。3初始化时剪枝
  为了加快训练速度,避免微调,防止训练期间或训练后神经网络架构的任何改变,许多工作都集中在训练前的修剪上:斯摩棱斯基在网络初始化时便对网络进行修剪;OBD(OptimalBrainDamage)在对网络初始化剪枝时采用了多种近似,包括一个极值近似,即假设在训练收敛后将执行参数删除,这种方法并不多见;还有一些研究对这种方法生成掩码的能力提出了保留意见,神经网络随机生成的每一层的掩码具有相似的分布特性。
  另一组研究剪枝和初始化之间关系的方法围绕着彩票假说展开。这一假设指出,随机初始化的密集神经网络包含一个初始化的子网,当隔离训练时,它可以在训练相同次数迭代后匹配原始网络的测试精度。项目实践中,在刚刚初始化时,便使用已经收敛的剪枝掩码。然而,对这一剪枝方法的有效性,还存在着诸多质疑,有些专家认为,利用特定掩码来训练模型的性能甚至可以优于用胜券假设下获得的性能。
  经典的剪枝框架、彩票假说的学习率调整比较3。4稀疏训练
  上述方法均共享相同的底层主题:在稀疏性约束下的训练。这一原则以一系列稀疏训练方法为核心,它包括在训练分布变化的情况下,执行恒定的稀疏率并逐步调整。由Mocanu等人提出,它包括:
  1)用一个随机掩码初始化网络,并对网络进行一定比例的修剪
  2)在一个epoch内训练这个修剪过的网络
  3)修剪一定数量较小的权值,4)再生相同数量的随机权值。
  这种情况下,剪枝掩码是随机的,被逐步调整以瞄准最小的导入权值,同时在整个训练过程中强制执行稀疏性。各层或全局的稀疏性级别可以相同。
  稀疏训练在训练过程中周期性期切割和增长不同的权重,经过调整后的权重与相关参数的掩码相关3。5掩码学习
  还有一些方法侧重于在训练期间学习掩码修剪,而不是利用特定准则来修剪权重。在这一领域,比较流行的有以下两种方法:1)对网络或层分开进行掩码学习,2)通过辅助参数进行掩码学习。第一种方法中可以采用多种策略:尽可能多的修剪的每层的过滤器,在最大限度地提高精度的前提下,插入基于attention的层或使用强化学习。第二种方法将剪枝视为一个优化问题,它倾向于最小化网络的L0范数和监督损失。
  由于L0是不可微的,有些方法主要围绕着使用辅助的惩罚参数来实现,在前向通路中,将辅助的惩罚参数乘以其相应的参数来规避这个问题。还有一些方法采用了一种类似于二进制连接的方法,即:在参数选择时,应用随机门的伯努利分布,这些参数p利用直接估计器或其他学习方法获取。3。6基于惩罚的方法
  有许多方法应用各种惩罚来增加权重,使它们逐步收缩为0,而不是通过手动修剪连接或惩罚辅助参数。实际上,这一概念相当古老,因为权重衰减是衡量权重大小的一个基本标准。除了单独使用重量衰减之外,还有许多方法专门为执行稀疏性而设计了惩罚。当前,还有一些方法在权重衰减的基础之上应用不同的正则化,以期进一步增加稀疏性。
  在最近的研究中,有多种方法采用了LASSO(最小绝对收缩并选择操作符)来修剪权重或组。某些其他的方法还采用了针对弱连接的惩罚,以加大保留参数和修剪参数之间的距离,使它们对性能的影响降为最小。经验表明,在整个训练过程中进行惩罚,可以逐步修剪参数,从而达到无缝剪枝的目的。4可用的框架
  在神经网络的训练过程中,无须从头开始实现(重用论文作者提供的源代码),在某些现成框架上应用上述基本剪枝方法,实现上相对会更加容易一些。4。1Pytorch
  Pytorch为网络剪枝提供了多种高质量的特性,利用Pytorch所提供的工具,可以轻松地将掩码应用到网络上,在训练期间对该掩码进行维护,并允许在需要时轻松地恢复该掩码。Pytorch还提供了一些基本的剪枝方法,如全局或局部剪枝,无论是结构化的剪枝还是非结构化的剪枝,均能实现。结构化剪枝适用于任何维度的权值张量,可以对过滤器、内核行,甚至是内核内的某些行和列进行修剪。这些内置的基本方法还允许随机地或根据各种准则进行剪枝。4。2Tensorflow
  Tensorflow的Keras库提供了一些基本的工具来修剪权重较低的参数,修剪的效率根据所有插入的零引入的冗余来度量,从而可以更好地压缩模型(它与量化很好地结合)。4。3ShrinkBench
  Blalock等人研发了一个自定义库ShrinkBench,以帮助社区剪枝算法进行规范化。这个自定义的库基于Pytorch框架,旨在使修剪方法的实现更加容易,同时对训练和测试条件规范化。它为不同的剪枝方法(如随机剪枝,权重大小剪枝或梯度大小剪枝),提供了不同的基准。
  5结论
  综上所述,可以看出
  1)剪枝结构定义了通过剪枝操作可以获得哪种收益
  2)剪枝准则基于多种理论和实际的结合
  3)剪枝方法倾向于围绕在训练过程中引入稀疏性以协调性能和成本。
  此外,尽管神经网络的基础工作可以追溯到上世纪80年代末,但是,目前神经网络剪枝是一个非常动态的领域,期待有新的基础理论和新的基本概念出现。
  今日头条小助手cnn神经网络

美国武装日本,攻击无人机部署日本,冲到第一线,解放军不会纵容日本海上自卫队从10月份开始了MQ9B海空卫士无人机的部署,MQ9B是在MQ9死神无人机的基础上改进的型号,是美国通用原子公司力推的产品,目前有多个国家地区对于QM9B非常有兴趣,抗美援朝72周年这些数字我们要记住青山埋忠骨,山河念英魂!2022年10月25日是抗美援朝出国作战72周年纪念日,72年前的今天中国人民志愿军打响了入朝后的第一次战役,拉开了伟大的抗美援朝战争的帷幕,有人说那是新中印媒印度为一网公司发射36颗卫星据印度斯坦时报网站10月23日报道,印度空间研究组织最重的火箭LVM3M2当天从斯里赫里戈达岛的航天港发射,为一家英国客户将36颗通信卫星送入近地轨道。报道称,此前,印度新航天公司萌娃睡太久被家长强制开机起来也是一脸懵逼近日,上海一位萌娃被音乐强制开机的视频走红网络,萌翻了众多网友。据家长称,当时孩子睡得有点久,就放了一首欢快的甩葱歌,想唤醒孩子。没想到孩子真的醒了,懵懵懂懂地坐起来就开始跟着点头孩子上小学了,还是不敢自己睡,咋办?试试这两招,当晚就见效跟孩子分房睡,到底有多难?听听这位宝妈的故事我家娃如今6岁了,还没有分房成功。一开始我让他自己睡一个房间,他说不敢,怕鬼。后来,他又说自己怕幽灵,还是赖在我们屋里不走。好不容易说服为人父母没能控制住自己的情绪,第一次当父母不是好的理由什么时候开始我们变得焦躁不安,爱发脾气了,孩子是上天赐予我们的小天使,小的时候那么乖巧,肉嘟嘟的小脸,咯咯的笑声,你还记得吗?孩子第一次叫妈妈,我们多么的欣喜若狂随着孩子会翻身,会7个月孩子吃蛋黄过敏导致呼吸急促,昏迷!医生辅食加蛋有讲究文菁妈01hr汉阳赵女士在6个月的时候给孩子添加辅食就直接加了蛋黄,结果孩子吃了蛋黄之后就长疹子了。而过了一个月之后她就觉得还是要给孩子吃蛋黄,毕竟孩子吃鸡蛋黄能够补铁,而且还能够全国最美退役军人李文强愿做一朵炽热的焊花李文强进行焊接作业。作者供图41岁的李文强,从事过两项水火不容的工作。2001年,20岁的李文强从家乡甘肃应征入伍,成为原武警北京消防总队一名消防战士。在部队服役的几年里,他紧握手苹果又一首席设计师将离职!任职仅三年,因挤牙膏式创新遭批10月24日消息,一则苹果又一首席设计师将离职的消息冲上热搜。报道称,苹果公司硬件首席设计师EvansHankey将于2023年离开公司。目前,她的继任者还未被提名。苹果公司发言人罗永浩天猫直播首秀!双11清单公布想买iPhone者蹲一年一度的双11电商节大促将于今晚8点正式开启,首次入驻天猫直播的新主播罗永浩也准备开始营业了。10月24日,交个朋友直播间官方公布了罗永浩天猫双11带货清单。另外,今晚将是罗永浩到底是中规中矩还是内卷之王?试听节奏音频变奏曲V6国庆长假前最后一个工作日,我拿到了TempoTec节奏音频送来的一款新品Variations6变奏曲V6便携播放器(以下简称节奏变奏曲V6)。由于这款机型还没有正式开始在国内销售,
watchOS9使用半月后,新功能亮点全面盘点watchOS9和ios16系统ipados16系统M3芯片一起亮相于WWDC发布会,那么watchOS9有什么新功能呢?watchOS9功能亮点全面盘点详解描绘阳历与阴历关系的月难以起立,别再以为是肾的问题了,应当重视气血遇到难起,很多人第一反应就是补肾,其实不是,现在生活节奏快,竞争激烈,工作压力大,导致精神太过紧张心脾两虚肝气郁结等原因引起的难起人数大大增加。我以前接诊了一位患者,35岁,是一名过量食水果会加速衰老虽然人体衰老的过程是不可避免的,不过,我们还是可以通过一些方式来对抗衰老,比如科学饮食。用吃进去的食物来改变体内的营养状况,然后通过外在表现出来,才是最好的。所以,想要延缓衰老,希88年蒋经国的最后一天,见到贴身侍卫第一句话今天浑身都不舒服1937年3月的黄浦江口,战云密布,蒋经国与妻儿刚从客轮上下来,就被大批便衣侍卫保护起来,杭州市长周象贤亲自上前迎接,将蒋经国一家接到杭州下榻。蒋经国这些年在苏联过得很艰辛。刚去的日照旅游游记,这个季节来日照最舒服虽然天气转凉不太适合洗海澡,但完全可以光脚在海边玩水,而且天气不冷不热出门很舒服热门打卡项目日照万平口景区文艺的海边木栈道,细腻的沙滩浴场水质清澈,1号门到3号门风景很好,拍照妥妥在海信E8H面前,索尼X91K突然变得不香了现在的不少年轻人,在选产品时都会先仔细对比一下产品的参数和细节,然后再做出决定。科技产品如此,家电类产品也是如此。作为最具有代表的家电之一,电视无疑承担了我们在生活中休闲娱乐的大部马云及其团队用实际行动证明坚持是唯一方法阿里巴巴刚成立的时候,总共只有18个人,所有的资金都是50万。他们之所以能够取得今天的成就,是因为他们有一个共同的目标,并且愿意为这个目标坚持下去。在别人不看好的时候,在发不出工资OPPOK10x图赏全新千元机颜值天花板,硬核功能体验创新高为了满足不同预算和需求的消费者,大多数国产手机旗下都有不同价位和定位的系列产品。比如千元机市场,知名度最高的莫过于OPPO的K系列,超高的性价比和硬核功能体验深入人心,每次新品都很工业互联网工程师为制造业升级插上数字化羽翼让工业企业的设备连得上,让生产流程看得清,让安全管理防得准,工业互联网工程师就是实现这一过程的赋能者。统计显示,2019年至2021年我国工业互联网人才需求三年翻了三番,预计202重新夺回FF的控制权,关于贾跃亭的三个疑问,你知道答案吗?贾跃亭说,下周回国。这下周,一晃就5年过去了。欠债215亿法拉第未来汽车量产从2018年,一直拖到2022年,仍然无法量产从PPT乐视到PPT造车围绕贾跃亭的三个疑问,你知道答案吗女网红为了换iPhone14,把内含大量大尺度视频的手机给卖了众所周知,每次iPhone系列一经发布,就会引发一系列全网抢购潮。譬如iPhone依旧挤牙膏的今年,将牙膏挤在了iPhone14Pro两款手机上。网友们则纷纷以抢到售价为13499
友情链接:快好找快生活快百科快传网中准网文好找聚热点快软网