范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

微软浙大研究者提出剪枝框架OTO,无需微调即可获得轻量级架构

  机器之心报道
  作者:Hecate He
  来自微软、浙江大学等机构的研究者提出了一种 one-shot DNN 剪枝框架,无需微调即可从大型神经网络中得到轻量级架构,在保持模型高性能的同时还能显著降低所需算力。
  大型神经网络学习速度很快,性能也往往优于其他较小的模型,但它们对资源的巨大需求限制了其在现实世界的部署。
  剪枝是最常见的 DNN 压缩方法之一,旨在减少冗余结构,给 DNN 模型瘦身的同时提高其可解释性。然而,现有的剪枝方法通常是启发式的,而且只针对特定任务,还非常耗时,泛化能力也很差。
  在一篇标题为《 Only Train Once: A One-Shot Neural Network Training And Pruning Framework》的论文中,来自微软、浙江大学等机构的研究者给出了针对上述问题的解决方案,提出了一种 one-shot DNN 剪枝框架。它可以让开发者无需微调就能从大型神经网络中得到轻量级架构。这种方法在保持模型高性能的同时显著降低了其所需的算力。
  论文链接:https://arxiv.org/pdf/2107.07467.pdf
  该研究的主要贡献概括如下: One-Shot 训练和剪枝。研究者提出了一个名为 OTO(Only-Train-Once)的 one-shot 训练和剪枝框架。它可以将一个完整的神经网络压缩为轻量级网络,同时保持较高的性能。OTO 大大简化了现有剪枝方法复杂的多阶段训练 pipeline,适合各种架构和应用,因此具有通用性和有效性。 Zero-Invariant Group(ZIG)。研究者定义了神经网络的 zero-invariant group。如果一个框架被划分为 ZIG,它就允许我们修剪 zero group,同时不影响输出,这么做的结果是 one-shot 剪枝。这种特性适用于全连接层、残差块、多头注意力等多种流行结构。 新的结构化稀疏优化算法。研究者提出了 Half-Space Stochastic Projected Gradient(HSPG),这是一种解决引起正则化问题的结构化稀疏的方法。研究团队在实践中展示并分析了 HSPG 在促进 zero group 方面表现出的优势(相对于标准近端方法)。ZIG 和 HSPG 的设计是网络无关的,因此 OTO 对于很多应用来说都是通用的。 实验结果。利用本文中提出的方法,研究者可以从头、同时训练和压缩完整模型,无需为了提高推理速度和减少参数而进行微调。在 VGG for CIFAR10、ResNet50 for CIFAR10/ImageNet 和 Bert for SQuAD 等基准上,该方法都实现了 SOTA 结果。
  方法及实验介绍
  OTO 的结构非常简单。给定一个完整的模型,首先将可训练的参数划分为 ZIG 集,产生了一个结构化稀疏优化问题,通过一个新的随机优化器 (HSPG) 得出高度组稀疏的解。最后通过剪枝这些 zero group 得到一个压缩模型。
  团队提出的 HSPG 随机优化算法是针对非光滑正则化问题而设计的,与经典算法相比,该算法在保持相似收敛性的同时,能够更有效地增强群体稀疏性搜索。
  为了评估 OTO 在未经微调的 one-shot 训练和剪枝中的性能,研究者在 CNN 的基准压缩任务进行了实验,包括 CIFAR10 的 VGG16,CIFAR10 的 ResNet50 和 ImagetNet (ILSVRC2012),研究者比较了 OTO 与其当前各个 SOTA 算法在 Top-1 精度和 Top-5 精度、剩余的 FLOPs 和相应的 baseline 参数。
  表 1:CIFAR10 中的 VGG16 及 VGG16-BN 模型表现。
  在 CIFAR10 的 VGG16 实验中,OTO 将浮点数减少了 83.7%,将参数量减少了 97.5%,性能表现令人印象深刻。
  在 CIFAR10 的 ResNet50 实验中,OTO 在没有量化的情况下优于 SOTA 神经网络压缩框架 AMC 和 ANNC,仅使用了 12.8% 的 FLOPs 和 8.8% 的参数。
  表 2:CIFAR10 的 ResNet50 实验。
  在 ResNet50 的 ImageNet 实验中,OTO 减少了 64.5% 的参数,实现了 65.5% 的浮点数减少,与 baseline 的 Top-1/5 精度相比只有 1.4%/0.8% 的差距 。
  表 3:ResNet50 的 ImageNet。
  总体而言,OTO 在所有的压缩基准实验中获得了 SOTA 结果,展现了模型的巨大潜力。研究者表示,未来的研究将关注合并量化和各种任务的应用上。

研究称空气污染使野火燃烧期的闪电活动增加据外媒报道,大多数人都知道闪电可以引发野火。但是野火也能引发闪电这一现象几十年来一直困扰着科学家。现在,研究人员已经揭示了这一现象的一个关键原因空气污染。更加污浊的空气意味着野火上这才是龙舟赛你需要的龙舟太幽奥玄深难懂了不同于NASA和其他科研机构,该研究小组找到了方法,能够在相对论的理论框架下建造引擎,不需要所谓的特异物质的负能量。研究人员解释,他们用非常强大的引力场代替了负能量,并利用这些引力Science白垩纪末植物灭绝事件和现代雨林的起源Science白垩纪末植物灭绝事件和现代雨林的起源发生在白垩纪和古近纪交界(KPg界线,6600万年前)的小行星撞击地球事件,造成了大规模的快速灭绝事件,摧毁了地球上约34的生物。埃隆马斯克的火星计划可能是人类有史以来最冒险的探索好奇号火星车在火星梅尔库山的自拍在尼尔阿姆斯特朗(NeilArmstrong)实现人类登月壮举的半个多世纪后,另一场太空竞赛正在悄然展开。这一次,人类最有希望登陆的是地球的近邻火星环绕火星三个月才登陆,天问一号到底在等些啥2021年2月10日19时52分,经过6个半月的飞行之后,我国首颗自主发射的火星探测器天问一号顺利完成刹车,进入环火星轨道,成为我国首颗人造火星卫星。几天之后,NASA毅力号在20火星上的五星红旗飘动了!祝融号拍到了镜头,很多人没有看见?2020年底,我国嫦娥5号是用表取和钻取的方式在月球成功取到月壤,在准备离开月球前,嫦娥5号特意留下一面颜色鲜艳的五星红旗。看到竖立在月球上的五星红旗,国人肃然起敬,不少前辈热泪盈52年前美国就能载人登月,却还没取回火星土壤,是怕未知生命吗?20世纪50年代之前,人类在宇宙探索领域还处于摸索阶段,并没有实质进展,直到1957年10月4日,人类第一个人造卫星才由苏联卫星号运载火箭发射升空,假如有人在那时说人类过不了几年就祝融在火星忙什么?传个图为啥这么久来源中国青年报原标题祝融踏上荧惑这几天在忙啥传个图为何那么久5月22日10时40分,中国第一辆火星车祝融号安全驶离着陆平台,成功打卡火星表面。所谓火星车,就是在火星着陆并用于火星探易华录此次OceanStor为火星探测器提供数据存储服务未采用蓝光存储同花顺(300033)金融研究中心5月26日讯,有投资者向易华录(300212)提问,董秘你好。今日我国火星探测器成功登陆,华为宣布OceanStor为火星探测器提供数据存储服务。打算和中国交换发射登月飞船?俄罗斯的火箭飞船值得期待吗?俄罗斯卫星通讯社5月24日报道,俄罗斯国家航天集团执行总监亚历山大布洛申科表示,中俄双方商定将俄罗斯超重型运载火箭与中国载人飞船相整合,并将中国的超重型火箭与俄罗斯载人飞船相整合。俄罗斯羡慕中国航天,称要向中国学习,但真的太难了?如今世界三大航天国家,中美俄占据了世界主要的商业发射与航天探索,美国不必说,在70年代左右就开展了最为广阔的太阳系探索计划,旅行者1号2号新地平线号等美国已经实现了对所有太阳系行星
南京对不起,苏州无锡,我是全江苏唯一以第三产业为主导的城市南京对不起,苏州无锡,我是全江苏唯一以第三产业为主导的城市!一种观点认为,南京对于江北新区的定位非常高大上,医药公共服务平台基因工程半导体新材料等,都是目前的新兴产业,市场体量巨大江苏发出灵魂拷问全国很多城市,为何只有我不限制高考移民?江苏发出灵魂拷问全国很多城市,为何只有我不限制高考移民?一种观点认为,江苏高考初征全国卷,就遭遇滑铁卢,不能把原因归结为压分。客观来说,像语文是没有压分的,作文分低在于没有把握全国江苏2021高考成绩引争议为何600分以上人数远低于河北?江苏2021高考成绩引争议为何600分以上人数远低于河北?一种观点认为,江苏考生总说自己省出的题难,做全国卷就是考前放松,今年江苏如愿参加全国卷,成绩却不尽如人意,660分,600市区GDP比咸阳多25引争议宝鸡才是陕西第二大城市?市区GDP比咸阳多25引争议宝鸡才是陕西第二大城市?一种观点认为,自从榆林发现煤矿,宝鸡的gdp就排到了全省第四。自建市以来,咸阳的GDP就比宝鸡高,因为咸阳下属了三原泾阳武功兴平江南省为何不以南北划分2省?因为散装江苏有个为数不多的共同点江南省为何不以南北划分2省?因为散装江苏有个为数不多的共同点!一种观点认为,当初江南省以东西而不是南北划分2省,漕运是最主要的原因,大运河是经济命脉,在一个省内有利于管理,特别是徐南京看了苏州的5号地铁线,才知道这个地级市有多么不容易南京看了苏州的5号地铁线,才知道这个地级市有多么不容易!一种观点认为,南京和苏州未来的发展水平,取决于两个地区能够在今后的产业分工中抢抓住哪个赛道。苏州比拼的不仅仅是gdp,还有生江北新区pk苏州园区引争议面对化工大厂,南京为何不能说不?江北新区pk苏州园区引争议面对化工大厂,南京为何不能说不?一种观点认为,看看苏州工业园区,早就把那些重污染二产赶走了。化工厂而南京江北新区还有大片的化工园,且规模太大赶不走(16年新加坡工业园选址苏州引争议当年为何不考虑青岛和无锡?新加坡工业园选址苏州引争议当年为何不考虑青岛和无锡?一种观点认为,新加坡工业园最初是有意向来青岛的,可惜青岛当时没有抓住机遇,苏州给的政策好。要不然真难想象今天的青岛会是什么样,但高德地图导航最近出错率越来越多,是飘了还是放弃导航啦语音播报,提示与实际行车不符大家有没有发现最近用高德地图导航出现很多语音播报导航显示与实际不符!高德地图导航可是这个行业的大哥大,一直深受用户们喜爱,记得我第一次用导航时,我之前的华南快速大塞车,怎么回事?今天(7月9日)上午从嘉禾入口上华南快速高速,刚过永泰路口,开始塞车,一直塞到差不多到同和出口,等走过塞车路段,也没有发现其他问题,就是不知道是什么原因造成拥堵,不过上午还好,也就广州市白云区鹤龙街黄边第三次核酸检测已开始早两天在鹤龙街卫生服务中心的公众号上已经看到了信息6月27号进行全员核酸检测,因为是星期五看到的消息,所以一直没有收到房东发过来的正式通知,今天早上一大早八点半不到就收到了正式核酸