范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

兼具CNNTransformer优势,灵活使用归纳偏置,Facebook提出ConViT

  机器之心报道
  编辑:小舟、陈萍
  归纳偏置强大但需要灵活使用,来自 Facebook 的研究者提出了一种 ConViT 模型,使用「soft」卷积归纳偏置进行初始化,模型可以在必要时学会忽略这些偏置。
  AI 研究人员在构建新的机器学习模型和训练范式时,通常会使用一组被称为归纳偏置(inductive biases)的特定假设,来帮助模型从更少的数据中学到更通用的解决方案。近十年来,深度学习的巨大成功在一定程度上归功于强大的归纳偏置,基于其卷积架构已被证实在视觉任务上非常成功,它们的 hard 归纳偏置使得样本高效学习成为可能,但代价是可能会降低性能上限。而视觉 Transformer(如 ViT)依赖于更加灵活的自注意力层,最近在一些图像分类任务上性能已经超过了 CNN,但 ViT 对样本的需求量更大。
  来自 Facebook 的研究者提出了一种名为 ConViT 的新计算机视觉模型,它结合了两种广泛使用的 AI 架构——卷积神经网络 (CNN) 和 Transformer,该模型取长补短,克服了 CNN 和 Transformer 本身的一些局限性。同时,借助这两种架构的优势,这种基于视觉 Transformer 的模型可以胜过现有架构,尤其是在小数据的情况下,同时在大数据的情况下也能实现类似的优秀性能。
  论文地址:https://arxiv.org/pdf/2103.10697.pdf GitHub 地址:https://github.com/facebookresearch/convit
  在视觉任务上非常成功的 CNN 依赖于架构本身内置的两个归纳偏置:局部相关性:邻近的像素是相关的;权重共享:图像的不同部分应该以相同的方式处理,无论它们的绝对位置如何。
  相比之下,基于自注意力机制的视觉模型(如 DeiT 和 DETR)最小化了归纳偏置。当在大数据集上进行训练时,这些模型的性能已经可以媲美甚至超过 CNN 。但在小数据集上训练时,它们往往很难学习有意义的表征。
  这就存在一种取舍权衡:CNN 强大的归纳偏置使得即使使用非常少的数据也能实现高性能,但当存在大量数据时,这些归纳偏置就可能会限制模型。相比之下,Transformer 具有最小的归纳偏置,这说明在小数据设置下是存在限制的,但同时这种灵活性让 Transformer 在大数据上性能优于 CNN。
  为此,Facebook 提出的 ConViT 模型使用 soft 卷积归纳偏置进行初始化,模型可以在必要时学会忽略这些偏置。
  soft 归纳偏置可以帮助模型不受限制地学习。hard 归纳偏置,例如 CNN 的架构约束,可以极大地提高学习的样本效率,但当数据集大小不确定时可能就会成为约束。ConViT 中的 soft 归纳偏置能够在不需要时被忽略,以避免模型受到约束限制。
  ConViT 工作原理
  ConViT 在 vision Transformer 的基础上进行了调整,以利用 soft 卷积归纳偏置,从而激励网络进行卷积操作。同时最重要的是,ConViT 允许模型自行决定是否要保持卷积。为了利用这种 soft 归纳偏置,研究者引入了一种称为「门控位置自注意力(gated positional self-attention,GPSA)」的位置自注意力形式,其模型学习门控参数 lambda,该参数用于平衡基于内容的自注意力和卷积初始化位置自注意力。
  如上图所示,ConViT(左)在 ViT 的基础上,将一些自注意力(SA)层用门控位置自注意力层(GPSA,右)替代。因为 GPSA 层涉及位置信息,因此在最后一个 GPSA层之后,类 token 会与隐藏表征联系到一起。
  有了 GPSA 层加持,ConViT 的性能优于 Facebook 去年提出的 DeiT 模型。例如,ConViT-S+ 性能略优于 DeiT-B(对比结果为 82.2% vs. 81.8%),而 ConViT-S + 使用的参数量只有 DeiT-B 的一半左右 (48M vs 86M)。而 ConViT 最大的改进是在有限的数据范围内,soft 卷积归纳偏置发挥了重要作用。例如,仅使用 5% 的训练数据时,ConViT 的性能明显优于 DeiT(对比结果为 47.8% vs. 34.8%)。
  此外,ConViT 在样本效率和参数效率方面也都优于 DeiT。如上图所示,左图为 ConViT-S 与 DeiT-S 的样本效率对比结果,这两个模型是在相同的超参数,且都是在 ImageNet-1k 的子集上训练完成的。图中绿色折线是 ConViT 相对于 DeiT 的提升。研究者还在 ImageNet-1k 上比较了 ConViT 模型与其他 ViT 以及 CNN 的 top-1 准确率,如上右图所示。
  除了 ConViT 的性能优势外,门控参数提供了一种简单的方法来理解模型训练后每一层的卷积程度。查看所有层,研究者发现 ConViT 在训练过程中对卷积位置注意力的关注逐渐减少。对于靠后的层,门控参数最终会收敛到接近 0,这表明卷积归纳偏置实际上被忽略了。然而,对于起始层来说,许多注意力头保持较高的门控值,这表明该网络利用早期层的卷积归纳偏置来辅助训练。
  上图展示了 DeiT (b) 及 ConViT (c) 注意力图的几个例子。σ(λ) 表示可学习的门控参数。接近 1 的值表示使用了卷积初始化,而接近 0 的值表示只使用了基于内容的注意力。注意,早期的 ConViT 层部分地维护了卷积初始化,而后面的层则完全基于内容。
  测试是在 ImageNet-1K 上进行的,没有进行知识蒸馏,结果如下:
  AI 模型的性能在很大程度上取决于训练这些模型所用的数据类型和数据规模。在学术研究和现实应用中,模型经常受到可用数据的限制。ConViT 提出的这种 soft 归纳偏置,在适当的时候能够被忽略,这种创造性的想法让构建更灵活的人工智能系统前进了一步。

中国航天器名字的由来嫦娥奔月嫦娥奔月这个故事从小到大我都不知道听过多少遍了。这个上古时代的神话故事最早被记录在淮南子等书中。可千万不要以为这就是一个普普通通的爱情故事,在字里行间还埋藏着古人对于星辰的测斜仪的基本工作原理是什么?快来了解一下吧点击上方大水牛测绘关注我们测斜仪的基本工作原理是基坑深部水平位移测试采用测斜仪,它可精确地测量沿垂直方向土层或围护结构内部水平位移的工程测量仪器。测斜仪分为活动式和固定式两种,在基中国内地高校12个学科世界第一软科2021世界一流学科排名发布高校排名中国内地高校12个学科世界第一软科2021世界一流学科排名发布5月26日,软科发布2021软科世界一流学科排名(ShanghaiRankingsGlobalRankingo捕获迄今最高能量光子!西南交大再立新功5月17日,中国科学院高能物理研究所和SpringerNature举行联合发布会,国家重大科技基础设施高海拔宇宙线观测站(LHAASO)在银河系内发现大量超高能宇宙加速器,并记录到陈清如逝世,今年已痛失15位两院院士据光明日报官方微博消息中国工程院院士中国矿业大学教授陈清如同志于2021年5月26日因病医治无效,在徐州逝世,享年95岁。陈清如公开资料显示,陈清如,1926年12月3日出生于浙江湖南大学院士天团前沿科技成果亮相上海近日,由中国工程院副院长钟志华,中国工程院院士机械与运载工程学院院长丁荣军,中国工程院院士欧阳晓平分别领衔的湖南大学智慧车列交通系统自主化国产IGBT1000公里纯电SUV成果亮相袁隆平院士一稻济世万家粮足杂交水稻之父袁隆平院士一稻济世万家粮足图袁隆平在查看水稻生长情况。新华社记者陆波岸摄5月22日13时07分,共和国勋章获得者中国工程院院士国家杂交水稻工程技术研究中心主任袁隆平,因北邮在自然发表基于Xray影像的肺部疾通用智能识别框架4月15日,北京邮电大学信息与通信工程学院王光宇(研究员博导)在顶级国际学术期刊自然子刊(NatureBiomedicalEngineering)在线发表文章,提出了基于Xray影西北工业大学张炜团队研发的物流无人机天马行空,大有可为近年来,国内物流行业蓬勃发展,加之通用机场如雨后春笋般萌发,物流无人机的广阔应用前景。近日,西工大航空学院张炜教授带领的XTEAM联合研制团队研发出一款名为天马的H型布局可垂直起降吴孟超院士披肝沥胆医者仁心中国肝胆外科之父吴孟超院士披肝沥胆医者仁心吴孟超在做手术。曹希摄(人民视觉)5月22日13时02分,中国科学院院士我国肝胆外科的开拓者和主要创始人之一原第二军医大学副校长吴孟超同志罕见天象超级血色月全食登场在即引发全球逐月潮据中国科学院紫金山天文台20日消息,2021年度重磅天象之一超级月亮红月亮月全食将于26日组团亮相。届时,一轮超级月亮将上演血月也有阴晴圆缺。据天文学家介绍,当月亮地球太阳三者在宇
有性格是一件奢侈的事情刚到达海边,夏天的体感突然强烈起来,热,湿润,浓郁,渴望风和绿荫。没有想过今年会频繁地来到北戴河,这里的活动实在丰富,丰富,听起来也有点像夏天。有个傍晚,在海边看到年轻的毕业生们在留住夏日,好物亦是美景有段时间天气阴晴不定,我感到夏天迟迟不来,一直到六月末重返三亚。海边的气候湿润温热,与此同时植物既茂盛又明亮。三亚艾迪逊的时装店画廊酒吧相继开业,都市风格一如既往。我从北京飞行两千2021全球机场排名发布,航空业仍在奋力连接世界距离上一次你怀着期待踏上旅途,有多久了?还记得吗?航站楼里满是与你一样兴奋的面孔,来自目的地的呼叫广播反复回响,未知又向往已久的远方仿佛即刻就可以抵达。在过去超过18个月的时间里,当新闻撕裂了情感,就让文学成为解药阿富汗中部偏北的山地byNasimDadfar追风筝的人灿烂千阳的作者卡勒德胡赛尼曾对纽约时报的记者表示长期以来,美国和世界其他地方的人了解的这个国家都是在死亡和破坏的背景下,很少年度50佳书籍和封面设计为什么书籍封面越来越重要?设计专业协会AmericanInstituteofGraphicArts(以下简称AIGA)终于在来自36个国家和地区的696份参赛作品中评选出了2020年度50佳书籍和封面设计。被人随手扔掉的咖啡外带杯,对她来说却是记录生活的藏品第一眼看到Jane收藏的那一堆咖啡外带杯,我既吃惊又怀疑她在收破烂吗?但是相比有趣的外带杯,这种先入为主的怀疑毕竟太粗鲁。我决定请她自己去说出其中的故事,因此也就有了下文。如果是对插画师或许就是最能读懂作家的人?不知道是不是因为那句别通过封面判断一本书的老话太深入人心,我们总会觉得,买下一本书时,当然首先是为文字买单,封面插画和版式只是一本书理所应当的附赠品。真是这样吗?想想你走进书店时,时髦了整整45年的POPEYE,其实有一颗忧郁的男孩心喜欢杂志的你,或许早就熟悉了这个故事1976年夏天,城市男孩圣经POPEYE发行了它的第一刊。第一期封面上就印着经典标语MagazineforCityBoys,粉红色的大力水手头顶科学界还没有办法进行完美解释的5种奇怪的疾病经过了多年的发展,现代科学取得了飞速的发展。在过去有许多无法被解释的事情都可以通过现代科学进行良好的解释,过去没有能够得到结局的难事也得到了解决。例如人类世界已经解决了水痘天花带来用手而非餐具吃饭可以带来的7个好处在不同地方拥有不同的饮食文化,这不仅仅在烹饪方式,在饮食的餐具和过程中也存在巨大的差异。例如,东亚人喜欢使用筷子,欧美的人们喜欢用刀叉。而在印度,人们习惯用手吃饭。虽然有不少人认为贝佐斯上天了!太空旅行的下一步是登陆火星?北京时间20日晚,蓝色起源的新谢泼德号载着杰夫贝佐斯(JeffBezos)和他的弟弟82岁的水星13号和航空先驱沃利芬克以及18岁的奥利弗戴门一起飞向太空亚轨道,并成功返航,顺利着