范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

何恺明时隔两年再发一作论文为视觉大模型开路,CVPR2022最佳论文候选预定

  大神话不多,但每一次一作论文,必定引发江湖震动。
  这不,距离上一篇一作论文 2 年之后,何恺明再次以一作身份,带来最新研究。
  依然是视觉领域的研究 ,依然是何恺明式的大道至简。
  甚至在业内纷纷追求"大力出奇迹"、"暴力美学"的当下,何恺明还带着一种坚持独立思考的反共识气概。
  简洁:通篇论文没有一个公式。
  有效:大巧不工,用最简单的方法展现精妙之美。
  江湖震动:"CVPR 2022 最佳论文候选预定"。
  所以,何恺明新作《Masked Autoencoders Are Scalable Vision Learners》究竟有怎样的思想和研究成果?
  用于 CV 的自监督学习方案
  本文提出了一种用于计算机视觉的 Masked AutoEncoders 掩蔽自编码器,简称 MAE,一种类似于 NLP 技术的自我监督方法。
  操作很简单:对输入图像的随机区块进行掩蔽,然后重建缺失的像素。
  主要有两个核心设计。
  一个是非对称的编码-解码架构,一个高比例遮蔽输入图像。
  先来看编码-解码架构。
  如图所示,编码器是 ViT,它仅对可见区块进行操作,然后用一个轻量级编码器 —— 仅在预训练期间负责图像重建任务。
  具体而言,作者先将图像均匀划分为非重叠区块,然后随机对区块进行采样。
  以遮蔽比例 75% 为例,它先在输入图像中掩蔽 75% 的随机区块,编码器只在可见的 25% 区块子集上运行,这样就可以只用非常少的计算和显存,来训练非常大的编码器。
  然后解码器将可见的 token 和掩码 token 组合,并向所有 token 中添加位置嵌入,通过预测每个掩蔽区块的像素值来重建图像信号。
  这样一来,在预训练时解码器可以独立于编码器,从而可以用非常轻量级解码器实验,大量减少预训练时间。
  另一个特点则是对输入图像的高比例进行遮蔽时,自监督任务效果非常好。
  比如,掩蔽掉 80% 随机 patch 的效果如下:
  其中最左列为输入图像,中间列为 MAE 方法重建效果,最右侧为原图效果。
  不同掩蔽比例在重建图像中的表现对比如下:
  将这两种设计结合,结果用来训练大模型:
  训练速度提升 3 倍以上,还提高准确率的那种 。
  除此之外,基于该方案所得出的大模型具备很好的泛化能力:
  比如,在仅使用 ImageNet-1K 数据时,ViT-Huge 模型准确性达 87.8%。
  在 COCO 数据集中的表现如下,虽然重建效果不清晰,但是基本语义是正确的。
  研究者还对 MAE 迁移学习的性能进行了评估。
  结果在下游任务,比如目标检测、实例分割、语义分割等任务都优于监督预训练。
  在对比中可以看到,随机遮蔽 75%、整块遮蔽 50% 和网格遮蔽 50% 的三种采样方法中,随机遮蔽 75% 重建图像的质量最好。
  基于这些研究成果,何恺明团队在最后也表达了他们的看法。
  一方面,扩展性好的简单算法是深度学习的核心。
  在计算机视觉中,尽管自监督学习方面取得了进展,但实际预训练仍需受到监督。
  这项研究中,作者看到 ImageNet 和迁移学习任务中,自编码器表现出了非常强的可扩展优势。
  为此作者认为,CV 中自监督学习现在可能正走上与 NLP 类似的轨道 。
  另一方面,作者注意,图像和语言是不同性质的信号,这种差异需要小心处理。
  图像仅仅是记录下来的光,并没有语义分解为文字的视觉类似物。
  他们不是去试图去除物体,而是去除可能不构成语义段的随机区块。重建的像素,也并不是语义实体。研究团队
  论文的研究团队,来自 Facebook AI 研究院(FAIR),每个人都屡屡获誉,堪称梦之队。
  除了几位老将,我们这次再多说说里面的华人面孔。
  Xinlei Chen,本科毕业于浙江大学计算机专业,随后在卡内基梅隆大学攻读博士学位,曾在 UCLA、谷歌云、MSR 实习。
  谢赛宁,本科毕业于上海交通大学 ACM 班,随后在 UC 圣迭戈分校攻读计算机博士学位,曾在谷歌、DeepMind 实习。
  Yanghao Li,本科毕业于北京大学计算机专业,随后留在本校继续攻读硕士学位。
  最后,再次隆重介绍下何恺明。
  一作何恺明,想必大家都不陌生。作为 Mask R-CNN 的主要提出者,他已 4 次斩获顶会最佳论文 。
  何恺明是 2003 年广东高考状元,并保送了清华,进入杨振宁发起设立的物理系基础科学班。
  硕博阶段,何恺明前往香港中文大学多媒体实验室,导师正是后来的商汤科技创始人汤晓鸥。
  此间,何恺明还进入微软亚洲研究院实习,在孙剑指导下,以一作身份发表 ResNet 研究,一举成名天下知,荣获 2016 年 CVPR 最佳论文。
  同年何恺明进入由 Yann Lecun(获 2019 年图灵奖)掌舵的 Facebook 人工智能实验室,与 Ross Girshick、Piotr Dollar—— 本次研究中的其他几位老面孔,组成了 FAIR 在 AI 研究领域的梦之队。
  更加令人钦佩的是,何恺明年少成名,但这几年来依然不断潜心研究,一直带来新惊喜。
  甚至他的新研究,很多都是那种可以开枝散叶的成果。
  这一次,MAE 同样被视为这样的延续。
  你怎么看 MAE?

骑自行车到月球需要多长时间?24小时不停仅需267天据美国连线杂志报道,美国宇航员尼尔阿姆斯特朗成为第一个登上月球表面的人,现在迎来了阿波罗11号宇航员登月50周年纪念日,尽管50年过去了,但是人类成功登陆月球仍是一件非常奇妙充满神我国高铁时速超300公里不晕车原因揭晓夹层玻璃无畸变,驾驶员技术过硬IT之家4月11日消息今日中国铁路官方微博发表文章,详细介绍了我国高铁列车不晕车的原因。日常生活中有人乘坐时速80公里的轿车都会晕车,然而高铁速度超过300公里,却依然不会感到晕车囧科技妇女节女神们放假半天,青岛一公司男同胞女装上阵享同等待遇明天是国际劳动妇女节,全称联合国妇女权益和国际和平日联合国女权和国际和平日(UnitedNationswomen39srightsandinternationalpeaceday)字节跳动研发并行翻译技术,可将翻译速度提升数十倍7月16日消息,在WMT2021国际机器翻译大赛上,字节跳动火山翻译团队以并行翻译系统参赛,获得德语到英语方向机器翻译比赛自动评估第一名。并行翻译在国际大赛首次亮相,就成功击败了从巴西国家博物馆大火原因查明系空调引发,非人为纵火IT之家4月6日消息去年9月2日,位于巴西里约热内卢的巴西国家博物馆发生火灾,火灾导致2000多万件文物被烧毁,有关于此次火灾的事故报告于近日出炉,报告显示,火灾系由空调引发,非人囧科技买二手手机要注意什么?总结连环82问感谢IT之家网友学士的线索投递!IT之家1月29日消息随着人们消费水平的提升以及科技产品的快速更新换代,不少人手里已经有用不上的数码电子产品了,一部分人会选择将产品收藏起来吃灰,也民航局发布适航指令停飞国内所有GA8型飞机IT之家7月22日消息本月20日,中国民用航空沈阳航空器适航审定中心发布适航指令,要求在中国登记注册的所有GA8GA8TC320型飞机禁止所有飞行,该指令自7月20日起生效。此次民民航局波音737MAX机型停飞导致暑运供需矛盾突出IT之家7月9日消息日前,中国民航局运输司副司长于彪日在新闻发布会上表示,因波音737MAX机型存在重大隐患,中国各航空公司停飞737MAX8飞机,暑运供需矛盾可能会比较突出。今年我国民航局受邀参与波音737MAX审查,但尚未决定是否加入IT之家4月6日消息据央视新闻报道,美国联邦航空局日前宣布将成立审查委员会,对波音737MAX的安全性展开评估。中国民航局目前已收到邀请,但尚未决定是否加入。埃塞航空空难事故发生后第787架波音787飞机交付南航,已成功降落广州机场IT之家12月15日消息今天早上624,全球第787架波音787飞机交付南航,这架飞机已经顺利降落广州白云机场。这架飞机的注册编号为B1168,机身有特别涂装787thBOEING用4万伏电压代替发动机,这架quot离子风quot飞机飞了60米11月23日消息,据国外媒体报道,日前麻省理工学院研究人员造出史上第一架固态飞机,其推进系统中没有任何活动部件。这架飞机成功在空中飞行了60米,从而证实在没有喷气机或螺旋桨情况下飞
科学家发现,地下光纤能够用来监控城市活动汽车和行人所产生的震动会使地下线缆产生独特的信号。现在,科学家利用这一特性展示了新冠疫情对人们日常生活的影响。2020年春天,美国宾夕法尼亚州立大学的主校园区(称为州学院,行政级别北京冬奥会开幕式震撼刷屏,这些黑科技立了大功!全球最大8K超高清地面显示系统,冰立方破冰成奥运五环芯东西2月5日报道,昨晚,2022年北京冬奥会开幕式圆满举行,在这立春时节,向世界人民奉献了一场无与伦比的视觉盛宴。北京冬奥会开幕式总导演张艺谋用了4个词来形容今晚的开幕式空灵浪漫科普HiFi级SSD音质是什么鬼,音质玄学不值得相信近年来,音频圈子的热点在于蓝牙无线,但折腾传统PCHiFi的朋友也为数不少。然而相比方兴未艾的无线音频市场,发展了多年的传统PCHiFi圈子甚至显得更加不成熟,玄学神论层出不穷。一2002年就有人让猴子用意念玩游戏,但马斯克做的事依然很重要埃隆马斯克(ElonMusk)旗下脑机接口公司Neuralink最近发布了新视频,显示大脑中植入芯片的猴子能够用思维打电脑游戏,从而引发了热议。但有专家指出,这实际上算不上新鲜事儿航空专家释疑为什么必须找到黑匣子?数据为何不能云同步?搭载着132位乘客的东航波音737客机,在由云南飞往广东的路途中,不幸在广西境内坠落,至本文发稿时救援工作正在紧急进行之中。除了为这些同胞和他们的家人祈祷,我们也带着一些疑问咨询了地球卫星轨道资源有限且不可再生,低轨卫星竞争已打响IT之家9月13日消息据央视新闻报道,卫星互联网领域,目前看似美国星链计划一家独大,但事实上地球低空轨道的竞争早已全面展开。越来越多国家和企业正投入到这一领域当中。目前,已经发布的知名物理学家SpaceX已经遥遥领先于蓝色起源10月14日消息,据外媒报道,日裔美籍理论物理学家加来道雄周三表示,在太空探索方面,埃隆马斯克(ElonMusk)旗下太空探索技术公司SpaceX已经遥遥领先杰夫贝索斯(JeffB90岁演员上太空打破纪录,蓝色起源成功发射新谢泼德号火箭北京时间10月13日晚间消息,据报道,亚马逊创始人杰夫贝索斯(JeffBezos)旗下太空探索技术公司蓝色起源(BlueOrigin)刚刚成功地发射了一枚新谢泼德号(NewShep富豪的太空竞赛马斯克欲深空探索行业,贝索斯不甘出局北京时间10月12日消息,世界首富美国太空探索技术公司(SpaceX)CEO埃隆马斯克(ElonMusk)周一兑现了承诺,在Twitter上给对手蓝色起源的创始人杰夫贝索斯(Jef受天气影响,贝索斯蓝色起源NS18发射任务推延北京时间10月11上午消息,受风向气候影响,贝索斯商业航天火箭发射企业BlueOrigin的任务运营团队已决定推迟NS18的发射,现在的目标是10月13日星期三。从一号发射场升空目日本宇航机构在预定时间的19秒前紧急停止艾普斯龙火箭发射IT之家10月2日消息据共同社报道,日本宇宙航空研究开发机构(JAXA)在昨日上午于预定时间的19秒前紧急停止小型艾普斯龙火箭5号机的发射作业。该火箭搭载了高知工业高等专门学校等1