范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

华人博士提出模型SwinIR,33的参数量就碾压图像修复领域sota

  来源:arXiv
  编辑:LRS  【新智元导读】参数量和模型的性能有绝对关系吗?苏黎世华人博士提出SwinIR模型,实验结果告诉你,越小的模型还可能更强!SwinIR使用Transformer力压CNN,又在图像修复领域屠榜,模型参数量降低67%,再也不要唯参数量论英雄了!
  图像修复(image restoration)是一个受到长期关注和研究的最基础的CV问题,它能够从低质量的图像,例如缩略图、有噪音的图或是压缩图像中恢复为原始高质量图像。
  但目前图像修复领域的sota方法都是基于卷积神经网络CNN的,但是很少有人尝试使用Transformer,尽管ViT在高级视觉任务中早已占据排行榜多年。
  来自苏黎世联邦理工学院的华人博士提出一个适用于图像修复的模型SwinIR,主要包括浅层特征提取、深层特征提取和高质量图像重建三部分。
  实验结果证明SwinIR的 性能比目前sota方法提高了0.14-0.45dB,并且参数量还降低了67%。
  论文地址:https://arxiv.org/abs/2108.10257
  项目地址:https://github.com/JingyunLiang/SwinIR
  大多数基于CNN的方法侧重于精细的架构设计,如residual learning和dense learning,通过巧妙的模型设计来提升性能,增大模型容量。
  虽然与传统的基于模型的方法相比CNN的性能有了显著的提高,但通常会遇到 两个源于卷积层的基本问题 :
  1)图像和卷积核之间的交互与内容无关。使用相同的卷积核来恢复不同的图像区域可能不是最佳选择;
  2)由于CNN更关注局部特征,所以卷积对于长依赖性、全局的特征建模是效果不好。
  在这种情况下,很容易想到Transformer来替代CNN。Transformer的自注意力机制能够很好地捕获上下文之间的全局交互,并在多个视觉任务上具有出了良好的表现。
  然而, 用于图像修复的ViT需要将输入图像分割为具有固定大小(例如48×48)的patch, 并对每个部分进行单独处理。
  这种策略不可避免地会产生 两个缺点:
  1)边界像素不能利用块外的相邻像素进行图像恢复;
  2)恢复的图像可能会在每个图像块周围引入边界伪影。
  虽然这个问题可以通过patch重叠来缓解,但它会带来额外的计算负担。
  模型设计
  SwinIR的设计基于Swin Transformer,包括三个部分:
  1)浅层特征抽取shallow feature extraction
  浅层特征提取模块采用卷积层提取浅层特征,并将浅层特征直接传输到重构模块,以保留低频信息。
  2)深层特征抽取deep feature extraction
  深层特征提取模块主要由residual Swin Transformer Block(RSTB)组成组成,每个块利用多个Swin Transformer layer(STL)进行局部注意力和交叉窗口的交互。此外,还在块的末尾添加一个卷积层以增强特征,并使用残差连接为特征聚合提供快捷方式,也就是说RSTB由多个STL和一个卷积层共同构成残差块,
  3)高质量图像重建high-quality(HQ) image reconstructi
  重建模块是最后一步,融合了浅层和深层特征用了恢复高质量的图像。
  在实验方面,作者首先研究了通道数,RSTB数目和STL数目对结果的影响。可以观察到PSNR与这三个超参数正相关。对于信道数,虽然性能不断提高,但参数量呈二次增长。为了平衡性能和模型尺寸,在剩下的实验中选择180作为通道数。对于RSTB数和层数,性能增益逐渐饱和,所以后续实验设置为6以获得一个相对较小的模型。
  和经典的图像超分辨率(super-resolution, SR)模型对,包括DBPN、RCAN、RRDB、SAN、IGNN、HAN、NLSA和IPT。可以看出,当在DIV2K数据上进行训练时,SwinIR在几乎所有五个基准数据集的所有比例因子上都取得了最佳性能,在Manga109在4倍缩放上的最大PSNR增益达到0.26dB。
  不过需要注意的是,RCAN和HAN引入了通道和空间注意力,IGNN提出了自适应patch特征聚合,NLSA基于非局部注意机制。所有这些基于CNN的注意机制的表现都不如所提出的基于Transformer的SwinIR,这也表明了文中所提出模型的有效性。
  当在更大的数据集(DIV2K+Flickr2K)上训练SwinIR时,性能进一步大幅度提高,也实现了比基于Transformer的模型IPT更好的精度,达到0.47dB。即使IPT在训练中使用ImageNet(超过一百三十万图像),并且具有超过一亿的参数。相比之下,即使与基于CNN的sota模型相比,SwinIR的参数也很少(1500万-4430万)。
  在运行时方面,与基于CNN的代表性的模型RCAN相比,IPT和SwinIR在1024×1024分别需要约0.2、4.5和1.1秒。
  实验结果
  从可视化结果来看,SwinIR可以恢复高频细节并减轻模糊瑕疵,并产生锐利且自然的边缘。
  相比之下,大多数基于CNN的方法会产生模糊的图像,甚至是不正确的纹理。与基于CNN的方法相比,IPT生成的图像更好,但它存在图像失真和边界伪影。
  在图像降噪任务上,比较的方法包括传统模型BM3D和WNNM,基于CNN的模型DnCNN,IR-CNN,FFDNet,N3Net,NLRN,FOC-Net,RNAN,MWCNN和DRUNet。可以看到SwinIR模型比所有方法都强。
  特别是它在具有100个高分辨率测试图像的大型Urban100数据集上通过最先进的DRUNet模型,最高可达0.3dB,并且SwinIR只有1200万的参数,而DRUNet有三亿参数,也就能侧面证明SwinIR的架构在学习用于图像恢复的特征表示方面是高效的。
  SwinIR模型可以去除严重的噪声干扰并保留高频图像细节,从而获得更清晰的边缘和更自然的纹理。相比之下,其他方法要么过于平滑,要么过于锐利,无法恢复丰富的纹理。
  参考资料:
  https://arxiv.org/abs/2108.10257

外企搬迁去印度越南等国家,中国世界工厂地位会被取代吗?18世纪的英国是世界上率先完成工业革命的国家英国带领人类进入了蒸汽时代。这一时代英国的工业产值占据了世界工业总产值的40。18世纪末19世纪初发源于英国的第一次工业革命已在欧洲大陆中国人拥有的北海道土地面积超过静冈县?自日本农林水产省林野厅开始收集公布信息以来,外国资本收购日本森林持续增加,截至2021年,累计收购面积达2376公顷,是2010年的4。2倍。收购对象也逐渐从森林扩展到其他不动产。著名国画家柏建国艺术作品欣赏著名国画家柏建国艺术作品欣赏,2021。05。26。柏建国,1960年生于古都金陵,长于玄武湖畔。自幼习画,勤于笔耕数十载,其立雪程门,转益多师,醉心传统,博采众长,尤其是写意花鸟中国著名画家桑建国工笔人物画作品欣赏中国著名画家桑建国工笔人物画作品欣赏画家桑建国1957年6月生于上海市,1982年毕业于安徽师范大学艺术系中国画专业并留校任教,1993年在南京艺术学院人物画进修班进修一年,200周腾山艺术作品欣赏,2021。06。20。周腾山个人介绍祖藉安徽巢湖人,生于1959年12月7日,生于南京。1992年,支持北京申办2000年奥运会(江苏省南京电信局发行)龙卡设计者周腾山。1993年,南京红太阳大世界装饰流浪艺术家周腾山2021。08。28。祖藉安徽巢湖人,生于1959年12月7日,生于南京。1992年,支持北京申办2000年奥运会(中国江苏省南京电信局发行)龙卡设计者周腾山。1993年,南京红太阳大世界装饰城,标记设历史性时刻!!北京时间今天22点18分SpaceX载人龙飞船正式对接ISS(国际空间站)。这是飞船在凌晨3点22分发射升空后迎来的关键时刻,完成对接后,开舱门是在6月1日零点45分,国际空间站的多尔衮眼光独到,占领北京后下令迁都,奠定大清百年基业皇太极死后,经过激烈争夺,为了稳定大局,多尔衮豪格代善等人最终选择互相妥协,成就了六岁的福临。福临继位后,大权掌握在多尔衮手里。继承人确定之后,大清便将目光转向了山海关顺治元年(1时代今朝光辉见证庆祝中国共产党成立一百周年河北美术优秀作品展展览现场2021年9月7日9月24日,时代今朝光辉见证庆祝中国共产党成立一百周年河北美术优秀作品展在石家庄市美术馆展出。本次展览分为3个单元,共邀请97位艺术家,陈列121件作品。2022年优秀大学指南CDU被评为毕业生就业率和起薪的5星大学最新2022年优秀大学指南(TheGoodUniversityGuide)排名已经发布,查尔斯达尔文大学在毕业生就业率中再取佳绩!研究生毕业全职工作就业成绩排名第一在2022年优秀优秀!堪培拉被评为全球第二大卫生城市一份最新研究显示,在世界最卫生城市的名单中,堪培拉排名第二,仅次于德国的柏林。这项评选根据世界各地的城市的污染水平固体废物生产量回收和堆肥率洗手文化,以及国家洗手液进口量等因素进行
別上当!印度在加勒万搞纠纷!目的是掩盖占我4。5万平方公里领土加勒万河谷纠纷依旧在持续!印度媒体报道印度斯坦时报20日报道称,中印双方在边境实控线西段的紧张局势升级。匿名消息人士表示,双方在该地区都增派了部队,特别是典角加勒万河谷斗拉特别奥里特朗普制造西太紧张局势,目的捞取选票,收割A股,而非真要战争最近网友们议论纷纷特朗普的系列疯狂表现,是不是要打仗了?老金说不会,特朗普制造紧张局势的两大目的,都无关战争,所谓的要爆发战争只不过是一个吓唬人的幌子而已首先,制造西太地区紧张局势地球大猜想!她是无意识生命体地球,在太阳系运转的呵护下,一直演化至今。但是,在远古时代!一域外之物近向太阳系而来。似乎!是有着强烈目的般,此物越接近地球,他的曲线轨迹越小,在临近地球外域时。他直射大洋深处,或特朗普你不允许恢复中美直航,我就不让你40万留学生回国美国的新冠疫情已经接近160万!丝毫没有止步迹象。随着疫情的加重,我国在美国的40万留学生忧心忡忡!现在已经到了放暑假的时候,留在美国肯定不行,走到何处都有可能被感染新冠肺炎!一旦8位领导人5位被杀!在阿富汗当领导人真要命,韩国总统魔咒算什么大家都知道韩国有个总统魔咒凡是当过韩国总统的,几乎都没有好下场,不是被流放,被刺杀,就是下台后被审判,坐监牢!很多人不知道!在帝国坟场阿富汗的领导人魔咒面前,韩国的总统魔咒简直就是歼10A搭档苏30MK2,中型机领导重型机,雷达先进者为王最近央广军事节目报道了我军东部战区海军航空兵开展春季训练的情景,训练当中出现了一个颠覆军迷们认知的事情,就是歼10A与苏30MK2搭档组合进行模拟空战时,由歼10A担任空中长机,利塔利班3天攻4城,美国肠子悔青!下令大轰炸,却把学校夷为平地作者虹摄库尔斯克随着美军撤离,塔利班开始从农村进入城市,攻势凌厉,最近更是3天连下4城。8月6日,拿下尼姆鲁兹省省会扎兰季市,这是美国宣布撤军后,塔利班占领的第一个省会城市第二天,教育部称要让学生在劳动实践中出力出汗,发言引来网友热议称赞中华民族自古就有勤劳能干爱家爱业的优良传统,这些都源自在土地上耕种的我们曾经用自己的双手给生活一笔一笔地增上了美好的颜色。朴实且踏实的我们就这样把古老文明一代一代的延续下来,在这片古井水悠悠(小说)古井水悠悠(小说)汴梁客子逸子逸物语村子极小,姓却不少。七家十来姓,都原是从别处迁来,或是倒插门做女婿,随三姑四姨住亲戚的。村里有眼井,不知何时开凿,光溜溜的几块残破青石,便做了台瓦良格号巡洋舰老同志了,能否再战四海,重现红海军的光荣瓦良格巡洋舰正在通过土耳其博斯布鲁斯海峡,与巍峨的跨海峡大桥相比,这艘满载排水量12000吨的重型巡洋舰一点也不渺小,并且在晨雾当中尽显苏俄战舰的暴力美学。由于是太平洋舰队的旗舰瓦9旬老党员跳河救起9旬落水者革命者永远年轻90岁的恒子奶奶在自己的人间值得这本书中讲述,人这一生,能照亮某个角落就够了。在90岁,依旧可以有很多的开始,也可以创造很多的价值。7月10日,江苏常州一9旬老人在河边乘凉时,不慎