范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

囿于数据少?PaddleDetection少样本迁移学习助你一键突围!

  目标检测是非常基础和重要的计算机视觉任务,在各行业有非常广泛的应用。然而,在很多领域的实际落地过程中,由于样本稀缺、标注成本高或业务冷启动等困难,难以训练出可靠的模型。
  在目标检测这类较为复杂的学习任务上,样本不足带来的挑战更加棘手,因为模型复杂度高意味着对训练数据量有更高的要求,否则很容易导致模型过拟合。应对这类问题,一类常见的思路是迁移学习,即依赖资源丰富的源数据集或强大的预训练模型,为下游任务提供额外引导。而少样本学习是一类特殊的迁移学习任务,其针对的是每个标注类型仅有几十甚至几个样本的情况。
  为了解决这个问题,飞桨联合百度研究院大数据实验室,发布两种少样本迁移学习的新算法,从不同角度应对标注不足的挑战,提升模型学习效果。
  ▎跨领域 Label Co-tuning 算法
  该方法的主要思路是充分利用预训练模型的语义空间,挖掘其与下游任务的关联,计算出类别之间的关系作为下游任务的辅助语义标签,作为原始one-hot类别标签的补充。
  ▎领域内 Contrastive Tuning 算法
  对比学习是一种通用的表征学习思路,可以学习样例级的判别特征,也可视为一种有效的数据增强策略。该算法针对目标检测的任务特性,实现patch级别的对比学习,以强化目标领域的表征学习效果。
  快速体验
  您可以下载 PaddleDetection 最新代码体验我们的算法。
  https://github.com/PaddlePaddle/PaddleDetection/tree/develop
  上述少样本学习算法在套件中高度封装,接口简单,只需使用我们提供的配置样例,或在原配置文件中添加少样本学习算法,即可使用算法训练。
  具体可参照我们的使用说明
  https://github.com/PaddlePaddle/PaddleDetection/tree/develop/configs/few-shot
  接下来,本文将从"跨领域 Label Co-tuning 算法"和"领域内 Contrastive Tuning 算法"两个方面来解读 PaddleDetection 少样本迁移学习新算法的方案技术。
  01
  跨领域 Label Co-tuning 算法   ■ 算法原理   少样本学习的一个普遍思路是在预训练模型基础上进行微调,然而这种直接的方式面临明显的挑战。   挑战一: 当下游任务样本量太少时,很容易导致模型在目标数据集上过拟合,最终,微调后的模型泛化能力差。   挑战二: 在微调过程中,如果直接将预训练任务的分类头舍弃,重新初始化,会导致大量预训练模型所学到的信息丢失。而这些信息可能对于预训练模型知识迁移至目标数据集很重要。   针对以上的问题,清华大学的 Kaichao You 等人在 NeurIPS2020发表了 Label Co-tuning[1]算法,该算法是一种针对图像分类任务的迁移学习算法。其主要思路是对预训练类别空间 Ys 和目标任务类别空间Yt的关联进行建模。在微调之前,预先学习预训练类别 ys∈Ys 和 yt∈Yt 之间的条件概率分布,即 p(ys|yt),作为目标类别的一种辅助语义标签。这样可以有效的降低少量目标样本过拟合其标签的风险,同时预训练模型的分类头也将被重用,提供目标数据在 Ys 类别空间的预测结果,充分挖掘了预训练模型的迁移潜力。   以下为一个直观的例子,演示为何 Label Co-tuning 方法能够有效。如果我们的预训练数据集是具有1000类物体的 ImageNet ,而下游目标任务是 COCO 图像分类。此时,上下游任务之间存在大量有关联但又不完全相同的类别。如 COCO 中有"大象"这一类别,而 ImageNet 则粒度更细,包含"印度象"和"非洲象"。   由于不同数据集中,图像本身的视觉特征也存在一定差异,那么即使在类别的语义概念上有明显重合,其真实关联多数情况下也是比较隐晦、复杂,难以通过人工经验来指定。所以比较严谨的方式是通过学习的方式,建立起 Ys 和 Yt 两个完整类别空间的概率分布关系。如下图所示。   学习到这种类别关系后,对于每个目标数据集的样本(xi,yi),我们在微调过程中除了要拟合其原始的 one-hot 类别标签 yi 外,还会利用一个额外的预训练任务分类头拟合辅助语义标签 p(ys|yt=yi),这个辅助标签的长度和预训练分类数相同,是一个 soft label。   ■ 算法实现   我们对该原型算法进行了改造和扩展,使其适合目标检测任务,并在 PaddleDetection 的经典结构 Faster RCNN 上添加了对 Label Co-tuning 算法的支持。在上下游类别关系矩阵的计算中,考虑到目标检测任务的特点,我们使用每个 patch,而非每张图片作为一个样本。具体而言,需要从目标任务的训练数据中,直接提取出 bounding box 的标注,并在前向计算中获得该 ground truth 区域在预训练分类头上的预测结果,同时结合其自身标注的目标类别,来一起计算关系矩阵签 p(ys|yt)。需要注意的是,Label Co-tuning 虽然利用了完整的预训练模型,但并不需要预训练任务的数据集,关系矩阵是完全利用目标任务训练集计算出来的。   同样的,在微调过程中,我们也在 bounding box 粒度上应用辅助语义标签。对于每一个需要预测的检测框,我们除了拟合原始的类别标签和位置外,还会额外的拟合其在预训练语义空间上的 soft label。   02
  领域内 Contrastive Tuning 算法   ■ 算法原理   对比学习是一种很有潜力的自监督表征学习方式,一般被用于预训练阶段学习图像的通用的视觉表征。而近期的一些研究表明,在常规的监督学习任务中,合理引入对比学习也能提升模型的判别效果,如分类、检测、分割等。基于这一思路,南加州大学的 Bo Sun 等人实现了检测框粒度上的自监督学习方法[2],可以显著提升少样本目标检测效果,并将成果发表在 CVPR 2021。   该算法本质上有别于通常的样本级对比学习,通常的对比学习选择将每个样本的不同变换作为正例,其他样本作为负例。而在检测任务上,该方法引入了类别级的对比学习,但以每个 bounding box 为样本单元,即属于同类别的检测框之间互为正例,而不同类别则作为负例。   通过这样一种类别对比的方式,算法在微调过程中引入额外的 loss 来引导模型对同类 patch 学习更加紧密的表征,而不同类 patch 的表征则区别更加明显,如下图所示。   ■ 算法实现   和Label Co-tuning算法相比,这种 Contrastive Tuning 的方法更加通用,虽然没有改进对预训练模型的复用,但其优点是对任务所做的假设更少,例如不需要依赖预训练任务和目标任务之间的潜在关联。在原始论文中,该算法仅适用于二阶段的 Faster RCNN 模型。我们对算法进行了扩展和改进,使其能够应用于 PaddleDetection 最新的 PP-YOLOE 系列模型。   PP-YOLOE 系列模型具备非常出色的精度和效率,同时模型结构也大为精炼。但对于 Contrastive Tuning 来说,这种单阶段模型由于简化了 Anchor 生成和筛选的过程,使得中间过程中存在大量无效的 patch,增加对比学习的计算负担。   针对此问题,我们引入了一种均衡策略,从采样和损失两方面对 Contrastive Tuning 的计算效率进行优化,同时不影响计算精度。具体来说,在前向计算的采样过程中,我们只对正样本 patch 全部保留,而对负样本 patch 选择随机采样,来保持正负样本的合理配比。在计算 Contrastive loss 时,我们根据当前 patch 的 IoU 得分来设定阈值,仅对得分高于阈值的样本点进行 loss 回传。   03
  算法效果   ▎项目传送门   PaddleDetection 少样本学习算法体验   https://github.com/PaddlePaddle/PaddleDetection/tree/develop/configs/few-shot   PaddleDetection 官方库   https://github.com/PaddlePaddle/PaddleDetection   欢迎大家扫描下方二维码加入 PaddleDetection 官方技术交流群~   飞桨公众号后台回复关键词: PaddleDetection ,获取更多学习资料包。   ▎参考文献   [1] You, Kaichao, et al. "Co-tuning for transfer learning." Advances in Neural Information Processing Systems 33 (2020): 17236-17246.   [2] Sun, Bo, et al. "Fsce: Few-shot object detection via contrastive proposal encoding." Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2021.

从众星捧月到千夫所指!细数C罗的七宗罪高大帅气的形象,精湛的球技,傲人的数据,无数的个人和集体荣誉,让C罗被无数球迷视为偶像。然而从本赛季伊始,短短半年时间,他就沦为了球队的弃子,媒体口诛笔伐的对象,球迷茶余饭后的笑料北京中华世纪坛秋色北京中华世纪坛秋色文图张卫平自古逢秋悲寂寥,我言秋日胜春朝。晴空一鹤排云上,便引诗情到碧霄。北京的深秋时节,金黄色的秋叶与秋高气爽的蓝天,交相辉映,美仑美奂。中华世纪坛,坐落于北京年龄越大,越要多吃肉?专家建议过了50岁,这3种肉可适当多吃大家常说爱情是永恒的主题,死亡是是一个永恒的主题,之所以是永恒,一是因为它的无解,二是因为它重要,也是人们无法避开的事情。生命体在它产生的那一刻起,就意味它有结束的一天,由一个单细航拍湖北襄阳古城护城河畔层林尽染襄阳古城仲宣楼一角杨东摄五彩斑斓的树木与护城河相映成景杨东摄航拍襄阳古城环城公园风景如画杨东摄航拍襄阳古城护城河畔层林尽染杨东摄11月14日,湖北省襄阳市,环绕襄阳古城的环城公园层1983年最后一位军统北平站站长被抓16岁参加军统,潜伏北京多年共产党人为什么会胜利?国民党人为什么会失败?有一点原因很重要,就是两党的人都很偏执。共产党人是对革命理想的偏执,为了解救全天下的劳苦大众,勇往直前!而国民党人是对名利的偏执,为了满40岁北京中产卖房移民,在国外做电工一小时赚400去国外做蓝领,已经成为一部分人的人生选择。这意味着远离内卷,变得松弛,但同时,也丢掉了自己奋斗多年的履历,一切从零开始。我们找了几位出海打工的人,他们为什么愿意放下原有的积累?如何蔡衍明之子在乌镇演讲期待两岸交流继续向前迈进2022年世界互联网大会乌镇峰会9日开幕,旺旺中时媒体集团蔡绍中总裁在海峡两岸暨港澳互联网发展分论坛致词。(图片来源于台媒)华夏经纬网11月14日讯2022年世界互联网大会乌镇峰会大盘盈亏金额人口因素大家好,这是小简同学写的第五篇原创文章,如果您想和我互动,请关注我,并在评论区留言讨论。作为一名投资者,唯一担心的宏观因素就是人口减少以及老龄化,人口红利消失,各个行业(除去医药行抢中国烟草饭碗?三年赚3000多亿,女富豪汪莹到底有多厉害?小小一支电子烟,到底有多大能量,能够让一个人实现在短短三年内,带领一家公司从创办融资到上市,再跻身中国女富豪的传奇?而这位传奇的女富豪,敢和中国烟草抢饭碗,她是谁?她又有多大能耐?国内10大雪景不输国外,你去过哪个?1。长白山地址白山市抚松县松江河镇长白山景区是国家AAAAA级旅游景区,主峰白头山多白色浮石与积雪而得名,素有千年积雪万年松,直上人间第一峰的美誉。景区是拥有神山圣水奇林仙果等盛誉油价最新调整今天11月14日,国内汽柴油调整后最新售价油价调整消息油价再次翩翩起舞,开始了连续不断的上涨步伐,近日在微微的下跌之后,再次迎来了大幅度的反弹,经过多日上涨努力不懈,美油再次接近了89美元,甚至距离突破90美元桶也是近在眼
中央连发2份重磅文件!这类学科,北京师范大学是国家中坚力量!党的十八大以来,以习近平同志为核心的党中央高度重视哲学社会科学事业。2022年以来,中共中央连发两份重要文件,积极推动哲学社会科学稳步发展4月27日,中共中央办公厅印发国家十四五时中方警告不惜一战后,朱立伦态度大变反台独,愿与北京对话在刚刚结束的新加坡香格里拉对话上,中国国务委员兼国防部长魏凤和两次对台湾问题强硬表态。不但警告美国中国在台湾问题上秉持着不惜一战的态度,而且还在最后的全体会议上划下红线,发出统一最血色暗夜!140万亿市场大震动,全球股债集体崩塌!加密货币沦为ampampquot绞肉机ampampquot,26万人爆仓!会否冲击中国资产?全球资本市场迎来巨大冲击波!2022年6月13日,全球主要国家和地区股市和债市出现集体大跌。亚太主要股指白天时段大多收跌在3以上,欧洲斯托克50指数晚间开盘大跌超2,美股三大期指多作为房东,如何把房子租给放心的人?3点建议,一眼看穿房东如何才能将自己的房屋放心出租?坐标西部某二线城市,作为一个常年穿梭在楼栋中间,收房租但并不靠房租生活的人,简单谈一点个人的不成熟的看法。这些经验平时在带客人看房的时候,明里暗里放屁多,是胃里的空气多吗?医生并不是,应注意这4种疾病人吃五谷杂粮,哪有不放屁的道理呢?进食时,由于消化道正常菌群的作用,产生了较多的气体。这些气体,随同肠蠕动向下运行,由肛门排出。只要肠子不停蠕动,屁就不会停止。在公共场所很多人都不急性跟腱断裂患者的福音,微创跟腱修复术,告别大疤痕减少并发症跟腱是人体最长最强壮的肌腱,位于小腿后侧,由腓肠肌和比目鱼肌向下融合而成,连接跟骨后侧。当其收缩时,跟腱牵拉跟骨向近端移动,使我们能够以脚尖站立正常行走及跑跳上下楼梯等。跟腱在行走1976年毛主席逝世,汪东兴建议在悼词上加几点,华国锋听后同意1976年9月9日凌晨0点10分,毛主席与世长辞,全国人民都陷入了巨大的悲痛之中。主席逝世第七天,中央政治局召开会议,讨论主席悼词文稿的修改,并确定相关流程。当时,周启才去喊汪东兴半夜出汗浸湿床单?提醒身体或存在这4种病症,建议了解邻居王阿姨最近经常出现这种情况,她在晚上睡觉时会大量出汗,有时睡到半夜还会被盗醒。起初,王阿姨还以为是自己盖的被子太厚,便换了一床薄被子,可这种现象依然没有得到缓解。有人告诉王阿姨山东一38岁男子,长期服用六味地黄丸,后来身体怎么样了?人到中年不得已,保温杯里泡枸,这可是中年男性经常挂在嘴边的一句话。枸杞具有滋阴补肾养肝明目益气补血润肺的功效,保温杯里泡枸杞主要可以增强机体免疫功能。喝枸杞水不仅能够起到养生的效果网友建议学校安装高清摄像头24小时无死角记录安徽省教育厅回复新安晚报安徽网大皖新闻讯近日,有网友在人民网留言,建议学校安装高清摄像头24小时无死角记录,并且还要严格规定学校视频监控必须保存一年以上,家长随时可以查看。安徽省教育厅回复您的建议全国各省最具代表饮料是啥随着天气越来越热,各式各样的饮料,也逐渐出现在人们的手中。不管是运动完大汗淋漓的时候,还是吃火锅被辣到的时候,一瓶甜丝丝的饮料下肚,整个人都舒服了。再就是小孩子,更是对饮料情有独钟