解决物体检测中的小目标问题
作者丨JacobSolawetz
来源丨小白学视觉
编辑丨极市平台
为了提高模型在小物体上的性能,我们建议使用以下技术:提高图像捕获分辨率提高模型的输入分辨率平铺图像通过扩充生成更多数据自动学习模型锚过滤掉多余的类为什么小目标问题很难?
小物体问题困扰着全世界的物体检测模型,查看最新模型YOLOv3、EfficientDet和YOLOv4的COCO评估结果:
查看APS、APM、APL以获取最先进的模型。
例如,在EfficientDet中,小物体的AP仅为12,而大物体的AP为51,这几乎是五倍的差距。
那么为什么检测小物体这么难呢?
这一切都取决于模型,目标检测模型通过聚合卷积层中的像素来形成特征。
PPYOLO中目标检测的特征聚合
并且在网络的末端,基于损失函数进行预测,该损失函数基于预测和地面真实情况之间的差异对像素进行汇总。
YOLO中的损失函数
如果地面真值框不大,则在进行训练时信号会很小。此外,小物体最有可能存在数据标记错误,因此它们的标识可能会被省略,从经验和理论上来说,小物体是难的。提高图像捕获分辨率
非常小的物体在边界框中可能只包含几个像素这意味着提高图像的分辨率以增加检测器可以从该小框中形成的特征的丰富度非常重要。因此,如果可能,我们建议尽可能捕获高分辨率的图像。提高模型的输入分辨率
一旦我们拥有更高分辨率的图像,我们就可以扩大模型的输入分辨率。警告:这将导致大型模型需要更长的训练时间,并且在开始部署时推断速度会更慢。我们可能需要运行实验,来找出速度与性能之间的正确权衡。
在我们关于培训YOLOv4的教程中,我们可以通过更改配置文件中的图像大小来轻松调整输入分辨率。〔net〕batch64subpisions36width{YOURRESOLUTIONWIDTHHERE}height{YOURRESOLUTIONHEIGHTHERE}channels3momentum0。949decay0。0005angle0saturation1。5exposure1。5hue。1learningrate0。001burnin1000maxbatches6000policystepssteps4800。0,5400。0scales。1,。1
在我们的教程中,小伙伴们还可以通过更改训练命令中的图像大小参数,轻松调整输入分辨率,该教程介绍了如何训练YOLOv5:!pythontrain。pyimg{YOURRESOLUTONSIZEHERE}batch16epochs10data。。data。yamlcfg。modelscustomyolov5s。yamlweightsnameyolov5sresultscache
注意:只有在达到训练数据的最大分辨率时,才能看到改进的结果。平铺图像
检测小图像的另一种很好的策略是将图像平铺作为预处理步骤。平铺可以有效地将检测器放大到小物体上,但允许我们保持所需的小输入分辨率,以便能够进行快速推理。
平铺图像作为Roboflow中的预处理步骤
如果在训练期间使用平铺,请务必记住,我们还需要在推理时平铺图像。通过扩充生成更多数据
数据扩充会从我们的基本数据集生成新图像,这对于防止模型过度拟合训练集非常有用。
一些特别有用的小物体检测增强包括随机裁剪、随机旋转和镶嵌增强。自动学习模型锚
锚定框是模型学习预测的原型边界框,也就是说,锚框可以预先设置,有时对于我们的训练数据来说不是最理想的。自定义调整这些参数以适合我们即将完成的任务是很好的,YOLOv5模型架构会根据我们的自定义数据自动为我们执行此操作,我们所要做的就是开始训练。Analyzinganchors。。。anchorstarget4。66,BestPossibleRecall(BPR)0。9675。Attemptingtogenerateimprovedanchors,pleasewait。。。WARNING:Extremelysmallobjectsfound。35of1664labelsare3pixelsinwidthorheight。Runningkmeansfor9anchorson1664points。。。thr0。25:0。9477bestpossiblerecall,4。95anchorspastthrn9,imgsize416,metricall0。3170。665meanbest,pastthr0。465mean:18,24,65,37,35,68,46,135,152,54,99,109,66,218,220,128,169,228EvolvinganchorswithGeneticAlgorithm:fitness0。6825:10010001000〔00:0000:00,1081。71its〕thr0。25:0。9627bestpossiblerecall,5。32anchorspastthrn9,imgsize416,metricall0。3380。688meanbest,pastthr0。476mean:13,20,41,32,26,55,46,72,122,57,86,102,58,152,161,120,165,204过滤掉多余的类
类管理是提高数据集质量的一项重要技术,如果我们的一个类与另一个类明显重叠,则应从数据集中过滤该类。也许,我们认为数据集中的小对象不值得检测,因此我们可能想要将其取出。通过RoboflowPro中的高级数据集进行状况检查,我们可以快速识别所有这些问题。
可以通过Roboflow的本体管理工具来实现类遗漏和类重命名。
化工板块主力资金连续净买入名单出炉更新日期:5月28日化工板块主力资金连续净买入名单序号代码名称主力连买天数当日主力净流入最新价涨跌幅换手率……
春天的田野作文300字合集十篇无论是身处学校还是步入社会,大家一定都接触过作文吧,作文可分为小学作文、中学作文、大学作文(论文)。写起作文来就毫无头绪?以下是小编为大家整理的春天的田野作文300字10篇,希……
国际油价或升破150美元俄乌冲突后,国际油价飙升。美国银行(BofA)全球研究部5月27日表示,如果俄罗斯石油出口急剧萎缩,全球基准布伦特原油价格可能升至每桶150美元以上。该银行在一份研究报告……
乌鸦受骗以后优秀作文篇一:乌鸦受骗以后自从狐狸被骗走一块到嘴的肉以后,乌鸦一直很后悔。有一天,乌鸦又得到一块肉,当她在一棵大树上歇脚的时候,碰巧又被出来寻找食物的狐狸看见了。狐狸看见乌……
颠覆你三观的深度猛文,看完立刻让你认知提升至少5年,敢不敢看什么是面子?面子就是一套程序,一套贬低自己抬高别人的表演。面子最终会体现在利益交换上,最后跟金钱发生关系。所以,人际关系潜规则就是发现人性中的漏洞,用人情、面子等虚的东西交换实……
人累不要紧,就怕心累小时候我们都盼着快点长大,长大了,每个人都有被他人所牵累,在这个充满压力的社会里,生活有太多的难题和烦恼,要活得一点不累也不大可能,人这一辈子都在忙着,累着,奔走着,都在……
为对手鼓掌作文范文掌声,是一种肯定,是一种鼓励,更是一种尊重!给对手掌声,是一种高尚的表现,请我们为对手鼓掌!下面是小编收集的为对手鼓掌作文范文,希望大家认真阅读!【1】为对手鼓掌作文范文……
最新描写人物外貌的好句1。她的脸上有一双带着稚气的、被长长的睫毛装饰起来的美丽的眼睛,就像两颗水晶葡萄。2。妹妹刚上小学一年级,既聪明又懂事,能歌善舞,可爱得很。也的小辫子向上翘着,两只黑亮的……
年度十大感动人物事迹观后感【年度十大感动人物事迹观后感一】有一种温暖,不需要语言,就能传递,叫感动;有一种力量,不求惊天动地,却足以令人震撼,叫感动。题记在感动中国节目中,感动我的有1……
凯盛科技光伏石英砂华为手机折叠屏,底部放量,是潜力黑马吗最近A股有几个股票走势非常的强劲。石英股份一直稳步往上,从51的低点一直到82的高点,还没停下来,德力股份连续3连板,中旗新村4天三板,这些股走强的背后,都是因为石英矿,属于光……
哲理小故事留个缺口给别人一位着名企业家在作报告,一位听众问:ldquo;你在事业上取得了巨大的成功,请问,对你来说,最重要的是什么?rdquo;企业家没有直接回答,他拿起粉笔在黑板上画了一个圈,……
七年级感动作文500字锦集9篇在现实生活或工作学习中,大家总免不了要接触或使用作文吧,作文一定要做到主题集中,围绕同一主题作深入阐述,切忌东拉西扯,主题涣散甚至无主题。还是对作文一筹莫展吗?下面是小编整理的……