童话说说技术创业美文职业
投稿投诉
职业母婴
职场个人
历史治疗
笔记技能
美文纠纷
幽默家庭
范文作文
乐趣解密
创业案例
社会工作
新闻家居
心理安全
技术八卦
仲裁思考
生活时事
运势奇闻
说说企业
魅力社交
安好健康
传统笑话
童话初中
男女饮食
周易阅读
爱好两性

多目标跟踪:AI产品经理需要了解的CV通识

5月9日 失了心投稿
  多目标跟踪的主要任务是找到图像序列中运动的物体,并将不同帧的运动物体一一对应,最后给出不同物体的运动轨迹。
  多目标跟踪(MOT,MultipleObjectTracking):多目标跟踪是CV领域一个热门方向,广泛应用于机器人导航、智能监控视频、工业检测、航空航天等领域。主要任务是找到图像序列中运动的物体,并将不同帧的运动物体一一对应,最后给出不同物体的运动轨迹。
  一、术语了解
  检测:定位目标在图像中的位置。检测方法很多,例如帧间差分法、背景减除法、光流法等等;另外,检测常与识别结合。
  跟踪:在连续图像序列中完成对目标的检测,并把物理意义下同一目标相关联。
  轨迹(Trajectory):一条轨迹对于这一目标在一段时间内的位置序列;是多目标跟踪系统的输出量。
  数据关联:用于解决目标间的匹配问题;是多目标跟踪的核心问题。
  跟踪置信度:跟踪算法反应每一次跟踪的可靠程度。
  二、技术流程详解
  1、图像采集
  多目标跟踪对于图像采集要求评估的因素与人脸识别差别不大。详见上一篇文章《人脸识别:AI产品经理需要了解的CV通识》。
  2、图像预处理
  典型的图像预处理方法是直方图均衡和滤波。
  1)直方图均衡
  直方图描述了一副图像的灰度级内容,而直方图均衡化的主要目的,是为了提高对比度和灰度色调的变化,使图像更加清晰。
  2)滤波
  图像滤波的主要目的是,在保持图像特征的情况下进行噪声消除,具体可以分为线性滤波和非线性滤波。非线性滤波相比线性滤波来说,更能保护图像细节。
  3、基于深度学习的多目标检测识别
  目标检测的实质是多目标的定位,即要在图片中定位多个目标物体。
  例如下图,既要定位各个目标,还需要将不同目标用不同颜色的框表示。
  (By深思考人工智能)
  1)基于深度学习的目标检测算法:YOLO、YOLOv2、YOLO9000
  YOLO(YouOnlyLookOnce)是基于深度学习方法的端到端实时目标检测系统。YOLO的升级版有两种:YOLOv2和YOLO9000。YOLO9000可以识别超过9000类别。
  YOLO对图片的处理步骤主要分为三个部分:
  将图片缩放到448448大小
  运行卷积网络
  设置模型置信度阈值,输出结果
  (By代码学习者coding)
  2)基于深度学习的目标检测算法:SSD
  SSD(SingleShotMultiBOXDetector),截止目前是主要的检测框架之一,相比FastRNN速度更快;相比YOLO有明显的mAP优势(mAP:平均正确率),但不及YOLO9000。
  SSD缺点:
  调试过程非常依赖经验
  检测小目标的召回率值不是很高
  3)YOLO和SSD效果比较
  (By代码学习者coding)
  从图上可以看出,YOLO漏检率较高,SSD相对来说表现较好。
  4)目标检测识别相关指标
  精确率:计算方式详见《人脸识别:AI产品经理需要了解的CV通识》
  召回率:同上。
  识别精度:目标检测中衡量检测出精度的指标是平均正确率均值mAP(meanaverageprecision)
  首先我们了解一下AP(平均正确率)
  平均正确率:precisionrecall曲线下方围成的曲面面积,如下图:
  其中横坐标是recall,纵坐标是precision。AP是这个曲线下的面积,而mAP就是多个类别AP的平均值,这个值介于0到1之间,且越大越好。
  检测响应:检测过程的输出量。
  识别效率:识别的速度。相对应选择效率极大化的迭代算法。
  交并比(IoU):可以理解为系统预测出来的框与原来图中标记框的重合程度,最理想的情况是完全重叠,即比值为1。
  计算公式:
  4、多目标跟踪
  下图中的曲线是该目标的跟踪路径,图中线条即代表各个目标的轨迹。
  目前跟踪的困难点:
  a。遮挡、目标消失后再出现,会有丢失目标的现象;
  b。相似目标容易被当成同一目标;
  由于以上原因,在实际场景里多目标跟踪可能会发生人员重复检测、漏检、同一目标多条轨迹等情况。如果需求对人员统计非常严格,可以考虑由其他方案完成。多目标跟踪应用于一个区域(一个摄像头画面内),计算该区域内的目标数以及目标跟踪这样的场景会更好。
  三、多目标跟踪的应用场景
  目标识别常用来确定某画面或视频中包含什么物体、各个物体在什么位置、各个物体的轨迹。因此常用于监控,人机交互和虚拟现实的场景。
  1)人员检测:计算画面中行人的数目,并确定其位置。
  应用场景:
  a。可用于计算区域人员密度过高告警。
  产品功能考虑:在监控画面对区域进行划分,并对人员密度(梳理)进行设置。阈值的设置可以考虑和时间结合,在某一段时间内超过某阈值即可告警。
  利用本算法进行人员计算的缺点是如果发生目标丢失,会将同一人的两个状态识别为两个人,使得真实数目与检测数目误差大。
  b。可用于范围监测告警(越界监测):例如闯红灯、翻墙等事件。
  产品功能考虑:在监控地图里设置关注区域,当关注区域一旦出现人车其他物体,则可立即实现告警。特别适合对入侵行为需要重点防范的场合,比如展馆、监狱、禁区等地。
  c。异常行为检测:目标突然发生剧烈变化,如打架斗殴等行为。
  产品功能考虑:对目标设定异常行为检测,当出现异常行为时即可告警。异常行为检测适合在对异常行为有需要重点防范的场合,比如学校、公共区域等地方。
  2)车辆识别:计算画面中车辆的数目,并确定其位置。
  还可以和车型识别、车颜色识别、车辆逆流检测等结合。实现对车辆特点的全识别。
  应用场景:
  a。可用于交通疏散,针对有可能发生拥堵的区域提前进行部署。
  b。可用于追踪黑名单车辆:车辆检测可识别车辆类型、车辆颜色等等,这些信息均可用来定位目标。
  c。防车辆套牌方案:车辆识别和车牌识别结合,防止车辆套牌案件发生
  3)应用于智能驾驶方案:目标识别和场景分割、SLAM结合,可识别出道路路况,提供智能驾驶所需要的路边物体信息。
  四、多目标跟踪监控产品系统分析
  多目标跟踪监控类的产品现在已经有不少,拿商汤的软件产品作为典型例子:
  1、产品功能分析
  产品的功能主要有以下内容:摄像头个数、行人人次、非机动车车次、机动车车次、告警次数、监控画面、目标抓拍。
  我们从大的划分来看,主要是四块:设备、统计、监控、抓拍。除了这四块之外,根据经验我们还需要考虑到历史的分析和检索。
  1)设备
  商汤的产品只体现了设备的数目,而更重要的是设备的筛选功能。其实设备的控制非常复杂,我们常常为了监控摄像头的状态设计一个新的管理系统。在另外一个设备的管理系统中,我们需要跟踪设备的使用状态,设备的详细信息(对应的摄像头编号位置等),以及摄像头的定位。
  2)统计
  统计除了上例时间段的统计之外,还可以进行某一时刻某一区域上的目标统计。某一时刻的统计的意义比时间段统计在一些特定需求上更为重要。特别是某时刻目标数如果超过阈值,跟告警系统匹配,能够捕捉群体行为。某时刻的目标数目是否超过设定阈值,是多目标最常见的需求,也是典型应用之一。
  3)监控
  监控界面结合了多种类别的识别:例如行人的性别、头发长短、衣物类型等等。这也是多目标最“酷炫”的一部分,人们常常被系统的自动识别吸引。多目标在前端的表示常常是一个Boxing加一条尾巴,即目标的定位和轨迹。而目标旁的标签(属性),则是多目标识别和其他垂直方向识别的结合。
  产品在这块有两部分工作:
  a。跟进多目标的漏检率以及IoU,以及思考同一管道多种属性识别的结合,以应对不同场景需求。更偏向技术类。
  b。关注监控系统的流畅性和稳定性。更偏向业务类。
  4)抓拍
  抓拍也是体现多目标价值的典型功能之一。抓拍能将监控中的目标单独地隔离出来,这是后续检索目标功能实现的前提。抓拍到的图片在界面展示时可利用缓存,之后建议存储至云端。
  5)历史
  a。搜索:跟普通搜索系统相比,多目标系统必不可少的一个功能一定是图片检索。在系统中利用文字(与多目标的标签关联)或图片进行图片检索,能更容易查找到目标。
  b。分析:利用大数据技术,对历史的人流、车流、告警记录进行分析,有利于目标管控和后期阈值设置。
  2、产品系统分析
  1)实时性
  监控系统最重要的一点是实时性,相比于普通监控产品,AI监控系统对设备硬件的要求更高。图像处理速度和网速需要被综合评估,监控系统的延时现象需要控制在用户可接受范围内。
  2)耦合性
  AI监控系统链路长、设计到的子系统众多,因此在产品架构设计上需要考虑到程序之间的耦合性。耦合程度太高会使系统的升级更新与维护更加困难。
  3)稳定性
  这里的稳定性不仅包括外界环境的影响,还有系统自身算法更新、程序更新对系统的影响。特别是算法更新,不仅需要在指标上有所提高,还需要具有一定兼容性。算法更新常常导致程序短时间内无法使用,所以每一次算法替换都需要谨慎考虑。
  以上所有内容,就是本次对多目标跟踪的梳理。文章参考了大量文献,也结合了本人的实战项目经验,希望能通过这样体系化的梳理让大家有所收获。
  PS:非常感谢黄钊hanniman对本文作出的指导。黄钊hanniman:图灵机器人人才战略官,前腾讯产品经理,5年AI实战经验,8年互联网背景,微信公众号知乎在行ID“hanniman”。
  附:参考文章如下
  《目标识别》liuheng0111http:t。cnRHIkCBe
  《基于深度学习的目标检测》代码学习者codinghttp:t。cnRHJjoeo
  《多目标跟踪综述》http:t。cnRHjvNXc

多目标跟踪:AI产品经理需要了解的CV通识多目标跟踪的主要任务是找到图像序列中运动的物体,并将不同帧的运动物体一一对应,最后给出不同物体的运动轨迹。多目标跟踪(MOT,MultipleObjectTracking……2个月从零开始入门AI,我是如何做到的?编者按:人工智能正在成为像“电力”一样的东西,每一个关系未来发展的人都应该对其有所了解。尤其是开发者,不懂人工智能,竞争力将会在将来大幅度下降。在ShivalGupta发表在H……AI时代人文写作的机遇与挑战:“诗人”微软小冰启示录AI时代的到来确实为当下的人文写作带来了新的机遇和挑战,“小冰”出版诗集就是一个很好的个案,能为我们提供多元而丰富的启示。2017年5月19日,在举世瞩目的柯洁与Alph……吟诗作赋不能赚钱,作诗的AI机器人的盈利之路在哪?写诗机器人在一定程度上或是“娱乐至死“的产物,正如法兰克福学派的哈贝马斯所说,这些产品本身并不具备艺术性,只是文化工业的产物。“微明的灯影里我知道她的可爱的土壤是我的心灵……区块链的核心作用和对主流教育场景的分析本文将分享我目前对区块链阶段性的认知,并以此为核心,分析目前主流的区块链教育场景。一、区块链到底能做什么?对于区块链到底能做什么,不同的人有不同的看法。比如区块链可……为什么要用区块链技术,改进国家传染病监测预警体系?笔者在最近连续写了两篇关于利用区块链技术改进和优化传染病预警系统的文章:《用区块链技术改进国家级传染病监测预警网络》和《用区块链建设“区域基层联动预警网络”》。文章发布后很多感……五大要点,解析区块链产品的设计基础本文主要列举了一些我在区块链产品设计过程中,遇到的与区块链相关的常见问题和处理方案,适用于准备或初入区块链行业的产品经理阅读。本文中列举的处理方案并不是唯一的,如果大家有其他方……对比尼尔森十大可能性原则,区块链产品对体验带来哪些影响?区块链后续的发展对产品设计造成的影响也是颠覆式的,我们可能要根据其特性做一些改变。我们用尼尔森提出十大可用性原则,来反推到区块链里可能会不太一样的点。从去年提出区块链概念……硬核:用区块链技术改进国家级传染病监测预警网络2020年春节,新型冠状肺炎牵动着大家的心。作为一名互联人,我们能在这场战役中做些什么?这篇文章,作者从专业的角度,告诉我们,很多事情我们都可以做。关键字:区块链传染病监……利用区块链技术构建ETC的可信交易环境作者尝试探讨采用区块链技术解决ETC消费中的异构多方一致性账本和分布式数字身份认证问题,利用区块链的分布式账本和分布式网络运营能力,帮助ETC快速推广到其他更便捷的汽车制造和消……区块链如何助力智慧体育?本文分析了区块链体育的困局,如何针对性突破让区块链助力智慧体育。2009年1月,神秘的中本聪用他的第一版软件挖掘出了创世区块,开启了比特币的时代,随着比特币价格的不断走高……区块链教育如何破局寻找适用教育场景在收集了不少区块链教育的案例以及一系列的思考后,笔者开始去深入分析当下区块链教育一直发展不起来的原因,以及我们应该如何寻找突破口推动区块链教育的新发展。一、前言从事……
ofo走出校园观察:市场定位导致产品错位?ofo现有的产品方案在原有的校园市场上发展问题应该不大,但如果拿这个产品去打开放市场,自身产品的短板就会显得非常明显。在残酷的市场竞争中恐怕要落下风,也逼的ofo需要快速进行产……不跟紧双11“风向标”,就会被淘汰!“生命不息,卖货不止”的阿里巴巴在人们还沉浸在双11总成交额的惊愕时,又正马不停蹄地投入到双12的战斗之中。当然,电商促销节的影响远远无法与双11相提并论。每年双11过后……从“去哪儿速度”看中国在线旅游业未来步入8月,又到了中概股密集公布财报的季节。22日,中国最大的旅游垂直搜索平台去哪儿网发布2014年第二季度财报,至此,在美上市的中国在线旅游业三大巨头均已交出二季度业绩答卷。(……互联网人口中的“用户为王”究竟是什么?过去两年,尽管创业市场进入了“资本寒冬”,但仍然每天有创业公司获得融资,一方面各个新兴行业呈现井喷式的发展,另一方面也有越来越多的传统企业加速拥抱互联网。竞争对手的增多,意味着……95后兴趣社交:网上组团追星担心被骂被喷研究结论1。EXO和TFBOYS等当红明星的粉丝群中,95后是最不可忽视的力量。他们活跃在社交网络上,为自己的偶像“点赞”。2。熟人社交圈子的兴趣喜好是否相同,对于……专访百度大UE设计经理李静请您做一个自我介绍吧李静:大家好,我是来自百度用户体验部李静。现在负责百度文库、阅读产品线的视觉团队,涵盖产品的PC界面、运营设计、无线方向视觉设计。在百度工作快4年了,……【人人早报】633期:高通发布第四代超快充技术,谷歌地球面向导读随着手机和平板电脑变得越来越大,性能需求越来越高,电池寿命一直是用户关注的重点。高通在一项研究中发现,快速充电功能已成为61手机买家首要考虑的指标。鸡汤你……6步打造“冰桶挑战”式营销小编按:最近微博上最火爆的话题,莫过于“冰桶挑战”,在火爆的背后,我们能够从中获得哪些好的营销方式,值得人深思。这几天最火的话题,莫过于围观一群大佬湿身。从一度蝉联世界首……【人人晚报】228期:ofo正式进军北上广深;Faceboo【导读】ofo的逻辑并非如摩拜一样定位于自己做车,而是在于连接车的平台。调度能力本是平台方理应具备的过硬素质。对于ofo而言,在短期内,其调度能力能否跟上扩张速度仍是一个……为什么拉勾网能在创立一年内估值这么高?拉勾网B轮融资2500万美金,估值1亿5000万美元,为什么拉勾网能在创立一年内估值这么高?拉勾网一年内3次融资,从天使,到A轮,再到今天的B轮,确实走的太快了,连几个创……互联网Pay业务发展方向互联网时代,风起云涌,今天的新兴技术,不满3年就会群雄并起,今天鹤翔论产品带大家去体验和分析一下新兴的Pay业务和现今市场上钱包APP!为什么要把新兴的Pay业务与钱包在……饿了么上海20万份免费午餐背后第一次接触到饿了么的时候是其在2011年成立杭州分公司进军下沙高校市场时,当时的饿了么是到处扫楼发传单的苦屌,而现在却成了豪掷20万份免费午餐的壕杰了。苦屌饿了么的成长史……
友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找作文动态热点娱乐育儿情感教程科技体育养生教案探索美文旅游财经日志励志范文论文时尚保健游戏护肤业界