范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

视觉目标检测大模型GAIA面向行业的视觉物体检测一站式解决方案

  机器之心专栏
  作者:常清
  中国科学院自动化研究所智能感知与计算研究中心联合华为等企业提出面向行业的视觉物体检测一站式解决方案 GAIA。
  在深度学习与大数据的浪潮下,视觉目标检测在各个基准数据集上已经达到了优异的性能。中国科学院自动化研究所智能感知与计算研究中心联合华为等企业提出面向行业的视觉物体检测一站式解决方案 GAIA。通过 GAIA,用户可轻松获得不同硬件环境下的可直接用于部署的目标检测模型。GAIA 致力于构建一种生态,它以目标检测为基础,后续将会开枝散叶扩展到更多领域,期望更多的学者和用户共同维护 GAIA 的迭代,参与到 GAIA 社区中。该研究的论文已被 CVPR 2021接收。
  论文地址:https://arxiv.org/pdf/2106.11346.pdf
  开源框架:https://github.com/GAIA-vision
  GAIA 应时而生
  目标检测是识别图片中有哪些物体以及物体的位置(坐标位置)的技术,是计算机视觉应用的基础,比如实例分割、人体关键点提取、人脸识别等。在互联网、大数据、人工智能等技术的发展浪潮下,目标检测展现出巨大的应用价值,受到工业界、学术界的密切关注。各类研究机构争相构建并对外公开 COCO、OpenImage 等大规模数据集用于目标检测模型训练。数据集的日益丰富极大促进了技术的更新迭代,不断涌现出以 Faster R-CNN 为脉络发展的 Two-stage 和以 YOLO、SSD 为基础的 One-stage 目标检测新范式。
  目标检测技术在产业应用中的需求越来越广泛和深入,学术界已经训练好的模型评估都是基于标准 benchmark,在产业化应用落地中通常表现出严重的 "水土不服",需要重新定制化开发。快速设计出最适合工业界不同业务场景的目标检测模型是一项很有挑战的工作,需要决定制化需求开发中的核心痛点问题:
  一、数据整合难。数据治理是建模的基本要素,在 AI 应用开发过程中,从数据的采集、清洗和转换到最终生成算法所需的数据集需要经历繁琐的流程和花费高昂的成本,而且很有可能因为数据的准确性、完整性、有效性等问题,无法发挥模型优势。
  二、模型优化难。模型需有冗繁调参、预训练过程才能发挥其性能。很多终端用户由于没有足够相关专业领域知识,无法从纷繁复杂的模型及数据中选取最优资源。对个人用户来说,计算资源不足导致训练耗时过长,使得算法调优更是雪上加霜。
  三、资源共享难。不同用户可能有类似的需求,但是他们都需要分别进行一系列从数据到模型的重复开发,模型迁移难度大,而且资源浪费严重。
  四、模型定制难。针对不同的下游任务,往往需求千差万别,数据各式各样,算力各有不同,现在方法往往需要针对不同下游任务进行人工定制,费时费力。
  为此提出了面向行业的视觉物体检测一站式解决方案:视觉目标检测大模型 GAIA(相关人员包括:张兆翔研究员、彭君然博士、卜兴源、常清等)。该平台适应移动终端、个人电脑、大型服务器等任意场景,终端用户只需要在 GAIA 配置文件中设置检测的类别,输入简单的几行命令,GAIA 迅速响应,自主学习数据集选择、模型选择和超参数优化等过程,用户可以轻松、快速获得任意下游数据、任意耗时要求的自适应解决方案(图 1)。
  图 1. GAIA - 面向行业的视觉物体检测一站式解决方案
  GAIA 详解
  视觉目标检测大模型 GAIA 作为面向行业打造的下一代一站式目标检测新方案,包含上游数据集、全模型训练、稀疏数据下数据选取和部署模型提取四个模块。
  图 2. 视觉目标检测大模型 GAIA 技术框架
  上游数据集赋能
  各类研究机构为不同的研究任务构建了各类目标检测公开数据集,如 COCO、Object365、Open Images、Caltech、CityPersons、UODB 等都是主流的目标检测数据集。学术界往往都是在上述标准数据集下进行检测任务的训练和测试,但是对产业界来讲,如何从已有的数据集中选取适合应用场景的子集却是举步维艰。
  借鉴大规模预训练模型 BERT、GPT-3 等在自然语言处理领域中的成功,GAIA 将该范式延拓到视觉目标检测领域,对所有可用公开数据集整合并进行大规模预训练,增加模型的泛化能力和表示能力。由于自然语言中语料数据集本身是离散型,自然语言处理中的大规模预训练很容易构建无监督训练任务。但是这种方法迁移至计算机视觉领域就会遇到很多瓶颈,不同数据集的类别标签很容易出现歧义,比如像 earth、ground 可能在不同的数据集中都表示地面,或不同数据集类别标签之间存在包含关系,像绿植和树。GAIA 通过语义模型对类别建立语义相似度,将不同数据集中类别语义相似度大于阈值的归为同一类别,从而梳理出最终的类别和 ID 的映射关系。
  全模型训练
  神经网络架构搜索算法 OFA、BigNAS 等在训练超网时,对其中的子网同时训练,这样只需花费很小的代价就可得到不需要微调就性能优异的子网络。与 BERT、GPT 等预训练大模型相比,GAIA 不同之处在于将 NAS 与大规模预训练进行结合,提供涵盖各种 latency 下的高性能预训练网络。设计良好的子网采样空间对网络的训练至关重要,在我们进行探索的过程中发现网络深度和输入图像分辨率是影响模型性能的核心因素,网络宽度是模型运行占用显存的关键因素(图 3)。因此 GAIA 的采样空间从网络深度、输入分辨率、网络宽度三个维度出发,根据已有的经典网络模型设置锚点,在锚点周围空间从三个维度进行子网抽取,让整个模型训练过程更加有效。
  图 3. 模型性能分析
  特定下游任务数据选取
  用户在本地下游任务中,能提供的有标签数据十分有限,已有的开源数据集虽然包含的数据类别十分丰富,数量也十分庞大,但是相同类别的数据存在域间差异,比如漫画图片中的鸟和自然场景中的鸟存在很大差异,直接通过类别使用开源数据集,只会对用户本地下游任务产生不利的影响,选取合适数据集,帮助下游任务是一项不小的挑战。
  如果终端用户提供的有标签数据数量没有达到预先设定好的阈值,GAIA 会直接根据该使用的语义模型找到本地类别中语义信息最近似的类别,在该类别的上游数据集上通过模型映射向量的相似度找到域间差异最小的一部分图片(如图 5),并对提取模型快速训练。通过该功能,即使用户只能够提供几张图片的数据场景下,GAIA 同样可以提供十分出色的模型。
  图 5. 特定任务数据选取
  下游模型选择
  GAIA 已经测好所包含各种子网的 FLPOPS TABLE,以及多种硬件平台下的 LATENCY TABLE(图 6)。对于初级使用者而言,只需要在本地提供 FLPOPS、LATENCY 和硬件平台,就可以获得满足这些约束的性能最佳的子网。对于经验丰富的使用者,可通过 GAIA 提供的接口,自定义添加其他约束条件,轻松获取性能优异的定制化子网模型
  图 6. 下游模型结构选取
  优越性能
  GAIA 的强大之处最直接体现在可以满足用户给出的任意时延或任意下游数据,快速定制可部署检测模型,以 COCO 数据集为例,GAIA-det 可以快速提供时延 16~53ms、AP 38.2~46.2 的模型。用户不需要再花费很大的精力从数据到模型重新开发。
  GAIA 已经在 VOC、Object365、OpenImages、Caltech、KITTI 等 15 个目标检测常用公开数据集上通过测试(图 7),发现 GAIA 提供的模型可以很好的满足终端用户的定制需求。
  图 7. GAIA 在目标检测常用数据集的性能对比
  未来展望
  视觉目标检测大模型 GAIA 是面向行业的视觉物体检测一站式解决方案,随着应用场景的日益丰富和理论技术的突破,不断更新的上游数据集会定期汇聚到 GAIA,新的训练模型和网络架构都会通过测试验证后迭代至 GAIA,确保 GAIA 一直为终端用户提供最优质的行业解决方案。现阶段,GAIA-det 已在 Github 上开源,GAIA-seg、GAIA-ssl 接近完成,即将推出,致力于解决更多领域的问题…GAIA 是我们大家共同的 GAIA,GAIA 需要大家的宝贵意见和建议,期望更多的学者和用户共同维护 GAIA 的迭代,参与到 GAIA 生态建设中,一起让 GAIA 成长得更快更好。
  参考文献:
  Xingyuan Bu*, Junran Peng*, Junjie Yan, Tieniu Tan, Zhaoxiang Zhang†, GAIA: A Transfer Learning System of Object Detection that Fits Your Needs, IEEE Conference on Computer Vision and Pattern Recognition, CVPR 2021, Online (Nashville, United States), June 19-25, 2021

美丽乡村特刊临夏市为城市留下一抹乡愁来源民族日报为城市留下一抹乡愁大夏河,从甘南草原顺流而下,在青藏高原与黄土高原的交汇地带,放慢了脚步,向西南缓缓流去,冲击形成了88。6平方公里的河谷盆地,这便是临夏市的全貌。自古老员工加班20小时,第2天每人罚款500,知道原因都愣了不管工厂还是公司,想要能持久正常的运营下去,除了货源和客户群之外,最重要的一点就是员工了。一个工厂能招到一批有能力,有自主性,又勤奋的员工,应该是一件超幸运的事情。老陈在这家公司工员工加班到凌晨4点,第二天上班被罚500,老板得知原因必须罚每个人都向往着找份朝九晚五的工作,其实这样的工作也不少,但往往有责任心的人工作起来的话,他们不会计较工作时间的问题,为了如期完成工作,会自愿去加班90后的小李性格十分要强,工作也总新石器时代的两种玉器,它究竟有什么用处?有观点竟认为是当钱用玉器的起源与良渚文化。良渚文化,中国新石器时代文化遗址之一,位于长江下游太湖之滨,中心在浙江良渚。1936年发现的文化遗址。1936年,原西湖博物馆施新庚,先生首次在余杭市良渚镇被盘点指南针的始祖司南,只因存在3个缺陷,没有广泛应用盘点指南针的始祖司南。罗盘的前身是中国古代四大发明之一的思南。主要部件是安装在可自由旋转的轴上的磁针。磁针在地球磁场的作用下可以保持在磁子午线的切线方向。磁针的北极指向地理北极。此产业生态交通三个一体化率先突破,京津冀协同发展有序推进2014年作为国家重点实施拖动的重大战略任务,到2020年京津冀协同发展已经实施六年,在这六年的时间里,北京天津河北三地分别在产业生态环境和交通一体化三个方面异军突起,率先取得实效南山风骨,国士无双,钟南山院士成功诠释了老师的伟大与光荣今年是第36个教师节,在这个买对新冠肺炎疫情防控阻击战的特殊日子,教师节更显得珍贵,为了孩子们能够正常学习,又能保质保量,他们日夜奋战在线上教学,比平时多付出几倍的努力才能让孩子们石家庄封城,人员车辆不得外出,春节非必要不出京不出境要落实这几日河北石家庄邢台等地疫情一直牵动着北京和全国各地人民的心。北京作为全国的首都,河北又和北京有着千丝万缕的联系,河北和北京可谓是牵一发而动全身。截止到7日,根据疫情防控工作要求,又来搭台唱戏!布林肯发布500万美元通缉令,只为抓一名中国公民神鸟知讯军情原创成都电视发展有限公司旗下神鸟知讯官方账号外交部回应美悬赏500万美元通缉中国公民众所周知,美国一向是为达目的不择手段的。多年前,为了对付伊拉克,美国可以厚着脸拿出一吉林中公事业单位信息技术计算机高新技术云计算定义一种通过互联网以服务的方式提供动态可伸缩的虚拟化资源的计算模式。这种模式提供可用云计算的便捷的按需的网络访问,可以实现随时获取按需使用随时扩展按使用量付费等功能特征资源配吉林事业单位我国信息技术成就我国信息技术成就知识点超级计算机1983年,银河I计算机在长沙研制,这是中国第一台每秒钟运算达1亿次以上的计算机1993年,曙光一号研制,这是中国自行研制的第一台用微处理器芯片构成
32条腿章鱼被发现,章鱼可能来自外星球?科学家这可能是真的章鱼,相信大家都不陌生,它们广泛分布在世界各地热带及温带海域。在正常情况下,章鱼有8条可收缩的腕,每一条腕上都有大量吸盘,平时主要通过腕来爬行游泳,还能用腕来抓握物体。不过,有时候人类或永远被圈禁在地球?宇航员DNA发生神秘突变,科学无法解释现在我们也进入了空间站时代,我们国家3名宇航员已经在空间站内生活工作了一段时间,按照计划,这些宇航员将在空间站内驻留3个月,随后我们还将继续发射更多的载人飞船将更多的宇航员送上空间军舰被14个不明飞行物包围?美国科学家警告人类可能有危险了在今年6月美国将公开UFO调查报告,世界上是否真的存在不明飞行物,到时候可能就会揭晓。虽然还没到公布调查报告的时间节点,但是在这段时间我们看到了不少关于不明飞行物的消息以及相关的画10个神秘物体闯入国际空间站直播画面?科学家警告人类或有危险进入7月份以来,我们看到了一些地区出现了不明飞行物,如英国德文郡(Devon)的海边出现了一个巨大的不明飞行物,被一名学生埃文斯看到,随后埃文斯拿出手机将这个不明飞行物拍摄下来。从快速响应河南遭遇特大洪灾,旅游企业万众一心品橙旅游7月17日以来,河南省遭遇极端强降雨,部分地区发生城市内涝泥石流和山体滑坡等灾害,郑州普降大暴雨特大暴雨并引发洪灾,当地居民生命财产安全受到严重威胁。网络上传播的郑州市区洪MakeMyTrip2022财年Q1收入增长416品橙旅游近日,印度在线旅游公司MakeMyTrip公布了2022年第一季度财报,数据显示,Q1收入为3280万美元,相较上一财年同期的640万美元增长了416,本季度调整后的整体亏恢复一周年,跨省游再踩急刹车品橙旅游近日,由于北京出现了确诊病例,坐了4个小时航班到达乌鲁木齐的所有北京乘客都要面对一个问题今晚住哪?即使侥幸入住酒店的他们也不知道明天能不能到景区游览。已有消息源表示,多地已古老的大陨石本人去山中游玩,捡到一奇石,上面有高温灼烧的黑痕迹,而不是自然氧化的黑,一层外壳膜班驳,应该是掉落到地球上很久了,像一位沧桑的老者,但一些特征还是很明显的,拇指状的气印,气印里有高夏天的烦恼夏天今年30,属羊。夏天长的像只放大了的大马猴,尖嘴猴腮,长手长脚!他的家境不错,他死鬼老爸老妈给他留了套房,42平米,在城郊结合部!夏天的工作也不错,在养鸡场杀鸡兼打杂,每月可以推荐值得收藏的三本社科健康新书1置身事内中国政府与经济发展内容简介本书是是兰小欢多年教学调研与研究内容的凝练,将经济学原理与中国经济发展的实践有机融合,以地方政府投融资为主线,深入浅出地论述了中国经济的发展,笔2021年8月13日书单,推荐三本好书1桶川跟踪狂杀人事件内容简介一九九九年十月二十六日,年轻女子猪野诗织在日本埼玉县JR桶川站前遭人持刀刺死。受害者生前因长期受到跟踪骚扰而多次向警方报案,警方却未予重视,最终没能阻止