范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

CVPR实时移动端检测场景竞赛字节跳动绝对优势夺冠

  机器之心发布
  机器之心编辑部
  MAI(Mobile AI Workshop)是由 CVPR 主办的 Workshop 竞赛。近期,来自字节跳动智能创作团队的 ByteScene 团队在 MAI 2021 实时移动端场景检测项目上,以 163.08 分的绝对优势夺得冠军。
  竞赛结果及相关报告见:https://arxiv.org/pdf/2105.08819.pdf
  竞赛项目介绍
  MAI 2021 实时移动端场景检测竞赛:基于 RGB 图像的实时高性能移动端场景类别预测,任务要求在移动端硬件上对摄像头输入的图像实时预测出其场景类别,总共有 30 个场景类别。
  数据集:CamSDD (Camera Scene Detection Dataset) 数据集有超过 1.1 万张摄像头场景图像,每张图像都是分辨率为 576x384 的 RGB 图像,且属于 30 个场景类别中的某一个类别;其中 9897 张是有标注的训练集图像,600 张是无标注的验证集图像,还有 600 张是举办方保留的测试集图像,参赛者不会拿到测试集图像。
  评测方法:参赛者需要将训练好的图像场景类别预测模型转换为 8 位量化的 TFLite 模型,并将 TFLite 模型上传到举办方的服务器。在举办方的服务器上,TFLite 模型会被发送到 Apple Bionic A11 SoC 移动端设备上测试模型运行耗时,并在举办方保留的测试集上测试 Top-1 和 Top-3 识别准确率。
  评价指标:识别场景类别的 Top-1 准确率;识别场景类别的 Top-3 准确率;在 Apple Bionic A11 目标平台上的运行耗时;
  最终评分是依据公式(C 是一个常数的标准化系数)
  团队成绩:来自字节跳动智能创作团队的 ByteScene 团队以 163.08 分的绝对优势夺得冠军。
  竞赛难点:
  本次场景检测算法比赛要求兼顾在移动端上的速度和识别准确率,需要优化足够轻量级的高精度小模型;
  训练集数据量有限,存在较大的过拟合(Overfit )风险;
  算法背景介绍
  自动预测摄像头图像的场景类别是智能手机上的一项基础算法能力,手机相机可以根据当前的摄像头图像场景类别对成像参数进行自动调节,以拍出最佳效果的图片和视频。为了能达到实时自动调节手机相机的能力,需要场景类别预测算法能在手机上实时运行,同时保证识别准确率。这对算法设计者来说,是一项很大的挑战。
  字节跳动的 ByteScene 团队使用迁移学习的方法训练大模型和移动端小模型,并使用迁移后的大模型对过滤后的额外数据打上伪标签,利用这些额外数据和原有训练集训练出了移动端高效且高准确率的场景检测算法。
  算法技术方案
  ByteScene 团队使用了一种受 Google 的 Big transfer 工作启发的迁移学习方法来训练大模型和移动端小模型(如图 3)。移动端小模型是使用如表 3 所示的 MobileNetV3-Like 架构,该架构在 ImageNet 2012 验证集上获得了 67.82% 的 Top-1 准确率,它是使用字节跳动智能创作团队自研的 NAS 算法搜索出来的,该模型只有 86M FLOPs 的计算量。ByteScene 通过将输入图像的分辨率从 576×384px 缩小为 128×128px,大大减少了计算量。
  图 3.ByteScene 团队使用的算法模型训练方案
  大模型的训练
  ByteScene 团队基于 ResNet101x3 主干网络建立了分类大模型,首先保留 1003 张有标签图像作为自用验证集,在 CamSDD 训练集上对带有预训练的大模型进行了微调。在微调过程中,它的主干被固定住,并且使用 AdamW 优化了 10 个 epoch。然后,ByteScene 利用训练好的第一版大模型对官方的验证集打上伪标签,得到新的验证集后,利用所有可用的训练图像对大模型进行再次训练。最终训练得到的大模型在官方验证集上达到了 97.83% 的 Top-1 准确率。
  移动端模型训练
  ByteScene 利用训练好的大模型过滤出了 2577 张额外图像,并打上了伪标签,将额外图像加入了原有的训练集。首先,使用 AdamW 优化器对带有预训练的移动端模型 (表 3) 在新训练集上进行微调。接下来,对模型主干进行解冻,继续对模型进行微调。最后,再次冻结模型主干,并使用 SGDW 优化器对模型进行了额外的微调。
  表 3. ByteScene 使用的移动端模型结构。
  在第三次微调中,训练图像被直接缩小为 128×128 分辨率。最终的 INT8 量化 TFLite 模型是使用标准 TensorFlow 训练后量化工具转换得到的。为了保持量化后的模型精度,团队在移动端模型中仅使用了 ReLU6 和 HardSigmoid 这两种非线性激活函数。
  算法的应用
  目前,视频内容是大众消费内容的很核心的一部分(抖音、TikTok 等),但剪辑视频对于大众用户来讲,依然属于比较复杂的信息处理手段。对于大众用户来讲,"想剪一个高质量的视频"和 "剪辑技能的高门槛" 之间往往存在落差。智能模板匹配为大众用户提供了一个低门槛的快捷视频创作方式,真正实现了"一键成片"(如下图)。图像场景检测 / 分类算法通过预测每张图片素材的场景类别,为智能模板匹配提供了重要的匹配依据。这项算法,让普通用户也能通过简单的操作,剪辑出高质量的视频,有助于提升平台的用户体验和黏性。
  字节跳动智能创作团队
  智能创作是字节跳动的多媒体创新科技研究所和综合型服务商。覆盖音视频、计算机视觉、语音、图形图像、工程软件开发等多技术方向,在部门内部实现了内容创作和消费的闭环。旨在以多种形式向公司内部各类业务线和外部 toB 合作伙伴提供业界最前沿的多媒体和智能创作能力与行业解决方案。
  目前,智能创作团队已通过字节跳动旗下的智能科技品牌火山引擎向企业开放技术能力和服务。

太空中究竟能不能靠人眼看到长城,中国历次载人到底拍到了什么长城,自西周时期开始,延续不断修筑了2000多年,分布于中国北部和中部的广大土地上,总计长度达5万多千米。在太空中能否看到长城,一直是人们津津乐道的话题。小学课本中还曾出现中一篇课太空教师王亚平出了一道题,你会答吗?在前几天晚播出的中国诗词大会第7场中神舟十号航天员王亚平出了这样一道题如果古代神话传说都是真的那么嫦娥(探测器)探月会探测到下面哪联诗提到的景象关于这个问题的答案估计你们都能和节目顶风云,举北斗,托嫦娥组建近50年,西昌卫星发射中心都干了啥这两天一条消息在朋友圈刷了屏。10月30日,西昌卫星发射中心在海南文昌举行高密度航天发射任务决战誓师大会,向339名执行百次以上发射任务的航天人颁发荣誉证书。忍不住要为这个暖心之举你知道为啥要在西昌建发射场吗?西昌卫星发射中心,是我国唯一使用液氢低温推进剂,发射次数最多,对外开放最早发射轨道最高的航天发射中心。自1970年组建以来,这里一次又一次创造中国奇迹,在中国航天史上写下了光辉的篇太空旅游进行太空行走?合同已签2020年6月26日,隶属于俄罗斯宇航局的能源火箭航天集团RSCEnergia与美国太空探险公司SpaceAdventures公司在一份声明中说RSCEnergia和美国太空探险公深夜,我国又一颗重要卫星发射成功2020年6月11日02时31分,我国在太原卫星发射中心用长征二号丙运载火箭,成功将海洋一号D卫星送入预定轨道,发射获得圆满成功。海洋一号D卫星是海洋水色业务卫星,主要用于获取全球长征五号这个胖子要复飞了?这几天,一则短消息被各媒体争相转发。我从中摘选两句据悉,中国卫星海上测控部所属的远望21号船正在江阴澄西船厂加班加点进行改造。为后续更好地执行海上火箭运输项目,远望21号船将于本月除了导航,北斗还能做什么?北斗总师杨长风图源央视开讲啦很多人可能认为北斗的作用就是导航其实,北斗系统具有实时导航快速定位精确授时位置报告和短报文通信服务五大功能它不仅广泛用于交通运输基础测绘和搜救打捞等领域我们为什么要发射这么多北斗?2019年11月5日凌晨1点43分,我国在西昌卫星发射中心成功发射第49颗北斗导航卫星。自2000年10月31日发射第一颗北斗起,我们一共发射了北斗组网卫星53颗(其中有4颗是试验最后一颗北斗组网成功意味着什么?工程总体为你解读北斗有多强6月23日9时43分04秒200毫秒,我国在西昌卫星发射中心,使用长征三号乙运载火箭,成功发射第55颗北斗导航卫星,这也是北斗三号组网部署的最后一颗卫星,北斗全球星座部署圆满收官。维珍轨道公司(VirginOrbit)首飞失利北京时间今天凌晨2点至5点,维珍轨道公司(VirginOrbit)公司的运载器一号LauncherOne空射火箭首次发射任务失败。任务中,载机Boeing747(绰号宇宙女孩)起飞
相信自己很幸运,你就会很幸运心理学研究发现,一个人认为自己是幸运的或是不幸的,在很大程度上都会影响自己的世界观,认为自己是幸运的是一种积极的想法,它会促进思想和行动的良性循环。同时,相信好运可以让自己觉得生活27号宜赖床有一种坏习惯,小时候一直改不掉,到了年岁大了,却不用改自己逐渐就没有了。赖床似乎就是。躺在床上,早已醒来,却无意起来。前一晚平放了八九个钟头的体态已然放够,前一晚眠寐中潜游万里的梦生命至上!无论伤员在哪,中国的救命飞机都能带他们回家医疗救护对于军队的重要性已不言而喻,在快节奏高强度的作战中,如何对伤员进行快速,高效的救护和转运,已成为维持军队战斗力的重要一环。今年第13届珠海航展上,运9医疗救护专机首次对外正无侦7与无侦8堪称绝配几千公里内大型海上目标无处遁形在第十三届珠海航展上,中国空军除展出了以WZ8型火箭动力无人机为典型代表的承担战场监视和精密标定任务的战术级无人侦察机,还首次展出了神秘的在军迷群体里流传了很长时间但从来没有被官方唐朝黄巢趁机发动了一场席卷大唐的起义就在唐朝大堂乱成一团糟的时候,有个叫黄巢的人趁机发动了一场席卷大半个大唐的起义,史称,黄巢起义社会乱不乱,朝歌说了算黄巢是何许人也呢?他起初是个富二代,曾多次进京参加高考,但一直没从中印士兵的打斗看军营格斗术,优选中华武术慎用巴西柔术自不少传武大师折戟擂台之后,对传统武术的质疑声甚嚣尘上。对此,现实发生的事情可供参考。中印在边境发生摩擦,两国士兵发生打斗,一名中国战士一脚飞踹令印度士兵连滚带爬。谁说武术不能打?居然赢了围棋AI星猛虎一盘,狗确实和人不一样在AI双手互搏的指导下,居然赢了星猛虎一盘。有人认为星猛虎水平不高,但是,对于围棋业余爱好者来说,是狗就很难对付,能在五六十手是保持均势,就已经不易了。图一,人的思维,白12镇!我围棋AI可杀,但不可辱!看看AI自我毁灭的一局本局白已领先150目,围棋AI多次要求认输,我就不是不许,非要杀个痛快!如图,当白收最后一个单官时,黑必须补,这就是虐的最高境界,最后一步也要占便宜AI不堪受辱,愤而自尽!白一断,四分球!中国篮球唯一的出路杜锋带队打完了奥运落选赛,可怕的结果不是意料之中的输球,而是把中国篮球界篮球迷的心气打没了。从过程得出的结论,说文雅点,先天的不足无法通过后天的努力来弥补说糙点更直接,人种不行!有巴空军F16坠毁并非Nozuonodie,狗斗在空战中仍具价值巴基斯坦空军的一架F16在飞行训练时坠毁。从现场视频看,该机在低空做半滚倒转(破S)时起始高度太低,以致于在飞机改平之后已无法拉起,机尾拖地坠毁。发生这样事故的原因,不能单一的归咎美国的最大威胁来自国内迟早有一天,美国公民会揭竿而起从奥巴马将目标对准中国,到特朗普直指中国,再到拜登集中力量应对中国,美国这三任总统将全部目标都指向了中国,并试图将中国描述成美国最大威胁,从而希望美国上下能够团结一心,一致对外,以