保健励志美文体育育儿作文
投稿投诉
作文动态
热点娱乐
育儿情感
教程科技
体育养生
教案探索
美文旅游
财经日志
励志范文
论文时尚
保健游戏
护肤业界

还在解码?人民中科ampampamp自动化所团队提出基于压缩

  近日,人民中科中科院自动化所团队联合推出了面向高通量小样本条件下的基于压缩域视频识别新方法,相关成果已被人工智能国际权威学术会议IJCAI2022接受。此方法对昔日人海战术的视频标签,分类,审核是一项重要的技术突破。
  随着视频技术、网络技术、5G的发展,尤其是短视频的发展,给传播模式、交流模式、沟通方式带来了根本性的变化。从几岁的小孩到老人都会刷短视频,我们的交流模式、传播模式越来越视频化。
  内容无处不在,内容安全隐患就无处不在。伴随着视频的崛起、视频流量的快速增长,内容安全问题成为了视频网站头上挥之不去的阴影。用户每天都会观看、上传和分享海量的视频〔5〕〔6〕,随着平台用户基数不断扩大,视频内容的迸裂式暴增,审核不严带来的问题也日益凸显。
  视频分类和识别在视频监控与检索、网络直播、推荐系统等行业中有着广泛的应用,是深度学习在视频分析领域中最底层的问题之一。基于先进的人工智能技术,精准识别各类视频场景中涉政、色情、暴恐、垃圾广告、Logo水印等违规内容,可以提前防御内容风险,提高审核效率,净化网络环境,提升用户体验。
  然而,传统的视频识别方法面临两大挑战:一是处理效率低,对海量视频的计算成本高;二是当类别定义发生变化时需要收集大量数据重新训练,难以根据少量样本快速适应新类别。
  针对这些问题,人民中科与中科院自动化所国家模式识别实验室的研究团队提出了一种基于压缩域的小样本视频识别新方法。
  图1互联网上有海量的视频数据,且总量每天都在快速增长
  一hr背景知识
  研究团队要解决的第一个问题是海量互联网压缩视频的处理。为了节省空间和带宽,互联网视频几乎总是以压缩视频的形式存在。常见的压缩算法比如MPEG〔3〕和H。264〔4〕都以运动预测技术进行视频压缩编码。
  视频的相邻几帧之间往往比较相似,如图2所示,压缩算法利用这一特点把视频划分为一系列图像群组(GOP),每个GOP内只保存第一帧(称为I帧)的RGB图像,同时记录后续的帧(称为P帧)相对于I帧的运动向量(MV)和残差。
  MV描述P帧的像素块相对I帧最相似像素块的位移,残差则是这两个像素块的色彩差别。通过I帧、MV和残差就能完整恢复P帧RGB图像,这个过程称为全解码,I帧、MV和残差统称为压缩域信息。
  图2一个图像群组(GOP)的示意图
  传统视频识别方法需要完整解码I帧和P帧的RGB图像作为输入,研究团队此次提出的方法则只需要解码I帧、MV和残差作为输入,无需全解码,这个过程称为半解码。在很多应用中,视频编解码都是最耗时的部分,而在视频编解码过程中运动预测补偿耗时占比可达6080〔1〕。
  相比全解码,半解码不需要运动补偿,因此能大大节省视频处理时间。然而半解码会得到多个模态的数据,需要在后续处理流水线中进行信息融合。
  研究团队要解决的第二个问题是小样本视频分类。传统视频分类方法要求训练数据和测试数据具有相同的类别,如果类别发生改变则需要重新进行训练,而训练时需要大量数据。
  在实际应用中,类别定义可能是动态的,并且每个类别能提供的示例很有限。当需求发生变化时,需要根据少量示例样本快速适应新需求,这一问题可以抽象为少样本分类问题:每类给出少量示例样本(称为支撑样本),对未知类别样本(称为查询样本)进行分类。
  二hr方法介绍
  图3整体框架图
  方法的总体框架如图3所示。第一部分是压缩域信息的提取。与传统方法不同,通过半解码从视频封装文件中取出I帧、MV和残差后,可以利用MV与运动的相关性,筛选最优最强运动的帧。在进一步输入网络之前,需要从I帧到被选取帧对MV和残差进行累积和对齐,获得更显著的特征,建立当前帧MV、残差与I帧像素的直接空间对应关系,得到如图4所示压缩域信息。
  图4压缩域信息示意图
  随后将提取的压缩域信息输入骨干网络进行融合、提取压缩域特征。以I帧和MV为例,分别采用分级结构的卷积网络(如ResNet50与ResNet18〔2〕)提取特征,在每一级之间对I帧和MV特征进行融合交互。由于I帧和MV在同一GOP内具有最强的相关性,这样的交互仅发生在属于同一GOP的帧之间。
  图5小样本分类模块示意图
  最后,根据压缩域特征进行小样本分类。为了进行小样本分类,需要计算查询视频与支撑视频之间的距离度量,判断查询视频与哪类支撑视频最接近。首先通过视频内部自注意力对视频的特征进行长时融合。用查询视频的各帧对支撑视频的各帧计算自注意力,为每个支撑视频类别构造一个原型(prototype)作为这类支撑视频的代理,最后计算查询视频到这些原型的欧式距离,根据最近邻原则进行分类。
  三hr实验结果
  上述方法设计了一套包含两个骨干网络以及一系列注意力机制的架构,比传统的单流RGB网络架构更复杂。但是,由于视频中表观信息存在很大的冗余性,连续数帧在外表上往往变化不大,因此可以通过输入少量I帧和较多的MV、残差,并对I帧使用大网络、对MV、残差使用小网络,实现计算量的减少。由于运动和变形信息能被中间帧的运动向量和残差捕捉,这一设置并不会带来精度的显著损失,并且在相同算力限制下可以堆叠更多的结构、取得更好的效果。
  表1为多个数据集、多种支撑样本数量设置下的分类精度,可以看到研究团队提出的方法通过实验验证达到了当前最好的性能。
  表1不同数据集、不同支撑样本数量设置下的分类精度
  表2将压缩域信息与光流进行对比,将MV替换为光流后,性能出现下降,而且处理时间有数量级的增加,这一方面说明了压缩域信息的高效性,另一方面则说明针对压缩域信息特有GOP结构所提出的方法与传统双流网络结构是不同的,传统双流方法中的光流并不适应所提出的结构。
  表2将MV替换为光流后的处理时间和分类精度
  四hr总结
  研究团队提出了一种针对海量压缩视频的小样本分类方法,利用压缩域信息的高效性,针对压缩视频特有结构设计网络架构,取得了当前最好的小样本视频分类性能。与传统RGB信息相比,压缩域信息解码速度快,包含直接的运动预测信息,既能加快前端视频处理速度,也能降低中端网络计算量、在有限的算力下容许更多的结构,还能辅助后端分类,提高分类精度。
  该成果目前也正逐步应用于人民中科跨模态搜索引擎白泽中,将极大地提高白泽对海量视频数据的识别效率,以及提升其对小样本视频的识别性能。网络信息化时代,内容安全至关重要。面对海量的非结构化内容,人海战术早已无能为力,白泽让我们看到了一条内容智能治理的康庄大道。
  相关成果发表于:
  W。Luo,Y。Liu,B。Li,W。Hu,Y。Miao,andY。Li,LongShortTermCrossTransformerinCompressedDomainforFewShotVideoClassification,InInternationalJointConferenceonArtificialIntelligence,2022。
  参考文献:
  1。Li,Yufeng,JufeiXiao,andWeiWu。MotionEstimationBasedonH。264VideoCoding。In20125thInternationalCongressonImageandSignalProcessing,pp。104108。IEEE,2012。
  2。He,Kaiming,XiangyuZhang,ShaoqingRen,andJianSun。DeepResidualLearningforImageRecognition。InProceedingsoftheIEEEConferenceonComputerVisionandPatternRecognition,pp。770778。2016。
  3。LeGall,Didier。MPEG:AVideoCompressionStandardforMultimediaApplications。CommunicationsoftheACM34,no。4(1991):4658。
  4。Wiegand,Thomas,GaryJ。Sullivan,GisleBjontegaard,andAjayLuthra。OverviewoftheH。264AVCVideoCodingStandard。IEEETransactionsonCircuitsandSystemsforVideoTechnology13,no。7(2003):560576。
  5。Geyser,Werner。TiktokStatistics63TiktokStatsYouNeedtoKnow〔2022Update〕。InfluencerMarketingHub,March31,2022。https:influencermarketinghub。comtiktokstats。
  6。YouTubeforPress。blog。youtube。AccessedMay25,2022。https:blog。youtubepress。
  关于人民中科
  人民中科智能技术有限公司,是人民网与中科院自动化所共同发起设立的人工智能技术引擎和科技成果转化平台,拥有世界领先的内容理解技术,核心产品是跨模态智能搜索引擎白泽,初始应用场景是数字世界的安全,目标是成为全球内容科技领导企业。

小学生劳动最光荣演讲稿500字劳动最光荣演讲稿(一)老师们,同学们:早上好!今天我演讲的题目是《劳动最光荣》。发明家爱迪生说过:ldquo;世界上没有一种具有真正价值的东西,可以不经过亲勤劳动而……能感知疼痛的人造皮肤本周在人工智能领域,格拉斯哥大学的一组工程师开发了人造皮肤,可以学习体验模拟疼痛并做出反应。该团队的人造皮肤是基于一种突触晶体管的新型处理系统,模仿大脑的神经网络。这些晶……微信并非完全免费,已上线的3项收费功能,你知道几个?微信是国内最大的社交应用APP,拥有超过12亿的活跃用户,它的应用场景已经涉及到了我们大多数人吃穿住行的方方面面,甚至于已经成为了一款国民基础应用。微信能够取得如此巨大的成就除……节约用水的作文400字第一篇:水是我们不可缺少的东西,水同时是我们生命的支柱。水,它既普通,又珍贵。说它普通,家家都有,说它珍贵,人的生命离不开它。节约用水是我们现代社会所一直提倡的,是我们应……有关于流星作文1000字篇一:流星,最耀眼的光芒传说,只要对着流星许愿愿望就一定会实现,那么这次,一个感人而又纯洁的故事就发生在一位流星女孩的身上题记D,一个孤独的女孩,她没有爸爸,妈妈也……北京互联网法院上线全国法院首个家庭教育指导平台儿童总是离不开手机怎么办?各种APP的青少年模式到底怎么用?近日,北京互联网法院上线全国法院首个家庭教育指导平台首互未来家庭教育指导平台,向社会公众开放优质课程,帮助家长更好履……NBA曾经的王者即将归位!小卡每日高强度训练,状态比伤前更佳北京时间6月7日,快船球员曼恩近日在接受《洛杉矶时报》记者AndrewGreif采访时谈到了队友莱昂纳德的健康状况。王者即将归位曼恩表示小卡在休赛期增加了训练量,对……全红婵地位不保?陈芋汐成10米跳台新王者,2次击败红姐正式表近日中国跳水队结束了最后一次测试赛,他们将会带着粉丝们的期待不断加强训练,在之后的世锦赛中取得好成绩,目前来看中国跳水队的比赛压力还是比较大的,在这次世锦赛中他们将会参加13个……那位陌生人在我心中改变了作文在夜空中,总有颗是最闪亮的星星。在早上,花丛中,总有朵最漂亮的花朵。在早晨,沙滩上,总有个充满阳光的贝壳。在我成长的过程中,碰到过许多不同想象的人。就在我这个暑假,也遇到了一位……忘不了那件事作文500字往事在脑海里模糊地呈现,像八十年代的投影机,断断续续。惟独那件事,完整地保留在我心间。刚入学时,我对学校的一切都感兴趣,高大的教学楼,发出闹腾腾的声音,嘈杂一片。放学,人……文明白云文明旅游,这样多好在经历了疫情防控的反复大家也期盼能够出游感受生活的美好体验触摸了久违的美丽风景后我们对旅游赋予生活的美好意义更多了一分理解文明旅游,这样多好……秋日随记作文500字一直都喜欢干净的素白,甚至有些为之发狂。肩上长了个痣,很小的一个黑点,却分外的刺眼,用指甲将它掐了几次才将表皮掐破,一点黑黑的液体流了出来,不知是血液还是些别的什么。以为……
美丽的雪景小学生作文晶莹的雪花,在夜空中开着属于她们的狂欢舞会,随着风的摇摆,变换着舞姿。下面是小编收集整理的美丽的雪景作文,希望对您有所帮助!美丽的雪景作文一今天下了一场大雪,一场让我们期……收视夺冠!张若昀白鹿警察荣誉首播,央八又拿到王炸了40集民警题材电视剧《警察荣誉》正式开播。网络平台六集率先上线,然后央八次黄金档两集开播。一开播收视直接破1,次黄金档登顶夺冠。显然这部剧在央八次黄金档首播,……表面上是影帝视后,其实演技非常拉垮,求求这6位演员别再吹了好的演员,是角色让人忘掉演员本人。最好的演员,是千戏千面,所有的戏,都让人记住的是角色,而不是演员。获得奖项,拿到影帝影后自然是对演员演技的认可,但是一时好不……安全征文杜绝伤害ampnbspampnbsp永保安康曾经读到一篇文章。内容大致是:五月的一天下午,一对热恋的男女在市区的街头行走。微风吹拂着少女白色的衣衫,情景是平和而又温馨。眼看阳光从建筑物上渐渐褪去,男孩对女孩说,邮箱就在对……关于太阳的作文追逐太阳太阳每天东升西落,从0到180,世界在轮回中,我站在地球的中心,经历着一切潮起潮落。题记0太阳,海平面的微笑世界伊始,生命轮回,海平面泛起耀眼的白光,赤色流云……张镇麟能冲击NBA?李洪庆一句话或是结局,现实情况摆在眼前5月29日,最近是中国球员闯荡NBA的消息被热议,目前主要是三名球员,分别是曾凡博、张镇麟、郭昊文。其中辽宁球迷最关心的是张镇麟,他之前早就有消息传出,接下来准备去美国闯荡,进……日记两篇观月有感一日,夜晚中,我突然想去外面透一透新鲜空气。刚走出来,变看到一幅美景。东南方一轮圆月挂天空。周围散发着暖黄色的光芒。一层层波浪似的云彩笼罩在月亮上,更增添了一股神……人类中耳曾是鱼类的鳃!我国科学家揭示脊椎动物喷水孔起源近日,中科院古脊椎所研究员盖志琨联合我国、英国、瑞典三国院士,以第一作者身份在《生态和演化前沿》(FrontiersEcologyandEvolution)上发表了有关脊椎动物……2022年iPhone在售机型攻略手册,赶紧收藏起来吧苹果当前在售机型发布时间iPhone13Pro2021年9月iPhone13ProMax2021年9月iPhone132021年9月iPhone13mini2021年9月iPh……库克痛批欧盟之后,美国也要求苹果开放侧载?关于欧盟要求苹果开放侧载(第三方应用市场)的消息引发热议,尽管苹果使出浑身解数也无济于事,上周《数字市场法案》临时协议高票通过,意味着AppStore垄断地位大限将至。另一边,……苹果的创新垄断和安全问题太平洋夏令时间5月25日晚,美国参议员AmyKlobuchar(艾米克洛布查)介绍了《美国选择与创新法案》的修订案,这是一篇新修订的反垄断法提案。AmyKlobuchar……编程条件转移的底层逻辑逻辑表达式与串并联电路和德摩根规则我们知道,二进制可以用门电路来表示,二进制计算可以用实现布尔代数开关电路来表示。我们知道,计算机对非数值问题的处理的关键在于其能处理分支和循环。处理分支和循环是根据……
友情链接:快好找快生活快百科快传网中准网文好找聚热点快软网