范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

参数量仅为原来1,北邮等利用超分算法提出高性能视频传输方法

  机器之心专栏
  北京邮电大学-模式识别与智能系统实验室
  来自北京邮电大学和英特尔中国研究院的研究团队创新性地利用超分辩率算法定义了网络视频传输任务,减小了网络视频传输的带宽压力。
  互联网视频在过去几年发生了爆发式增长,这给视频传输基础设施带来了巨大的负担。网络视频传输系统的质量很大程度上取决于网络带宽。受客户端 / 服务器日益增长的计算能力和深度学习的最新进展的启发,一些工作提出将深度神经网络 (DNN) 应用于视频传输系统的工作,以提高视频传输质量。这些 DNN 的方法将一整个视频平均分成一些视频段,然后传输低分辨率的视频段和其对应的 context-aware 模型到客户端,客户端用这些训练好的模型推理对应的低分辨率视频段。通过这种方式,可以在有限的互联网带宽下获得更好的用户体验质量 (QoE)。其中,传输一段长视频需要同时传输多个超分辨率模型。
  近日,来自北京邮电大学和英特尔中国研究院的研究者首先探索了不同视频段所对应的不同模型间的关系,然后设计了一种引入内容感知特征调制(Content-aware Feature Modulation,CaFM)模块的联合训练框架,用来压缩视频传输中所需传输的模型大小。该研究的方法让每一个视频段只需传输原模型参数量的 1%,同时还达到了更好的超分效果。该研究进行了大量的实验在多种超分辨率 backbone、视频时长和超分缩放因子上展现了该方法的优势和通用性。另外,该方法也可以被看作是一种新的视频编解码方式。在相同的带宽压缩下,该方法的性能(PSNR)优于商用的 H.264 和 H.265,体现了在行业应用中的潜能。
  论文链接:http://arxiv.org/abs/2108.08202GitHub 地址:https://github.com/Neural-video-delivery/CaFM-Pytorch-ICCV2021
  与当前单图像超分辨率 (SISR)和视频超分辨率 (VSR)的方法相比,内容感知 DNN 利用神经网络的过拟合特性和训练策略来实现更高的性能。具体来说,首先将一个视频分成几段,然后为每段视频训练一个单独的 DNN。低分辨率视频段和对应的模型通过网络传输给客户端。不同的 backbone 都可以作为每个视频段的模型。与 WebRTC 等商业视频传输技术相比,这种基于 DNN 的视频传输系统取得了更好的性能。
  尽管将 DNN 应用于视频传输很有前景,但现有方法仍然存在一些局限性。一个主要的限制是它们需要为每个视频段训练一个 DNN,从而导致一个长视频有大量单独的模型。这为实际的视频传输系统带来了额外的存储和带宽成本。在本文中,研究者首先仔细研究了不同视频段的模型之间的关系。尽管这些模型在不同的视频段上实现了过拟合,但该研究观察到它们的特征图之间存在线性关系,并且可以通过内容感知特征调制(CaFM)模块进行建模。这促使研究者设计了一种方法,使得模型可以共享大部分参数并仅为每个视频段保留私有的 CaFM 层。然而,与单独训练的模型相比,直接微调私有参数无法获得有竞争力的性能。因此,研究者进一步设计了一个巧妙的联合训练框架,该框架同时训练所有视频段的共享参数和私有参数。通过这种方式,与单独训练的多个模型相比,该方法可以获得相对更好的性能。
  该研究的主要贡献包括:提出了一种新颖的内容感知特征调制(CaFM)模块的联合训练框架,用于网络间的视频传输;对各种超分辨率 backbone、视频时间长度和缩放因子进行了广泛的实验,证明了该方法的优势和通用性;在相同的带宽压缩下,与商业 H.264 和 H.265 标准进行比较,由于过度拟合的特性,该方法展示了更有潜力的结果。
  图 1
  方法
  神经网络视频传输是在传输互联网视频时利用 DNN 来节省带宽。与传统的视频传输系统不同,它们用低分辩率视频和内容感知模型取代了高分辨率视频。如上图所示,整个过程包括三个阶段:(i)在服务器上对每个视频段的模型进行训练;(ii) 将低分辨率视频段与内容感知模型一起从服务器传送到客户端;(iii) 客户端上对低分辨率视频进行超分工作。但是,该过程需要为每个视频段传输一个模型,从而导致额外的带宽成本。所以该研究提出了一种压缩方法,利用 CaFM 模块结合联合训练的方式,将模型参数压缩为原本的 1%。
  动机和发现
  图 2
  该研究将视频分成 n 段,并相应地为这些视频段训练 n 个 SR 模型 S1、S2 ...Sn。然后通过一张随机选择的输入图片(DIV2K) 来分析 S1、S2...Sn 模型间的关系。该研究在图 2 中可视化了 3 个 SR 模型的特征图。每张图像代表某个通道( channel)的特征图,为了简单起见,该研究只可视化了一层 SR 模型。具体来说,该研究将特征图表示为
  ,其中 i 表示第 i 个模型,j 表示第 j 个 通道,k 表示 SR 模型 的第 k 层卷积。对于随机选择的图像,可以计算
  和
  之间的余弦距离,来衡量这两组特征图之间的相似度。对于图 2 中的特征图,该研究计算了
  ,
  和
  之间的余弦距离矩阵。如图 3 所示,研究者观察到虽然 S1 , S2 ...Sn 是在不同的视频段上训练的,但根据图 3 中矩阵的对角线值可以看出"对应通道之间的余弦距离非常小"。该研究计算了 S1、S2 和 S3 之间所有层的余弦距离的平均值,结果分别约为 0.16 和 0.04。这表明虽然在不同视频段上训练得到了不同的 SR 模型,但是
  和
  之间的关系可以通过线性函数近似建模。这也是该研究提出 CaFM 模块的动机。
  图 3
  内容感知特征调制模块(CaFM)
  该研究将内容感知特征调制 (CaFM) 模块引入基线模型(EDSR),以私有化每个视频段的 SR 模型。整体框架如图 4 所示。正如上文动机中提到的,CaFM 的目的是操纵特征图并使模型去拟合不同的视频段。因此,不同段的模型可以共享大部分参数。该研究将 CaFM 表示为 channel-wise 线性函数:
  其中 x_j 是第 j 个输入特征图,C 是特征通道的数量,a_j 和 b_j 分别是 channel-wise 的缩放和偏置参数。该研究添加 CaFM 来调制基线模型的每个卷积层的输出特征。以 EDSR 为例,CaFM 的参数约占 EDSR 的 0.6%。因此,对于具有 n 个段的视频,可以将模型的大小从 n 个 EDSR 减少到 1 个共享 EDSR 和 n 个私有 CaFM 模块。因此,与基线方法相比,该方法可以显著降低带宽和存储成本。
  图 4
  联合训练
  正如上文中所介绍的,该研究可以利用 CaFM 去替换每个视频段的 SR 模型。但是通过在一个 SR 模型上微调n 个 CaFM 模块的方式很难将精度提升到直接训练 n 个 SR 模型的 PSNR。因此该研究提出了一种联合训练的框架,该框架可以同时训练 n 个视频段。公式可以表示为:
  对于 SR 图片
  ,i 表示第 i 个视频段,s 表示该视频段中的第 s 个 sample。公式中 W_s 表示共享的参数,W_i 表示每个视频段私有的参数。对于每个视频段,可以这样计算损失函数:
  在训练过程中,该研究从视频段中统一采样图像来构建训练数据。所有图像用于更新共享参数 W_s,而第 i 个视频段的图像用于更新相应的 CaFM 参数 W_i。
  VSD4K 数据集
  Vimeo-90K 和 REDS 等公共视频超分数据集仅包含相邻帧序列(时常太短),不适用于视频传输任务。因此,该研究收集了多个 4K 视频来模拟实际的视频传输场景。该研究使用标准的双三次插值来生成低分辨率视频。研究者选择了六个流行的视频类别来构建 VSD4K,其中包括: 游戏、vlog、采访、体育竞技、舞蹈、城市风景等。每个类别由不同的视频长度组成,包括:15 秒、30 秒、45 秒、1 分钟、2 分钟、5 分钟等。VSD4K 数据集的详细信息可在论文的 Appendix 中阅读,同时 VSD4K 数据集已在github项目中公开。
  定性 & 定量分析
  主实验对比
  根据上表可以清晰地看到,在不同的视频和超分尺度上该方法 (Ours) 不仅可以追赶上训练 n 个模型 (S1-n) 的精度,并且可以在峰值信噪比上实现精度超越。注:M0 表示不对长视频进行分段,在整段视频上只训练一个模型。
  VS codec
  该部分实验对本文提出的方法和传统 codec 方法 (调低码率做压缩) 进行了定量比较。根据上表可以清晰地看到 (红色表示第一名,蓝色表示第二名),在相同的传输大小下(Storage),该方法(Ours) 在大多数情况下可以超越 H264 和 H265。同时视频的长度越长,SR 模型所占传输大小的比例越小,该方法的优势越明显。
  定性比较
  总体而言,该论文创新性地利用超分辩率算法定义网络视频传输任务,目的是减少网络视频传输的带宽压力。利用内容感知特征调制 (CaFM) 模块结合联合训练的方式,对每个视频段对应的模型参数量进行压缩(1%)。为后续的研究者,提供了新的研究方向。

沙漠越野我曾遇见过的一些怂人怂事那些平平无奇的高手让我敬佩而那些知难而退的怂人亦让我心生敬意前些天,我写过一篇平平无奇沙漠越野高手的故事。今天,我想再写一篇沙漠越野的怂人怂事。写些笑话吗?不,那些平平无奇的高手让库布齐有了越野新地标,BJ40群英挑战赛决战沙漠对于大部分越野人来说,越野是件有意思的事,在豁沙穿越干大坡的过程中,我们获得了快乐。而当越野成为探索世界的工具,或者被赋予使命的时候,越野这件事也就变得有了意义。但往往有意思和有意猎豹为什么捕食率如此低?虽是短跑冠军,但体力很差豹子大家都很熟悉。在最初的认知里,都知道豹子是世界上跑得最快的陆地动物。它们的身上长着可点可缀的黑色斑点,是大家眼里公认的最好看的猫科动物。豹子虽然跑得快,但也并非所有的豹子都称得消费养老从现在开始每一笔消费都能积攒一笔养老金你养我长大,我陪你到老,在多数人的传统观念里都会把养老问题交给自己的孩子,可如今社会压力大,孩子们也是分身乏术,想要照顾老人,是心有余而力不足。随着孩子的成年,结婚买房买车等等,哪消费养老相比传统养老模式,到底好在哪里?消费养老创新模式相对于传统养老保险模式而言,最具根本性的创新在于突破了传统养老保险制度基于工资待遇核定缴费制的模式,开创了以消费作为核定养老金的依据。也就说,过去我们缴纳养老保险,十分寒冷时要增添衣物,为什么实际上人却会主动脱衣服?我们都知道人类是恒温动物,在没有像动物一样有着毛茸茸的毛发御寒的情况下,在大冷天只能穿着足够多的衣物来抵御寒冷。寒冷的滋味任谁都不好受,因此人类出于本能的反应都会利用衣服来温暖自己微信双开详解,电脑手机都可以实现微信双开就是指在同一设备同时登录两个微信。我们通常用到的设备主要有电脑和手机。1电脑实现双开在电脑的windows任务栏上,点击搜索按钮,输入cmd后,系统自动搜索到命令行提示符应简单几步实现手机热点连电脑,出差在外临时上网非常方便出差在外,用电脑处理事情临时要用网络,而周边又没有安全的网络时,最好的办法就是用手机热点来连电脑。方便快捷又安全,连接方法如下1手机端设置在手机端要做的就是把WIFI热点设置好,并服务器和电脑虽然都是计算机,但却有很大区别,千万不要用错了表面上看,服务器和电脑都是由CPU内存主板磁盘等几大部分组成。实际上,它们之间的区别却是非常大的。主要体现在以下四点1性能区别在性能上,个人电脑一般侧重于办公和娱乐。而且,一般一台电脑C盘空间不足,三个方法可让C盘恢复如初电脑C盘空间通常是放置操作系统的分区,空间不足会严重影响系统的性能。要想清理C盘空间,可以通过以下三个方法来操作。1清理垃圾文件windows本身自带有空间清理程序,可以帮助我们清电脑关不了机不用怕,一条命令就能搞定电脑中有软件出现异常时,可能会出现无法正常关机的情况。即无法通过windows菜单中的关机功能来关机。面对这种情况,不用担心,我们有三种方法可以关机。1shutdown命令强制关机
滴滴出行等11家网约车公司遭约谈部分平台恶性竞争非法营运滴滴出行等11家网约车公司遭约谈部分平台恶性竞争非法营运中国网约车平台滴滴出行北京总部滴滴大厦。中国交通运输部会同中央网信办工业和信息化部公安部国家市场监管总局等交通运输新业态协同阿富汗一家10口有美签坐等撤离电话结果被美军空袭误伤炸死阿富汗一家10口有美签坐等撤离电话结果被美军空袭误伤炸死喀布尔住宅区内疑似汽车炸弹遭美军空袭。(图路透)美军为了阻止恐怖分子再次对喀布尔机场发动恐怖袭击,29日出动无人机摧毁一辆由泰国一老人被丢弃在水沟里,子女让其自生自灭老人皮包骨被丢在大水沟里差点淹死子女弃养让她自生自灭泰国发生一位老人被弃养,丢在水沟的事件。位在泰国首都曼谷北边的巴吞他尼府(PathumThani)一处医院,保全人员发现一位皮包公司快倒闭老板大乐透中奖,获得967万元人民币给员工发工资奖金公司快倒闭!老板大乐透中奖,获得967万元人民币秒给员工发工资奖金重庆男子爽中大乐透。重庆市一男子胡某日前喜中大乐透,获得967万元人民币。没想到,他前去领取奖金时,专门带来了公司伦敦桥倒了伊丽莎白女王驾崩应变计划外泄英国民众怒了伦敦桥倒了伊丽莎白女王驾崩应变计划外泄英国民众怒了英国女王伊丽莎白二世和已故的丈夫菲利普亲王。美国政治新闻媒体Politico近日披露了英国政府为女王驾崩的准备计划,代号伦敦桥行动为充饥阿富汗一家在波兰难民营采食毒蘑菇导致两孩子中毒身亡才到难民中心!阿富汗一家采死帽菇煮汤爆悲剧2兄弟身亡2兄弟误食死帽菇后,送医双双不治。从阿富汗首都喀布尔撤离到波兰难民中心的一家子,日前在吃了含有剧毒的死帽菇(deathcap)汤中国水下直升机完成海试可下潜超过1000公尺中国水下直升机完成海试可下潜超过1000公尺水下直升机外形犹如飞碟。中国研发的水下直升机9月3日在南海完成海试验收,下潜深度超过1000公尺。水下直升机其实是一种新型态的潜水器,受官员说,美国将任何被标记为犯罪或恐怖活动的阿富汗人送往科索沃福克斯新闻的国家安全和外交事务分析师瓦利德法雷斯(WalidPhares)对中东非常政治化的局势发表了看法。美国高级官员告诉福克斯新闻,位于巴尔干国家科索沃的美国军事基地邦德钢营将缺德老板3万枚1角硬币付薪员工数到半夜发现少给一半缺德老板3万枚1角硬币付薪员工数到半夜发现少给一半老板用上万枚1角硬币付薪水,员工无奈坐下数钱河北沧州一名养猪场的老板长期拖欠员工薪资,经过多次讨要之后,老板不情愿的以数万枚一角硬银河系可能存在外星生命!新研究发现4大有机分子库银河系可能存在外星生命!新研究发现4大有机分子库研究发言在银河系发现外星生命的机会,比料想得更有可能成真。人类寻找外星生命的成果可能取得了一大进展,英国里兹大学(Universit老翁公车上脱裤排泄!司机到站才发现整车沾满排泄物崩溃了老翁公车上脱裤排泄!司机到站才发现整车沾满排泄物崩溃了大陆吉林发生老翁在公车上上大号的事件。吉林一对老夫妻日前搭乘公车,没想到老翁一时内急,竟直接在公车上大号,随后若无其事继续搭车