专栏电商日志财经减肥爱情
投稿投诉
爱情常识
搭配分娩
减肥两性
孕期塑形
财经教案
论文美文
日志体育
养生学堂
电商科学
头戴业界
专栏星座
用品音乐

谷歌抢先手发布视频生成类AIGC,网友可以定制电影了

  机器之心报道
  编辑:杜伟、陈萍
  AIGC已经火了很长时间了,出现了文本生成图像、文本生成视频、图像生成视频等广泛的应用场景,如今谷歌研究院的一项新研究可以让我们根据输入视频生成其他视频了!
  我们知道,生成模型和多模态视觉语言模型的进展已经为具备前所未有生成真实性和多样性的大型文本到图像模型铺平了道路。这些模型提供了新的创作过程,但仅限于合成新图像而非编辑现有图像。为了弥合这一差距,基于文本的直观编辑方法可以对生成和真实图像进行基于文本的编辑,并保留这些图像的一些原始属性。与图像类似,近来文本到视频模型也提出了很多,但使用这些模型进行视频编辑的方法却很少。
  在文本指导的视频编辑中,用户提供输入视频以及描述生成视频预期属性的文本prompt,如下图1所示。目标有以下三个方面,1)对齐,编辑后的视频应符合输入文本prompt;2)保真度,编辑后的视频应保留原始视频的内容,3)质量,编辑后的视频应具备高质量。
  可以看到,视频编辑比图像编辑更加具有挑战性,它需要合成新的动作,而不仅仅是修改视觉外观。此外还需要保持时间上的一致性。因此,将SDEdit、PrompttoPrompt等图像级别的编辑方法应用于视频帧上不足以实现很好的效果。
  在近日谷歌研究院等发表在arXiv的一篇论文中,研究者提出了一种新方法Dreamix,它受到了UniTune的启发,将文本条件视频扩散模型(videodiffusionmodel,VDM)应用于视频编辑。
  论文地址:https:arxiv。orgpdf2302。01329。pdf项目主页:https:dreamixvideoediting。github。io
  文中方法的核心是通过以下两种主要思路使文本条件VDM保持对输入视频的高保真度。其一不使用纯噪声作为模型初始化,而是使用原始视频的降级版本,通过缩小尺寸和添加噪声仅保留低时空信息;其二通过微调原始视频上的生成模型来进一步提升对原始视频的保真度。
  微调确保模型了解原始视频的高分辨率属性。对输入视频的简单微调会促成相对较低的运动可编辑性,这是因为模型学会了更倾向于原始运动而不是遵循文本prompt。研究者提出了一种新颖的混合微调方法,其中VDM也在输入视频各个帧的集合上进行微调,并丢弃了它们的时序。混合微调显著提升了运动编辑的质量。
  研究者进一步利用其视频编辑模型提出了一个新的图像动画框架,如下图2所示。该框架包含了几个步骤,比如为图像中的对象和背景设置动画、创建动态相机运动等。他们通过帧复制或几何图像变换等简单的图像处理操作来实现,从而创建粗糙的视频。接着使用Dreamix视频编辑器对视频进行编辑。此外研究者还使用其微调方法进行目标驱动的视频生成,也即Dreambooth的视频版本。
  在实验展示部分,研究者进行了广泛的定性研究和人工评估,展示了他们方法的强大能力,具体可参考如下动图。
  对于谷歌这项研究,有人表示,3D运动和编辑工具可能是下一波论文的热门主题。
  还有人表示:大家可以很快在预算内制作自己的的电影了,你所需要的只是一个绿幕以及这项技术:
  方法概览
  本文提出了一种新的方法用于视频编辑,具体而言:
  通过逆向被破坏视频进行文本引导视频编辑
  他们采用级联VDM(VideoDiffusionModels),首先通过下采样对输入视频就行一定的破坏,后加入噪声。接下来是级联扩散模型用于采样过程,并以时间t为条件,将视频升级到最终的时间空间分辨率。
  在对输入视频进行破坏处理的这一过程中,首先需要进行下采样操作,以得到基础模型(16帧2440),然后加入方差为
  高斯噪声,从而进一步破坏输入视频。
  对于上述处理好的视频,接下来的操作是使用级联VDM将损坏掉的低分辨率视频映射到与文本对齐的高分辨率视频。这里的核心思想是,给定一个嘈杂的、时间空间分辨率非常低的视频,有许多完全可行的、高分辨率的视频与之对应。本文中基础模型从损坏的视频开始,它与时间s的扩散过程具有相同的噪声。然后该研究用VDM来逆向扩散过程直到时间0。最后通过超分辨率模型对视频进行升级。
  混合视频图像微调
  仅利用输入视频进行视频扩散模型的微调会限制物体运动变化,相反,该研究使用了一种混合目标,即除了原始目标(左下角)之外,本文还对无序的帧集进行了微调,这是通过maskedtemporalattention来完成的,以防止时间注意力和卷积被微调(右下)。这种操作允许向静态视频中添加运动。
  推理
  在应用程序预处理的基础上(AapplicationDependentPreprocessing,下图左),该研究支持多种应用,能将输入内容转换为统一的视频格式。对于图像到视频,输入图像被复制并被变换,合成带有一些相机运动的粗略视频;对于目标驱动视频生成,其输入被省略,单独进行微调以维持保真度。然后使用DreamixVideoEditor(右)编辑这个粗糙的视频:即前面讲到的,首先通过下采样破坏视频,添加噪声。然后应用微调的文本引导视频扩散模型,将视频升级到最终的时间空间分辨率。
  实验结果
  视频编辑:下图中Dreamix将动作改为舞蹈,并且外观由猴子变为熊,但视频中主体的基本属性没有变:
  Dreamix还可以生成与输入视频时间信息一致的平滑视觉修改,如下图会滑滑板的小鹿:
  图像到视频:当输入是一张图像时,Dreamix可以使用其视频先验添加新的移动对象,如下图中添加了在有雾的森林中出现一头独角兽,并放大。
  小屋旁边出现企鹅:
  目标驱动视频生成:Dreamix还可以获取显示相同主题的图像集合,并以该主题为运动对象生成新的视频。如下图是一条在叶子上蠕动的毛毛虫:
  除了定性分析外,该研究还进行了基线比较,主要是将Dreamix与ImagenVideo、PlugandPlay(PnP)两种基线方法进行对比。下表为评分结果:
  图8展示了由Dreamix编辑的视频和两个基线示例:文本到视频模型实现了低保真度的编辑,因为它不以原始视频为条件。PnP保留了场景,但不同帧之间缺乏一致性;Dreamix在这三个目标上都表现良好。
  更多技术细节请参阅原论文。

国内油价继续上涨,最新预计涨幅约为90元吨,调价窗口11月21日按照最新消息可知,国内油价继续上涨,因为随着上一轮成品油调价上涨结束,新一轮计价周期开局,但计价统计周期第1个工作日原油变化率仍处于正值区间内,有机构预测变化率达到4。0,油价预计众生药业涨停大战第3集,2机构继续疯狂卖出1。45亿,方新侠来接力1选股众生药业,炒作新冠防治方向,11月3日晚间公告,新冠创新药物RAY1216片获得期临床试验组长单位伦理批件。2入场11。9日,医药板块的人气核心,众生药业继续涨停,但龙虎榜上三大指数开盘涨跌不一有色金属板块盘初领涨中证网讯(记者李莉)11月9日,A股三大指数开盘涨跌不一。据Wind数据,上证指数基本平开,报3064。46点深证成指高开0。06,报11149。37点创业板指低开0。42,报24个人养老金来啦!怎么参与?如何领取?近日,个人养老金实施办法落地!哪些人适合交?怎么交?怎么领取?今天给你讲清楚,建议先关注收藏,以后慢慢看!视频加载中这个制度可以理解为除了社保账户之外,鼓励你再开一个专款专用的养老PRCBroker美股美国中期选举后股市上涨希望渺茫PRCBroker独家财报精彩导读在美国中期选举中,共和党获得众议院过半数席位的可能性较大如果美国中期选举后股市上涨是出于扩大财政的考虑,那么这一次希望渺茫在将于8日举行的美国中期国家级暴雪预警升级,紫色雪区出现!预报4省暴雪局部大暴雪11月11日下午,从风云四号高清可见光卫星云图上看,我国北方地区的浓云迅速增多,从西北地区东部延伸到华北黄淮多地,这一部分是旺盛的暖湿气流北上,和南下的冷空气正面对撞,从而激发出大常熟每日优鲜一审被判向海底捞旗下公司支付超百万元红星资本局11月9日消息,近日,四川新派餐饮管理有限公司(以下简称四川新派公司)与常熟每日优鲜电子商务有限公司(以下简称常熟每日优鲜公司)买卖合同纠纷一审文书公开。据中国裁判文书网海外马斯克旗下公司超级高铁启动全面测试,时速超965公里文懂车帝原创彩丽美懂车帝原创行业近日,特斯拉CEO马斯克旗下的隧道挖掘公司TheBoringCompany官方宣布超级高铁已开启全面测试。图源TheBoringCompany根据官多项中央财政预算资金提前下达视频加载中央视网消息(新闻联播)近日,财政部提前下达2023年中央财政衔接推进乡村振兴补助资金1485亿元,支持巩固拓展脱贫攻坚成果,推进乡村振兴,重点向国家乡村振兴重点帮扶县易地油价深夜突然大跳水,利空冲击下回调变反转?来源能源研发中心后市观点油价夜盘走出大幅下挫行情,尤其是在铜贵金属等普遍强势背景下,这样的表现尤其让市场意外。周二亚欧时段油价表现相对符合预期,整体震荡回落调整,从波动节奏来看仍属美国这一补贴条款,遭两国带头批评欧元区国家的财政部长7日在比利时首都布鲁塞尔召开会议,对美国政府大力补贴本土电动汽车产业的政策可能冲击欧洲汽车产业表达担忧。法国德国财长带头批评美国做法。美国总统约瑟夫拜登今年8月
藐视洛希极限,太阳系边缘惊现诡异光环物理学规律靠不住了?一个在洛希极限外运行的环。创神星环的存在似乎违反了物理学规律。ESA2月8日发表在自然杂志上的一篇论文称,在海王星轨道以外柯伊伯带内运行的创神星(夸欧尔,Quaoar)有一个在洛希腾势D93500公里春节自驾,从阳朔到桂林可以不用一滴油大家好,8年新能源汽车老司机对于新能源汽车的热爱一直没有间断过,平时没事的时候,自己喜欢瞎琢磨,尤其喜欢开着纯电动汽车长途出行,分享见闻旅途的生活以及自己多年新能源汽车的用车经验。突然大裁员,波及超6600人!又一巨头扛不住了?面对个人电脑需求的急剧下降,戴尔科技公司将裁员约6650人,成为最新一家宣布裁员数千人的科技公司。受此消息影响,戴尔科技股价跌超3,至一周低位,报40。97美元股,最新总市值293苏州不仅准妈妈要注意孕夫更要小心宝爸篇新时代新气象,现在很多公司的产假制度比较完善,不仅孕妇可以休产假,甚至是准爸爸也可以休产假,在家陪老婆。当然,制度的完善就提示了广大宝爸,生孩子并不是宝妈一个人的事情,而是双方的责如此太监太监忧心国事,参加戊戌变法,死谏慈禧太后寇连材寇连材,北京昌平人,为人耿直,粗通文墨。因家庭出现重大变故而无法生计,最后跑到北京做了太监。进宫后,寇连材十分幸运地被分配到慈禧太后身边,负责给慈禧太后梳头,由于他聪明能干,央视我们的日子首波口碑出炉了!打分评价都一针见血年代剧题材在近两年来愈发受到观众的欢迎,极具回忆杀的整体布景以及细腻真挚的情感表达都是留住观众的主要原因。2022年人世间充分展现了属于年代剧的魅力,无论是亲情友情,还是爱情刻画都15岁宫女爬上龙床,为56岁雍正生下皇子,死后乾隆为她停朝3天看惯了清宫戏里后宫妃嫔佳丽争奇斗艳,但你真的清楚她们都是怎么选出来的吗?其实,清朝的选妃从顺治入关以后就开始了,面向人群很广,凡满族八旗子弟,家中有13岁以上,16岁以下的闺女,都为何慈禧太后对光绪帝的宠妃恨之入骨,恨不得杀了她?你有没有想过为什么慈禧太后视甄妃为眼中钉?真的有一见钟情这种事吗?我们都知道,慈禧太后当摄政王长达40多年,手握大清朝全部大权,慈禧太后对光绪皇帝严加控制。光绪皇帝的妃子中有一位甄王者荣耀一月上线18款皮肤,评价极高的只有三款,其他都有问题大家好,这里是阿呆的峡谷日记,将会给你带来王者荣耀最新的爆料内容。王者荣耀在1月份到底上线了多少款皮肤呢?相信很多玩家都没有去深入了解。因为1月份受春节的影响,所以1月份的皮肤数量清末旧照,女孩裹脚眼中噙满泪花,慈禧葬礼上纸扎人十分逼真清代的历史一直是人们津津乐道的话题,许多细节早已被历史所遗忘。看多了清宫戏,就会觉得这就是历史。但虚假的东西,是不可能变成真的,也不是完全消失的。他在网上搜索了十几张清朝时期的老照千万小心,互联网新微骗不知道朋友们注意到没有,最近抖音出现了很多教人赚钱的直播。借助抖音巨大的流量和热度吸引了不少人观看,教人赚钱的主播中存在不少老鼠,他们打着教人赚钱的幌子,干着哄骗圈钱的勾当。下图就
友情链接:快好找快生活快百科快传网中准网文好找聚热点快软网