保健励志美文体育育儿作文
投稿投诉
作文动态
热点娱乐
育儿情感
教程科技
体育养生
教案探索
美文旅游
财经日志
励志范文
论文时尚
保健游戏
护肤业界

音画代码(简单代码)

  音画代码(简单代码)原创机器之心Pro2021032413:17:42机器之心报道
  编辑:魔王
  LucidSonicDreams包可以实现GAN生成图像的音画同步效果,且支持自定义。
  GAN生成图像奇幻诡谲,对此我们早已不陌生。如果它们还可以卡音效呢?最近,有人就创建了一个实现类似效果的Python包LucidSonicDreams,只用几行代码就可以实现AI生成画作与音乐的同步。
  GitHub地址:https:github。commikaelalafrizlucidsonicdreams
  Colab教程地址:https:colab。research。google。comdrive1Y5i50xSFIuN3V4Md8TB30GOAtts7RQD?uspsharing
  在该项目提供的demo视频中,伴随着Saje的歌Raspberry,GAN生成的图像不断变换且呈现出了对应的节奏。
  工作原理
  生成艺术品通常是由GAN网络来完成的。LucidSonicDreams包默认使用StyleGAN2ADA架构,不过GAN架构也可以自定义。将这些模型在特定风格的图像数据集上进行训练,使之能够输出与训练图像风格一致的无穷多张图像。此外,LucidSonicDreams使用JustinPinkney创建库中的StyleGAN2预训练模型(地址:
  https:github。comjustinpinkneyawesomepretrainedstylegan2)。
  那么这些图像到底是如何生成的呢?
  将输入馈送至StyleGAN2模型(输入为有512个数字的向量),输入决定了模型的输出图像,因此对输入向量进行微小更改也将带来输出图像的微小变化。
  现在,有趣的部分到了:如果我们从音乐中获取声波,从声波中提取数值(如振幅)并添加至输入向量,会发生什么?
  LucidSonicDreams对视频每一帧执行这些操作,生成脉冲与变换与音乐一致的图像。
  具体而言,利用LucidSonicDreams包,音乐控制了3个主要视觉组件:脉冲(Pulse)、运动(Motion)和类别(Class):
  脉冲指视觉画面随着音乐的敲击性节奏而跳动。从数学角度来看,脉冲是向输入向量暂时添加声波振幅的结果(即在下一帧中该向量仍是初始向量);
  运动指视觉画面变换的速度。从数学上看,它是向输入向量累积添加振幅(即添加的振幅后续不会被清零);
  类别指生成图像中物体的标签,例如基于WikiArt图像训练的风格中就有167个类别(包括梵高、达芬奇、抽象派等)。而这些由音调进行控制,具体而言,12个音高分别对应12个不同类别。这些音高的振幅对传输至第二个输入向量(类别向量)的数字造成影响,而这由模型生成的对象来决定。
  项目作者表示,这个想法受到MattSiegelman的DeepMusicVisualizer项目的启发。目前网上也有一些类似的项目,但LucidSonicDreams的独特之处在于以Python包形式实现,且允许自定义。
  使用LucidSonicDreams包,你可以做到这些
  LucidSonicDreams具备极强的易用性和灵活性。用户可以使用pip进行安装:
  然后只需输入几行Python代码即可:fromlucidsonicdreamsimportLucidSonicDreamLLucidSonicDream(song39;chemicallove。mp339;,style39;abstractphotos39;)L。hallucinate(filename39;chemicallove。mp439;)
  改变风格
  运行以下代码,我们可以查看默认可用的风格:fromlucidsonicdreamsimportshowstylesshowstyles()
  这样就可以得到一组风格名称,这些风格来自JustinPinkney创建的库。你还可以输入自己的StyleGAN权重,或者使用其他GAN架构。
  调整参数
  LucidSonicDreams包的默认设置很好用,但它实际上有很多参数30多个,不过这些参数是可以调整的(参数详细信息参见Colab教程)。
  哪些参数最重要呢?我们来看整个视频生成pipeline:
  首先,对输入向量进行初始化和插值,作为视频的基础运动(basemotion)。参数speedfpm控制运动的速度,fpm表示每分钟帧数,即每分钟初始化的向量数。对于每个后续帧而言,参数pulsereact,motionreact,andclassreact控制音频操纵每个对应组件的程度。
  模型基于这些向量生成图像后,图像被传输经过一系列特效(也对音乐产生反应)。默认情况下,LucidSonicDreams包具备contrast和flash特效,可以与音频的敲击性节奏同步。通过设置contraststrength和flashstrength参数,即可进行调整。使用者还可以创建自定义特效。
  以下代码展示了调参过程:LLucidSonicDream(39;pancakefeet。mp339;,style39;modernart39;)L。hallucinate(filename39;pancakefeet。mp439;,speedfpm0,motionreact0。8,contraststrength0。5,flashstrength0。7)
  使用自己的StyleGAN权重
  如果你自己训练过StyleGAN,或者在网上获得了一些模型权重,你可以选择将文件路径传输至这些权重,作为风格参数的值。
  例如,文章开头的视频使用的是JeremyTorman训练的模型。生成视频所用代码如下所示:LLucidSonicDream(song39;raspberry。mp339;,style39;VisionaryArt。pkl39;)L。hallucinate(filename39;raspberry。mp439;,pulsereact1。2,motionreact0。7,contraststrength0。5,flashstrength0。5)
  使用单独的音轨
  这个包还可以用作音乐可视化工具,使用者可以上传单独的音轨,进而控制Pulse、Motion、Class、Contrast和Flash。如果你想使这些视觉组件与特定的乐器同步,使用这个包是不错的选择。你还可以利用这些单独的音轨自定义特效。
  以下是示例代码:LLucidSonicDream(song39;lucidsonicdreamsmain。mp339;,pulseaudio39;lucidsonicdreamspulse。mp339;,classaudio39;lucidsonicdreamsclass。mp339;,style39;wikiart39;)L。hallucinate(39;lucidsonicdreams。mp439;,pulsereact0。25,motionreact0,classes〔1,5,9,16,23,27,28,30,50,68,71,89〕,dominantclassesfirstTrue,classshuffleseconds8,classsmoothseconds4,classpitchreact0。2,contraststrength0。3)
  自定义特效
  除了内置的Contrast和Flash特效外,LucidSonicDreams包还允许用户自定义创建特效。用户只需创建一个包含至少以下3个参数的函数即可:array,表示应用特效的图像;strength,决定对音乐的反应强度;amplitude表示在任意给定时间点的音量。之后,将该自定义函数传输至EffectsGenerator对象。
  作者用以下代码进行了试验,其使用的是scikitimage的swirl特效:importnumpyasnpfromskimage。transformimportswirlfromlucidsonicdreamsimportEffectsGeneratordefswirlfunc(array,strength,amplitude):swirledimageswirl(array,rotation0,strength100strengthamplitude,radius650)return(swirledimage255)。astype(np。uint8)swirleffectEffectsGenerator(swirlfunc,audio39;unfaith。mp339;,strength0。2,percussiveFalse)LLucidSonicDream(39;unfaith。mp339;,style39;textures39;)L。hallucinate(39;unfaith。mp439;,motionreact0。15,speedfpm2,pulsereact1。5,contraststrength1,flashstrength1,customeffects〔swirleffect〕)files。download(unfaith。mp4)
  使用其他GAN架构
  你还可以使用其他GAN架构。只需定义一个函数,该函数以一组噪声向量和类别向量(NumPy数组)作为输入,输出一组Pillow图像。事实上,该函数甚至不需要使用GAN,它可以是能够将输入向量转换成图像的任意函数。
  下列代码使用BigGAN的PyTorch实现复现了DeepMusicVisualizer:frompytorchpretrainedbigganimportBigGAN,converttoimagesimporttorchbigganBigGAN。frompretrained(39;biggandeep51239;)biggan。to(39;cuda:039;)defbigganfunc(noisebatch,classbatch):noisetensortorch。fromnumpy(noisebatch)。cuda()classtensortorch。fromnumpy(classbatch)。cuda()withtorch。nograd():outputtensorbiggan(noisetensor。float(),classtensor。float(),truncation1)returnconverttoimages(outputtensor。cpu())LLucidSonicDream(39;seaofvoicesinst。mp339;,stylebigganfunc,inputshape128,numpossibleclasses1000)L。hallucinate(39;seaofvoices。mp439;,outputaudio39;seaofvoices。mp339;,speedfpm3,classes〔13,14,22,24,301,84,99,100,134,143,393,394〕,classshuffleseconds10,classshufflestrength0。1,classcomplexity0。5,classsmoothseconds4,motionreact0。35,flashstrength1,contraststrength1)

回闵中有感一年了,记得最近一次回闵中还是一年前我以为闵中变了,变的我不认识了去了才发现,闵中除了把希望小学拆掉以外,还是老样子走进学校还是有超级高大的香樟,依旧是回声巨大的教学楼……吉日吉时(万年历黄道吉日吉时查下载安装)吉日吉时(万年历黄道吉日吉时查下载安装)四大吉時乃時之吉者,能解諸凶。雨水後春分前:宜用甲丙庚壬即卯午酉子時。春分後穀雨前:宜用艮巽坤乾即寅巳申亥時。穀雨後小滿前:宜用癸……固体汽油弹(汽油白糖燃烧瓶)固体汽油弹(汽油白糖燃烧瓶)原创青梅煮酒侃谈史2021041716:52:13第二次世界大战末期,美军对日本的广岛和长崎投下原子弹,巨大的蘑菇云震惊了世人,也让人类第一次见识到……今天游绍兴今天游绍兴。哈哈。。是太好玩了。。。玩了之后才知道。。。除了我爱的鲁迅。。还有很多名人都是在这里。。。例如。。敬爱的周总理。。还有越王勾践。陆游。王羲之。蔡元培。秋……意外意外就是在一瞬间发生的。紧跟在我身后的灿灿惨叫一声:妈妈!我的心在那一刻跳漏了一拍,猛回头,我那个娇娇嫩嫩的小姑娘结结实实地摔了一个嘴啃泥。天刚下过雨,灿灿脸上全是泥,血不停地……微信打电话(微信电话下载安装)微信打电话(微信电话下载安装)今天趣哪儿2019102416:08:46(1)可扫描二维码(或微信搜索kcq),关注:(2)关注后,系统弹出信息微电话助手(3)注册……寻找。。。一个人走在街上思考着生活怎么会是这样原来一切都是假象不是他的想象他们的爱就是那样在讨厌也要在一起只是开不开心他们已经分不出来但是这段爱情就要结束了……数码知识三星s10e是什么处理器处理器怎么样如今使用IT数码设备的小伙伴们是越来越多了,那么IT数码设备当中是有很多小技巧的,这些技巧很多小伙伴一般都是不知道如何来实用的,就好比最近就有很多小伙伴们想要知道三星s10e是……又一年高考结束啦又一年高考结束了。连续这几年,因为总有亲人或朋友的孩子参加高考,对于高考的关注度持续地反弹,大有超过上世纪80年代末之势。今年的高考,从80天开始倒记时,到今天,该数到负……极品刀神(书海小说网)极品刀神(书海小说网)名著再读2020040310:46:34大刀显得豪情,在许多的网友眼里,用刀的侠客都有一种江湖情结。他们似乎没有用剑的大侠那么的飘逸但又显得更平易近人,某……很久没写日记了,好久没为女儿写日记了,现在宝宝都已经快一岁半了,现在会说一些字了,走路稳多了,就是不喜欢吃饭,哎,看着女儿不吃饭,真的是很着急的,可是她好像没事人一样,一点也不知道我的担心,,……信息特征(信息的6大特征)信息特征(信息的6大特征)什么是信息:信息是表示一切事物属性及动态消息、指令、数据和信号中所包含的实际内容。信息本身并非实体,只是消息、数据。指令和信号中所包含的内……
废话一篇!阴天,正如我的心。我又觉得很没意思,又觉得自己活着不知道为什么,也不知道为什么要为这样那样的事情开心难过失落。其实如果可以选择,我宁愿没有来到这个世界上。这里其实没有那么……1。26省赚攻略京东年货节红包继续领,抢2021元购机神券1月26日,京东年货节第二波京享红包继续领,年货节主题为手机焕新,好运加倍,全品类狂欢,抢2021元购机神券,图书每满100减50,买手机赚年终奖,至高可赚2021元。京……小辣椒M2支持电信卡吗?小辣椒M2支持联通卡吗?小辣椒M2支持电信卡吗小辣椒M2支持电信卡。小辣椒M2是支持CDMAGSM双卡双待功能的,不过比较特别的是,这次小辣椒M2采用了双MicroSIM卡的设计,所以一般……伱若離去后会無期移情别恋、玩玩而已执著着不该执著的执著心有所属。谁卑微了承诺、放肆了寂寞玩不起你就不要跟我玩陪你到天明。下一站会去世界的什么角落查无此人……红蔷薇还是睡不着想一下这真是幼稚的。不能勇敢面对自己的,想什么都是空的放着萧亚轩的蔷薇。。。。。。不知谁昨夜没有睡浇醒了那一朵红蔷薇短短的就在这一夜之间……牛排火锅(顶顶牛排火锅加盟)牛排火锅(顶顶牛排火锅加盟)原创上班族的便当2019072811:01:00牛排火锅今日美食牛排火锅今天要做的牛排火锅用的是牛排骨,不是西餐的煎牛排;做法类似香辣羊……怎么查微信联系人删除聊天记录(如何能查看别人微信聊天记录)怎么查微信联系人删除聊天记录(如何能查看别人微信聊天记录)微信现已成为咱们最常用的谈天东西,由于微信的运用率非常高,咱们也经常会拾掇一下微信谈天记载和其他软件的缓存文件来……想念单纯的户外游也不知道是2002年还是2003年,三个傻丫头第一次走进了一个有关玩户外的酒吧,咨询了户外游相关的准备东西,就开始第一次的驴友生涯。刚开始,差不多都是三个人一起参加,去了武义龙……轰鸣我的右耳昨晚十点开始轰鸣,搞的我睡不安,头痛欲裂,迷迷糊糊到后半夜才睡着。想起查房时刚上的一课突发性耳聋趋势已经年轻化,要尽早治疗。今早上班后不敢有丝毫懈怠,咨询五官科的长,建……数码知识opporeno5闪达窗口怎么设置opporeno5如今使用IT数码设备的小伙伴们是越来越多了,那么IT数码设备当中是有很多小技巧的,这些技巧很多小伙伴一般都是不知道如何来实用的,就好比最近就有很多小伙伴们想要知道opporen……别等不该等的人,别伤不该伤的心。爱的时候,让他自由;不爱的时候,让爱自由。既在乎曾经拥有,也在乎天长地久宁愿高傲单身,也不委屈自己。别等不该等的人,别伤不该伤的心。有时,爱也是种伤害。……继续随想考试结束了,可以轻松一下了,随想继续。。。。。。回想一下,在考试前的那段日子我还真觉得是无比的繁忙,果然是大难临头方知自己要面临的挑战是多么大。所有的课程对我来说都象是新……
友情链接:易事利快生活快传网聚热点七猫云快好知快百科中准网快好找文好找中准网快软网