范文健康探索娱乐情感热点
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

无需成千上万张目标图片训练GAN没见过猪,却能把狗变成猪

  不用成千上万张目标图片训练,就能让 GAN 生成你想要的图片,有可能吗?
  还真有可能!
  来自特拉维夫大学和英伟达的研究人员成功地盲训出领域自适应的图像生成模型 ——StyleGAN-NADA。
  也就是只需用简单地一个或几个字描述,一张目标领域的图像也不需要,StyleGAN-NADA 就能在几分钟内训练出你想要的图片:
  比如现在在几张狗狗的基础图片上输入"Sketch",不到 1 分钟,一张张草图风格狗的图片就出来了。(视频没有声音可放心"食用")
  再比如在人像上给出文字"Pixar",就能生成皮克斯风格的图片:
  各种人像风格都可以:
  甚至把狗变成猪也行:
  问题来了,AI 不可能生成它完全没有见过的照片,但是又不给它参考照片,那怎么满足要求呢?基于 CLIP
  答案就是借助 CLIP 的语义能力。
  CLIP 是 OpenAI 提出的根据文字生成图片的 DALL 模型的图像分类模块,可以根据文字描述给图片的匹配程度打分。
  今年年初,就有人用 CLIP 做出了一个用"大白话"检索图片的功能,效果还挺惊艳的。
  ▲输入"The word love written on the wall"的搜索结果
  总的来说,StyleGAN-NADA 的训练机制包含两个紧密相连的生成器 Gfrozen 和 Gtrain,它俩都使用了 StyleGAN2 的体系结构,并共享同一个映射网络,因此也具有同一个隐空间(latent space)和隐码(latent code),所以它们在最开始生成的图像是一样的。
  首先使用在单个源域(例如人脸、狗、教堂或汽车数据集)上预训练的模型权重初始化这两个生成器。
  由于最终目标是生成一个风格不一样的图像,那就要更改其中一个成对生成器的域,同时保持另一个作为参考域。
  具体的话就是 Gfrozen 的权重保持不变,而 Gtrain 的权重通过优化和迭代层冻结(iterative layer-freezing)方案进行修改。
  而 Gtrain 的域在通过用户提供的文本方向进行更改(shift)的同时,会保持共享隐空间(latent space)。
  具体怎么"更改"呢?
  这就用到了一组基于 CLIP 的损失(loss)和"分层冻结"(layer-freezing)方案。
  该方案可以自适应地确定在每次迭代训练中最相关的子层、并"冻结"其余层来提高训练稳定性保证效果。下面就详细介绍一下这两个方法。
  基于 CLIP 的损失(loss)
  StyleGAN-NADA 依靠预先训练的 CLIP 作目标域的唯一监督来源。为了有效地从 CLIP 中提取"知识",一共用了三种损失算法:
  (1)负责确定在每次迭代中训练哪个子集层的全局目标损失(Global CLIP loss);
  (2)旨在保持多样性的局部定向损失(Directional CLIP loss);
  (3)以及防止图像生成不必要的语义伪影的嵌入范数损失(Embedding-norm Loss)。
  ▲局部定向损失要求源/目标图像/文字的 CLIP-space 方向一致
  "分层冻结"(layer-freezing)
  此机制分为两阶段:
  (1)选层阶段,保持所有网络权重不变并对一组隐码进行优化,然后选择变化最显著的一层(优化使用目标域文本描述驱动的全局 CLIP 损失进行);
  (2)优化阶段,"解冻"选定层的权重,然后使用定向 CLIP 损失进行优化和更改。
  大多数训练只需几分钟就可完成
  首先,该模型可以实现范围广泛的域外自适应,从纹理变化到大的形状修改,从现实到魔幻风格…… 甚至包括一些收集高质量数据成本很高的目标域。
  其次,所有的这些图片的生成都只需给一个简单的文字描述,除了极端情况,大多数训练只需几分钟就能完成。
  对于基于纹理的修改目标,该模型通常需要 300 次迭代,batch size 为 2,在一个 NVIDIA V100 GPU 上训练大约 3 分钟。在某些情况下(比如从"照片"到"草图"),训练只需不到一分钟的时间。
  然后,所有的实验用的就是这个完整当然模型,没有添加任何 latent mapper。研究人员发现,对于纯粹是基于样式的图像生成,模型需要跨所有层进行训练,比如下面这种:
  而对于较小的形状修改,则只需训练大约 2/3 数量的层数就能折中保持训练时间和效果:
  最后,将该模型与 StyleCLIP(结合了 StyleGAN 和 CLIP 的域内图像编辑模型)、以及只用了 Gfrozen 生成器的模型对比发现,只有 StyleGAN-NADA 可以实现目标。
  再将零样本的 StyleGAN-NADA 与一些少样本的图像生成模型对比发现,别的都要么过拟合要么崩溃(MineGAN 更是只记住了训练集图像),只有 StyleGAN-NADA 在保持多样性的情况下成功生成(但它也有伪影出现)。
  下面是消融实验:
  ▲ 通过训练 latent mapper 可以进一步提高生成质量
  ps.在论文的最后,研究人员表示:
  由于这项技术,也许在不久的将来,这类图像生成的工作将不再受到训练数据的约束,而只取决于我们的创造力。
  论文地址:
  https://arxiv.org/abs/2108.00946
  GitHub 地址:
  https://github.com/rinongal/StyleGAN-nada
  参考链接:
  https://stylegan-nada.github.io/

捷德收购全球物联网专家Pod集团,扩大连接产品组合感谢IT之家网友刺客的线索投递!IT之家7月12日消息全球安全技术集团捷德(GieseckeDevrient)近日收购了全球物联网网络专家Pod集团(EnterpriseNetwo工信部蜂窝物联网终端用户数量达到12。58亿IT之家6月24日消息近日,工信部发布了2021年15月通信业经济运行情况,报告称,今年前五月我国蜂窝物联网用户规模持续扩大,截至5月末,三家基础电信企业发展蜂窝物联网终端用户12取代劳力士,苹果AppleWatch成美国高收入青少年最受欢迎的手表品牌IT之家10月6日消息据MacRumors报道,PiperSandler的一项新调查显示,苹果成为美国高收入青少年中最受欢迎的手表品牌。青少年智能手表的拥有率从2020年秋季的30华为最大运动健康科学实验室在东莞松山湖揭牌与体育总局联合建设IT之家10月22日消息,华为开发者大会2021今日举办。官方宣布,继华为西安运动健康科学实验室之后,华为在东莞松山湖园区建设的运动健康科学实验室正式揭牌。这是华为在全球最大最新升揭秘小米智能眼镜或许只是过渡作用的信息提示器据说今年苹果秋季发布会上最令人失望的不是iPhone13系列升级程度太小,而是没有OneMoreThing。还有不少人期待,在最后这个传统环节上,库克会不会拿出个超级新品,让人们惊小米推出智能眼镜探索版概念新品接近传统外观,支持通话导航拍照等功能IT之家9月14日消息今天小米推出了一款概念新品小米智能眼镜探索版,其外观与普通眼镜几无区别,却有着神奇的体验。小米称,戴上它,画面跃然眼前。据介绍,小米智能眼镜探索版采用Micr30天免费用1199元小米米家扫拖机器人3C上架京东小米昨日推出米家扫拖机器人3C,支持LDS激光导航,拥有4000Pa吸力,预售价1299元,首发到手价1199元。京东现已开启预售,下单赠小米体重秤2(价值59元)30天免费试用1首发价1199元,小米米家扫拖机器人3C正式发布4000Pa吸力激光导航系统感谢IT之家网友不再投gao的线索投递!IT之家3月18日消息,今日,小米正式宣布推出米家扫拖机器人3C。这款扫地机器人支持LDS激光导航,拥有4000Pa吸力,预售价1299元,日本新干线E7系列自动驾驶试验顺利实施GoA4最高级别,110kmhIT之家11月18日消息,根据日本朝日新闻报道,11月17日,日本JR东公司成功进行了在新潟(x)市内实施的新干线自动驾驶试验。这一实验使用的是E7系列车型,试验在白天和夜间进行。华为路由AX2Pro曝光,支持WiFi6PlusIT之家5月6日消息华为去年4月份发布了AX3Pro路由器,该路由器搭载了凌霄四核1。4GHzCPU,支持160MHz大频宽,相较于传统WiFi6路由器其近距离速度提升近1倍,售价AI药物研发新模式,华为云发布盘古药物分子大模型IT之家9月24日消息昨日,华为全联接2021开幕。华为高级副总裁华为云CEO消费者云服务总裁张平安发布了华为云盘古药物分子大模型。今年4月,华为云发布了盘古系列预训练大模型,包括
IT之家评测华为WATCHFIT评测如影随形的健康私教12月23日,华为在nova8新品发布会上正式发布了全新华为WATCHFIT,这是华为首款方形形态的轻智能运动手表,主要面向年轻人女性和活力轻健身爱好者,主打轻巧机身和腕上运动私教2020年Q1全球智能穿戴设备出货7260万部,华为华米手表涨幅最快IT之家5月30日消息近日,IDC发布2020年第一季度全球智能穿戴设备市场销售数据,全球智能穿戴设备出货量7260万部,同比增长29。7。根据IDC的数据,2020年第一季度智能运动新选择酷玩潮搭华为WatchGT2e亮相nova7发布会随着5G时代越来越近,IoT产业的市场潜力正在逐渐显山露水。而作为消费级IoT的一个重要终端类型,智能手表也正受到更多人的重视。近期国内科技厂商纷纷将智能手表作为自身的重要产品线之华为公开新款智能手表外观设计专利与华为手环B6十分类似IT之家2月5日消息企查查App显示,近日,华为技术有限公司公开一种手表外观设计专利,公开号为CN306301963S。专利摘要显示,本外观设计产品的用途主要用于计时计步体征数据测荣耀手表GS3真机亮相不支持无线充电感谢IT之家网友络世的线索投递!IT之家1月3日消息,荣耀手表GS3于2021年8月12日正式发布,但当时没有公布售价和上市时间。12月24日,这款手表已经在荣耀社区开启众测。据博CanalysQ3全球可穿戴腕带设备市场苹果重回第一,小米华为分列二三位IT之家11月26日消息,今日,Canalys发布报告称,2021年第三季度,全球可穿戴腕带设备出货量达到4782万台,同比下降11。其中,苹果以733万台的销量重回第一,市场份额华为WATCHGT3RunnerVR套装等新品将于26日零点开售IT之家11月25日消息,华为于11月17日举办了全场景智慧生活新品发布会,正式推出了WATCHGT3系列智能手表,以及专门针对跑步用户开发的WATCHGTRunner。这几款产品教科书式的双赢三星GalaxyWatch4系列改用WearOS,两者市占率大幅提升11月23日消息,三星GalaxyWatch4系列转向WearOS阵营之后,市场占比从上一年同期的10增长到14,而WearOS的季度市场份额更是从4一跃提升到17。CounterIT之家开箱石头扫拖机器人T8Plus智能集尘版图赏IT之家5月6日消息,近期,石头扫拖机器人T8系列的升级版T8Plus发布。IT家带来了这款扫拖机器人的开箱图赏。石头扫拖机器人T8Plus重量为4。6kg,体积为353mmx35教AI逐帧搓招玩铁拳通关最高难度,现在的街机游戏爱好者有点东西现在的AI都开始学着逐帧搓招打街机了?拳皇98街头霸王死或生一干童年回忆全都玩了个遍,其中还有号称要打5000场才能入门的3D格斗游戏铁拳没错,就是那个对新手极不友好的铁拳,随便拉亚马逊Echo智能音箱将支持超声波探测,能识别房间是否有人IT之家11月15日消息,根据外媒TheVerge消息,亚马逊Echo四代以及EchoDot智能音箱,现已超声波探测技术,用于检测周围环境的物体,来决定是否开启家中的电灯等其它家用