范文健康探索娱乐情感热点
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

OpenAI学会你说我画参数缩水23性能却更强,还get局部编辑新技能

  OpenAI 刚刚推出了一个新的文本生成图像模型,名叫 GLIDE 。
  相比今年年初诞生的大哥 DALL・E,它只有 35 亿参数(DALL・E 有 120 亿) 。
  规模虽然小了,质量却不赖。
  大家仔细看这效果,"使用计算器的刺猬"、"星空下的狐狸"、"彩色玻璃窗风格的熊猫吃竹子"、"太空升降舱蜡笔画":
  是不是很像样儿?
  一位码农兼艺术家的网友则形容它"和真的难以区分"。
  GLIDE 在人类评估员的打分中,确实 PK 掉了使用 CLIP 给图片排序的 DALL・E。
  最有趣的是,这个 GLIDE 似乎具有"智力"—— 会否决你画出八条腿的猫的主意,也不认为老鼠可以捕食狮子。
  OpenAI 岁末新作 GLIDE
  GLIDE 全称 GuidedLanguage toImageDiffusion forGeneration andEditing,是一种扩散模型(diffusion model) 。
  扩散模型最早于 2015 提出,它定义了一个马尔可夫链,用于在扩散步骤中缓慢地向数据添加随机噪声,然后通过学习逆转扩散过程从噪声中构建所需的数据样本。
  相比 GAN、VAE 和基于流的生成模型,扩散模型在性能上有不错的权衡,最近已被证明在图像生成方面有很大的潜力,尤其是与引导结合来兼得保真度和多样性。
  ▲扩散模型与其他三种生成模型的对比
  研究人员训练了一个 64×64 分辨率的文本条件扩散模型,参数 35 亿;以及一个 256×256 分辨率的文本条件上采样扩散模型,参数 15 亿。
  模型有两种引导形式来获得更好的生成效果:无分类器引导(classifier-free guidance)和 CLIP 引导 。
  对于 CLIP 引导,他们还训练了一个噪声感知的 64×64 ViT-L CLIP 模型 (vit)。
  模型采用了 SOTA 论文《Improved Denoising Diffusion Probabilistic Models》(改进的去噪扩散概率模型)的架构,使用文本条件信息对其进行增强。
  对于每个带噪图像 xt 和相应的提示文本 caption,该模型预测出 p (xt-1|xt,caption)。
  为了对文本进行条件处理,模型还将文本编码为 K 个 token 的序列,并将这些 token 馈送到 Transformer 中,此 Transformer 的输出有两个用处:
  1、在 ADM 模型中使用最终 token embedding 来代替 class embedding;
  2、token embedding 的最后一层在整个 ADM 模型中分别映射每个注意层的维度,然后连接到每个层的注意上下文。
  研究人员在与 DALL・E 相同的数据集上训练 GLIDE ,batch size 为 2048,共经过 250 万次迭代;对于上采样模型,则进行了 batch size 为 512 的 160 万次迭代。
  这些模型训练稳定,总训练计算量大致等于 DALL・E。
  在初始训练完成之后,研究人员还微调了基础模型以支持无条件图像生成。
  训练过程与预训练完全一样,只是将 20% 的文本 token 序列替换为空序列。这样模型就能既保留文本条件生成的能力,也可以无条件生成。
  为了让 GLIDE 在图像编辑 任务中产生不必要的伪影,研究人员在微调时将 GLIDE 训练样本的随机区域擦除,其余部分与掩码通道一起作为附加条件信息输入模型。
  相比 DALL・E,GLIDE 的效果更逼真
  定性实验
  研究人员首先比较了 GLIDE 两种不同的引导策略:CLIP 引导和无分类器引导。
  分别用 XMC-GAN、DALL・E(使用 CLIP 重排 256 个样本,从中选择最佳结果)和 CLIDE 模型(CLIP 引导 / 无分类器引导)在相同的文本条件下生成了一些结果。
  CLIDE 模型的结果未经挑选。
  可以发现,无分类器引导的样本通常比 CLIP 引导的看起来更逼真,当然,两者都胜过了 DALL・E。
  对于复杂的场景,CLIDE 可以使用修复功能进行迭代生成:比如下图就是先生成一个普通客厅,再加画、加茶几、加花瓶……
  此外,CLIDE 还可以在 SDedit 模型上利用草图与文本相结合的方式,对图像进行更多受控修改。
  定量实验
  研究人员首先通过衡量质量和保真度的帕累托边界(Pareto frontier)来评估无分类引导和 CLIP 引导之间的差异。
  在前两组曲线中,可以发现无分类器引导几乎都是最优的 —— 不管是在准确率 / 召回率上,还是在 IS / FID 距离上。
  而在绘制 CLIP 分数与 FID 的关系时,出现了完全相反的趋势。
  研究人员假设这是 CLIP 引导正在为评估 CLIP 模型寻找对抗性示例,而并非真正优于无分类器引导。为了验证这一假设,他们聘请了人工评估员来判断生成图像的质量。
  在这个过程中,人类评估者会看到两个 256×256 的图像,选择哪个样本更好地匹配给定文本或看起来更逼真。如果实在分辨不出,每个模型各得一半分数。
  结果如下:
  无分类器引导产生了更符合相应提示的高质量样本 。
  同时,研究人员也将 CLIDE 与其他生成模型的质量进行了评估:CLIDE 获得了最有竞争力的 FID 分数。
  再将 GLIDE 与 DALL-E 进行人工评估。
  包含三种比法:两种模型都不使用 CLIP 重排序;仅对 DALL・E 使用 CLIP 重排序;对 DALL-E 使用 CLIP 重排序,并通过 DALL-E 使用的离散 VAE 映射 GLIDE 样本。
  结果是不管哪种配置,人类评估员都更倾向于 GLIDE 的结果(每项第一行代表 GLIDE)。
  当然,说这么多,GLIDE 也有它的不足,就如开头的例子,它没法画出不合常理的"八条腿的猫",也就是有智力但缺乏想象力 。
  此外,未优化的 GLIDE 需要 15 秒才能在单张 A100 GPU 上生成一张图像,这比 GAN 慢多了。
  最后,po 一张我们在官方发布的 Colab 链接上亲手试的一张效果,还凑合(an illustration of a rabbit,demo 上的模型比较小):
  论文地址:
  https://arxiv.org/abs/2112.10741
  GitHub 地址 (是一个在过滤后的数据集上训练的小模型):
  https://github.com/openai/glide-text2im
  Colab 试玩:
  https://colab.research.google.com/github/openai/glide-text2im/blob/main/notebooks/text2im.ipynb#scrollTo=iuqVCDzbP1F0

炽热的快速小行星在113天内便可环绕太阳运行一周天文学家发现了太阳系中运行速度最快的小行星。这颗小行星在113天内围绕太阳运行,使其成为已知轨道周期最短的小行星,也是太阳系中任何天体中第二短的轨道周期。目前太阳系中唯一比这颗名为为探测地球上极端物质的热态而建新型X射线晶体光谱仪劳伦斯利弗莫尔国家实验室(LLNL)的科学家们与普林斯顿等离子体物理实验室(PPPL)合作,设计了一种新型X射线晶体光谱仪,对国家点火设施(NIF)实验产生的高能量密度(HED)物研究发现类似于Borisov的星际彗星可能没有那么罕见天文学中最有趣的发现之一发生在2019年,在我们的太阳系中发现了一颗星际彗星。这颗彗星被称为鲍里索夫(Borisov),天文学家认为像它这样的星际彗星可能并不罕见。这是因为最近科学研究气候条件对南极磷虾的繁殖成功有着显著影响据外媒报道,来自俄勒冈州立大学的一项新研究发现,气候条件对成年雌性南极磷虾的繁殖成功起着重要作用,也是每5到7年数量波动的一个因素。环境因素包括影响食物供应的大规模气候模式影响着雌二叠纪末大灭绝事件与海洋氧气含量剧增几乎同时发生据外媒报道,在发生在2。5亿年前二叠纪末期的大灭绝事件中,地球上96以上的海洋物种和70的陆地生物突然灭绝。这是地球历史上最严重的一次灭绝事件。现在,佛罗里达州立大学的研究人员发现双曲线一号民营火箭失败细节披露方案正确积累了宝贵经验中国的民营火箭事业近年来也取得了突破,但也遭遇了不少挫折。昨天北京星际荣耀的双曲线一号商业运载火箭发射失利,火箭飞行异常,卫星分离后未正常入轨,飞行试验未达到预期目的。这已经是星际外媒马斯克发推晒SpaceX超重型火箭助推器据国外媒体报道,当地时间周二,SpaceX推出了超重型火箭助推器4号(简称HB4),已到达发射场。SpaceX首席执行官埃隆middot马斯克(ElonMusk)亲自发推分享。Sp科学家使用大型强子对撞机发现长寿命奇特粒子最近,欧洲核子研究中心(CERN)的大型强子对撞机之美(LHCb)实验团队在欧洲物理学会高能物理会议(EPSHEP)上提出了一个新发现。LHCb发现的新粒子被标记为Tcc,是一个四国际空间站宇航员在太空奥运会上展示零重力动作据外媒TheVerge报道,东京奥运会已经正式结束,闭幕式已于周日晚上举行。而国际空间站的宇航员们近日则在ldquo太空奥运会rdquo上展示了独特的零重力动作。来自欧空局的法国宇科学家研发出全新非接触式纳米显微镜概念来自德国美国和英国的一组物理学家近日设法在纳米级空间分辨率下,观察电子从一个原子薄层到相邻层的运动情况。这种全新的非接触式纳米显微镜概念在研究导电非导电和超导材料方面具有巨大潜力,科学家对恒星形成元素的缓慢中子俘获过程深入研究缓慢的中子俘获(s过程),是发生在恒星中的核合成过程之一。在其作用下,宇宙中大约一半的元素,都比铁(Fe)要重。科学家们指出,s过程中设计的两个重要反应,就是氖22(alpha,g
西班牙新望远镜将调查月球神秘闪光IT之家6月4日消息几个世纪以来,人类注意到月球表面神秘的闪光但无法作出合理的解释,从流星到月震各种说法层出不穷。为了解开这些谜团,西班牙的一架新的望远镜将揭开这个困扰人类几个世纪中国空间站工程全力备战力争2022年前后建成IT之家11月7日消息据央视新闻报道,目前中国载人航天工程全线正在全力备战空间站建造任务,力争2022年前后完成在轨建造计划,为后续实现空间站长期稳定在轨运营进行准备。5月5日18登月火箭重要测试失败后NASA面临两难抉择重新测试或直接发射1月20日下午消息,据报道,1月16日,美国航空航天局(NASA)进行了一次关键性的火箭点火测试,但这场测试在短短一分钟后,以失败告终。本周二,NASA的官员表示,该大型登月火箭的SpaceX购买两个石油钻井平台,为星际飞船火箭建造浮动发射台北京时间1月20日下午消息,据报道,埃隆马斯克(ElonMusk)的SpaceX公司在去年买下了两座深水石油钻井平台,并将其改造成了浮动发射台,从而为其正在开发的体积巨大的星际飞船2021开门红,中国成功发射天通一号03星IT之家1月20日消息央视新闻报道,1月20日00时25分,我国在西昌卫星发射中心用长征三号乙运载火箭,成功将天通一号03星发射升空。卫星顺利进入预定轨道,任务圆满成功。这是我国长中国空间站在轨建造任务即将拉开序幕IT之家1月20日消息据央视新闻,中国空间站在轨建造任务即将拉开序幕。空间站核心舱初样产品天和和新一代载人飞船试验船已运抵文昌航天发射场。核心舱命名为天和,是中国空间站的管理和控制全球变暖,12。5万年前古南极冰盖崩塌事件可能将再次发生十多万年前,南极的一块巨大冰盖融化,导致世界范围内海平面上升了大约9米。海水淹没了大片曾经干旱的陆地。一项新研究认为,随着人为导致的全球变暖问题日益严重,同样的事件可能再次发生。如应对气候变化,普通人可以采取的10种行动北京时间12月26日消息,据国外媒体报道,在今年9月发布的一份新报告中,全球顶尖的气候学家们发出了目前为止最严酷的警告按目前的行动计划,我们无法实现把气温增幅控制在1。5之内的目标气候变化会影响乌龟性别?全球变暖让海龟雌性化新的研究表明,由于气候变化导致绿海龟的雌性化,到2100年,高达93的新生绿海龟可能是雌性。乌龟的性别取决于温度,作为七种海龟中的一种,绿海龟有52的概率孵化成雌性。但Exeter城市热岛效应日益加剧,蜗牛都被热黄了?漫步在欧洲沿海的沙丘林地或城市,很容易就能发现蜗牛的踪影。它们有各种各样的颜色,珊瑚粉柠檬黄以及桃花心木等颜色。有时,它们的外壳会有多达5条黑带缠绕。在20世纪早期和中期,男生们收地磁北极正向俄罗斯大范围漂移速度之快原因未知北京时间1月21日消息,据国外媒体报道,科学家发现,地磁北极正在以不可预知的方式从加拿大北极地区向俄罗斯西伯利亚移动,它的漂移速度如此之快,以至于2015年才更新的全球磁场示意图已