专栏电商日志财经减肥爱情
投稿投诉
爱情常识
搭配分娩
减肥两性
孕期塑形
财经教案
论文美文
日志体育
养生学堂
电商科学
头戴业界
专栏星座
用品音乐

StableDiffusion重磅更新!2。0版涩图功能被砍

  编辑:编辑部【新智元导读】大火的文本到图像模型StableDiffusion2。0版本来了,然而因为这个原因,广大网友们闹起来了。
  昨天,StabilityAI宣布,StableDiffusion2。0版本上线!
  这个更新速度,可太神了。
  1。0版本在今年8月出炉,三个月不到,还热乎着呢,新版本就来了。
  StableDiffusion2。0
  昨日,StabilityAI在博客上发布了深度学习文本到图像模型的最新版本StableDiffusion2。0。
  相较于1。0,新的算法比之前的更高效、更稳健。
  时间回到几个月前,StableDiffusion的发布,掀起了一场文本到图像模型领域的新革命。
  可以说,StableDiffusion1。0彻底改变了开源AI模型的性质,并且在全球范围内催生了数百种新模型,和其他方面的进步。
  它是最快达到10KGithubstar星数的项目之一,在不到两个月的时间里飙升至33K星,在Github上的一众项目中可以封神了。
  开发StableDiffusion1。0版本的团队是RobinRombach(StabilityAI)和PatrickEsser(RunwayML),他们来自LMUMunichCompVisGroup。
  在实验室之前的LatentDiffusionModels基础上,他们开发出了StableDiffuision1。0,并且得到了LAION和EleutherAI的大力支持。
  这次的StableDiffusion2。0版本,具有强大的文本到图像模型。
  这个模型是由LAION在全新的文本编码器OpenCLIP训练的,跟1。0版本相比,它显著提高了生成图像的质量这次的模型可以输出默认分辨率为512512像素和768768像素的图像。
  使用StableDiffusion2。0生成的图像示例,分辨率为768x768
  模型在StabilityAI的DeepFloyd团队创建的LAION5B数据集上进行训练。
  LAION5B是一个包含58。5亿个CLIP过滤图像文本对的数据集,比LAION400M大14倍,曾是世界上最大的可公开访问的图像文本数据集。
  训练完成后,就使用LAION的NSFW过滤器进一步过滤,删掉成人内容。
  这对于很多网友来说,堪称是史诗级削弱了
  LAION5B的采集管道流程图2。0比1。0强在哪里?
  具体来看,2。0比1。0有了哪些升级呢?
  图像生成质量明显提升
  上文我们已经看到,2。0版本中的文本转图像模型默认可以生成512x512和768x768像素分辨率的图像。
  超分辨率Upscaler扩散模型
  StableDiffusion2。0包含了一个UpscalerDiffusion模型,这个模型可以将图像分辨率提高四倍。
  左图:128x128低分辨率图像。右图:Upscaler生成的512x512分辨率图像
  可以看出,这个模型将低质量生成图像(128128)放大为更高分辨率图像(512512)。
  有了UpscalerDiffusion的加持,StableDiffusion2。0与以前的文本到图像模型结合使用时,可以生成分辨率为20482048或更高的图像。
  depth2img深度图像扩散模型
  团队采用了一种新的深度引导(depthguided)稳定扩散模型depth2img。
  它扩展了1。0之前的图像到图像功能,为创意应用提供了全新的可能性。
  通过使用现有模型,Depth2img能够推断输入图像的深度,然后使用文本和深度信息生成新图像。
  左边的输入图像可以产生几个新图像(右边)。这种新模型可用于保持结构的图像到图像和形状条件图像合成(structurepreservingimagetoimageandshapeconditionalimagesynthesis)
  DepthtoImage
  DepthtoImage可以提供各种新的创意应用程序,转换后的图像看起来与原始图像截然不同,但仍保持了图像的连贯性和深度。
  更新文本引导修复扩散模型
  此外,这次更新还引入了一个新的文本引导(textguided)修复模型,在新的StableDiffusion2。0文本到图像的基础上进行了调整,这样,用户就可以非常智能、快速地替换图像的部分内容。
  更新后的修复模型在StableDiffusion2。0文本到图像模型上进行了微调
  过滤掉一些NSFW(不可描述)的内容
  经过LAION的NSFW过滤器,成人内容都会被砍掉。
  总结一下,StableDiffusion2的更新如下新的SD模型提供了768768的分辨率。UNet的参数数量与1。5版相同,但它是从头开始训练的,并使用OpenCLIPViTH作为其文本编码器。一个所谓的v预测模型是SD2。0v。上述模型是由SD2。0base调整而来,它也是可用的,并作为典型的噪声预测模型在512512图像上进行训练。增加了一个具有x4比例的潜在文本引导的扩散模型。完善的SD2。0基础的深度引导的稳定扩散模型。该模型可用于结构保留的img2img和形状条件合成,并以MiDaS推导的单眼深度估计为条件。在SD2。0的基础上建立了一个改进的文字引导的绘画模型。
  在博客最后,StabilityAI团队激动地说
  就像StableDiffusion的第一次迭代一样,我们努力优化模型,让它在单个GPU上运行,因为我们希望从一开始就让尽可能多的人可以使用它。
  我们已经看到,当数百万网友接触到这些模型时,他们共同创造了一些令人惊叹的作品。
  这就是开源的力量:挖掘数百万有才华的人的巨大潜力。他们可能没有资源来训练最先进的模型,但他们有能力用一个模型创造令人难以置信的成果。
  这个新版本及其强大的新功能,将成为无数应用程序的基础,并激发人们全新的创造潜力。第一家AI绘画独角兽
  作为机器学习模型的一种,文本图像模型能够将自然语言描述作为输入并生成与该描述匹配的图像。
  它们通常结合了语言模型和生成图像模型:语言模型将输入文本转换为潜在表示,生成图像模型则将该表示作为条件生成图像。
  最有效的文本图像模型,通常是根据从网络上抓取的大量图像和文本数据进行训练的。
  依托深度神经网络技术的飞速进步,文本图像模型从2015年开始获得广泛重视。
  OpenAI的DALLE、GoogleBrain的Imagen等,都能输出质量与真实照片相接近的绘画作品。
  StabilityAI创建的绘画平台StableDiffusion,则成为领域杀出的一匹黑马。
  StableDiffusion的母公司StabilityAI,成立于2020年,总部位于伦敦。
  公司背后的出资人是数学家、计算机科学家EmadMostaque,来自孟加拉国,今年39岁。
  Mostaque毕业于牛津大学数学和计算机科学学院,曾在一家对冲基金公司工作过13年。
  凭借StabilityAI和他的私人财富,Mostaque希望能够培育一个开源AI研究社区。他的创业公司之前就支持创建LAION5B数据集。
  为了训练StableDiffusion的模型,StabilityAI为服务器提供了4,000个NvidiaA100GPU。
  与OpenAI旗下多款AI工具平台不同,开发者可以免费下载StabilityAI的底层代码,来训练自己的模型。
  StabilityAI官网顶部的SloganAIbythepeople,forthepeople,正是这种价值观的最好诠释。
  人类面临的一些重大挑战有望通过AI解决,EmadMostaque表示,但只有当这项技术面向所有人时,我们才可能达成这一目标。
  除了我们的75名员工之外,没有任何其他人拥有决策权无论是亿万富翁、大型基金,还是政府,我们是完全独立的。Mostaque说,我们计划使用我们的计算来加速基础人工智能的开源。
  StableDiffusion是StabilityAI独立研发的文本到图像模型,于2022年8月发布,一经推出便迅速被一众网友玩疯了。
  比如被变成黑寡妇的马院士
  作为目前可用性最高的开源模型,StableDiffusion在短短2个月的时间里已经被全球超过20万名开发者下载和使用。
  StabilityAI面向消费者的产品名为DreamStudio,目前已经拥有超过100万名注册用户他们共同创建了超过1。7亿张图像。
  今年10月,StableDiffusion母公司StabilityAI获得了由全球风险投资公司LightspeedVenturePartners和CoatueManagement领投的1。01亿美元融资,估值突破了10亿美元,也是AI绘画领域的第一家独角兽。
  11月24日,刚刚完成融资的StabilityAI便发布了2。0版本,这也让我们对StableDiffusion的未来产生了更多期待。网友:体验下降,差评!
  不过在国外社交媒体上,不少网友却对StableDiffusion的本次更新给出了差评,理由自然是模型生成NSFW内容和图片的能力被削弱了。
  是的,这次模型的关键组件功能被改进,使得StableDiffusion更难生成某些引起争议和批评的图像了,比如广受欢迎的裸体和色情内容、名人的逼真照片以及模仿特定艺术家作品的图像。
  他们削弱了模型,一位用户在StableDiffusion的reddit上评论道,还获得了208次点赞,完全能代表广大网友的心声。
  另一位用户则表示:他们切除并阉割了模特。没有艺术,没有人体的自然美,没有画家和摄影师最好的作品中描绘的生死戏剧,这比丑陋本身还要糟糕。
  NSFW的全称是NotSuitableForWork,简单讲就是一些不适合上班时间浏览的东东。
  与OpenAI的DALLE等竞争对手不同,StableDiffusion是一款完全开源的软件。这允许社区的小伙伴一同开发、改进这款产品,并让开发人员免费将其集成到他们的产品中。
  StableDiffusion背后的男人EmadMostaque曾将它比作披萨基地,任何人都可以添加他们选择的成分(训练数据)。
  StabilityAI首席执行官EmadMostaque
  一个好的模型应该可以供所有人使用,如果你想添加东西,那就加。他在Discord上表示。
  这意味着StableDiffusion在使用方式上的限制比较少,但也因此,它招致了大量批评。
  StableDiffusion和其他图像生成模型在未经艺术家同意的情况下,在他们的作品上进行训练,并重现他们作品的风格,许多艺术家大为光火。
  StableDiffusion生成特定艺术家风格图像的能力十分强大
  这种AI式复制是否合法?目前,这在法律上还是一个悬而未决的问题。
  专家表示,在受版权保护的数据上训练人工智能模型可能是合法的,但某些用例可能会在法庭上受到质疑。
  可以猜测,StabilityAI对模型所做的更改是为了减轻这些潜在的法律挑战。
  这次2。0版本的更新,对软件编码和检索数据的方式进行更改,因此,模型复制艺术家作品的能力大大降低。
  正统艺术家满意了,创造力爆棚的成人艺术家们却很愤怒。
  此前,StableDiffusion就因涩图生成神器之名蜚声海内外。
  老司机们用它生成一些极具真实感和动漫风格的NSFW内容,甚至包括一些特定个人的NSFW图像(也称非自愿色情)和虐待儿童的图像。
  前两天,一款专门生成高质量色情内容而量身定制的AI系统UnstableDiffusion应运而生。
  此后,大量Reddit和4chan的网民火速用UnstableDiffusion生成了逼真的裸体图像,被老司机们玩出了花。
  在软件官方Discord中谈到2。0版本的变化时,Mostaque也承认这正是StableDiffusion从训练数据中删除裸体和色情图片的初心。
  在开放模式中不能有儿童和NSFW,Mostaque说,因为这两种图像可以结合起来制作儿童性虐待素材。
  在儿童和NSFW中,我们只能选择一个。
  不过在StableDiffusion的reddit上,一位用户认为违背了开源社区的精神哲学,因为删除NSFW内容设立了审查制度。
  选择是否制作NSFW内容的权力,应该掌握在用户手中,而不是由审查模式来评判。
  但已经有聪明的网友很快就想通了,安慰了他
  StableDiffusion是开源的,这意味着这类训练数据可以很容易地添回第三方版本,而且新软件不会影响早期版本。
  参考资料:
  https:stability。aiblogstablediffusionv2release
  https:twitter。comStabilityAIstatus1595590319566819328?refsrctwsrc5Etfw
  https:www。reddit。comrStableDiffusioncommentsz3ferxcommentixlmkkj?utmsourceshareutmmediumweb2xcontext3
  https:theverge。vip2022112423476622aiimagegeneratorstablediffusionversion2nsfwartistsdatachanges

不去芬兰,在瑞典也能遇见圣诞老人HereisSwedenLOCALSWEDEN在北欧,圣诞老人的家的确切位置是绝密的。但好消息是,他已经在斯堪的纳维亚半岛和北欧国家的多个地点购置了房产。除了圣诞老人,当地的这些景假如恢复正常,真的会出现报复性旅游吗?早在今年7月就有了答案恢复正常也没人会旅游。就拿我来说我吧,我会把钱攥得死死的,再也不乱花钱了。旅游不去,看电影不去,衣服不会买,车子也不买,楼也不买。总之想让我花钱,门儿没有。在我写的一个关于要是真的成都平原将建起瀑布酒店?没错,就在2024成都世园会主会场说起即将到来的2024成都世园会,和主展馆一样备受期待的建筑中,瀑布酒店一定占有一席之位。这个2024成都世园会主会场最重磅的酒店,到底会建成什么样?这个酒店为何为命名为瀑布?日前这个新亮相的郊野公园,有点美请大家注意个人防护,不扎堆不聚集,做到防疫三件套,防护五还要。日前,作为上海市第二批郊野公园之一的漕泾郊野公园正式开园啦!开园仪式上还公布了由网友投票选出的水库八景。步步皆风景,处瓦格纳士兵在阿特木斯克的战役8月份,激烈的利西昌斯克战役结束后,我们就来到了小城阿特木斯克,这里离顿涅茨克的州府仅有89公里,但这里却是个交通要塞,是顿涅茨克通往乌腹地的枢纽,这里的人早就撤走了,但这里的战役黑河明珠郊野公园黑河明珠郊野公园石俊峰大黑河是黄河一级支流,北魏时期称之为芒干水,辽金时期称作金河,元时蒙古语又叫伊克图尔根河,意为大激流河。发源于卓资县十八台镇忽力进图村西北,全长225。5公里2021年新疆全域游053从温泉县到小白杨哨所7月1516日温泉县在温泉县逗留,温泉小县城美景美,在县城逛逛,品品小吃,泡泡温泉,惬意的紧。去阿敦乔鲁景区参观了春秋战国石栅古墓遗址,草原石头岩画,还有惟妙惟肖的母亲石,这些游记拜占庭帝国四盛极而衰,自1025年巴西尔二世去世后,拜占庭帝国每况愈下。11世纪中期起,塞尔柱突厥人崛起,随着外族入侵,农民大量破产,动摇了帝国的经济基础。帝国呈现江河日下趋势。1057年,马为何北半球彩虹增多据美国科学日报网站10月31日报道,夏威夷大学马诺分校的研究人员主导的一项新研究表明,气候变化将增加看到彩虹的机会。研究报告作者估计,到2100年,地球陆地上出现彩虹的天数平均而言历尽风雨,才见彩虹人生都有低谷期,你是怎么度过的彩虹可能现在的你处于人生的低谷,可能现在的你觉得诸事不如意,可能现在的你感觉全世界在针对你,可能现在的你面对他人越发不自信,可能现在的你认为这辈子就这彩虹岛手游职业玩法选择大家好!今天我们来聊聊新手游彩虹岛吧,彩虹岛手游复刻了经典,职业选择上依旧是四个最经典的职业,战士法师盾卫与游侠,在游戏中角色可以使用各种炫酷的技能与攻击方式,打击感与BGM也是无
谷歌发布2023年3月安卓安全公告,修复21个高通组件漏洞IT之家3月7日消息,谷歌于今天发布了2023年3月的安卓安全公告,重点修复了CVE202320951和CVE202320954两个关键漏洞。由于大部分设备仍未部署更新,谷歌官方并Debian操作系统上安装PHP8,小白入门教程PHP8稳定版已经发布很长时间了,这个版本有很多高级功能和改进。在本指南中,我们将逐步演示如何在Debian10系统上安装PHP8。系统要求Debian10Installedsys微软宣布开放Mac版Outlook环球网科技综合报道3月7日消息,微软宣布,其适用于Mac的Outlook应用程序现在可以免费使用,无需Microsoft365订阅或许可。据悉,Outlook的特点之一是帮助用户在2023年2月飞腾CPU与101款软件完成兼容适配IT之家3月7日消息,数据显示,2023年2月,飞腾平台共与57家国内厂商的101款产品完成了兼容适配。飞腾表示,101款产品整体包括安全类10款,存储容灾备份1款,大数据3款,数谷爱凌看秀造型翻车,身材壮实样貌越发男相,近照撞脸俄罗斯娜娜我们的朋友谷爱凌生图又翻车了!这几天,很多国内明星都现身巴黎时装周看秀,有网友晒出了谷爱凌路人视角的近照,她站在秀场外拍照,走路雷厉风行,画面曝光后,遭到了不少人的吐槽。当天谷爱凌难怪时髦精都不穿乐福鞋了!今春单鞋火了,舒适洋气很时髦俗话说漂亮的女人看衣服,优雅的女人看鞋子,很多人会觉得穿的好看就足够了,事实上我们不仅要服装选对,也要注重鞋子的选择,一双好的鞋子可以让你的穿搭锦上添花。比如说我们本期要来分享的这倾尽全力嗅花意当前,正值万物复苏生机盎然百花盛开的美好季节,学习春海棠之坚韧虞美人之无私白玉兰之高洁,为创造无愧于党无愧于人民无愧于时代的业绩而青尽全力。细嗅海棠花之不畏严寒,做勇毅前行的奋进青法国前总统夫人感情放纵,多次当小三,还和一对父子恋爱结婚法国前总统萨科奇的婚姻史十分放纵,他第一次婚姻娶了市长的侄女,利用第一任妻子取得事业的成功,又出轨了朋友的妻子,抛弃了结发妻子。后来他的第二任妻子又出轨了,他和第二任妻子离婚,娶了石光荣是怎样变成孙海英的?迈道原创今日奇葩作者二两牛一爷迈道珠批22年前,激情燃烧的岁月在电视台播放。首播并没有太多人关注。但是恰巧被我们所在的媒体发现了它的精彩和多重可视性,于是进行了连续的大篇幅报道,引法国政府考虑出售巴黎奥运主场馆法兰西体育场,巴黎圣日耳曼或寻求收购法国星期天日报(LeJournalduDimanche)3月5日消息,法国体育部长阿梅莉乌代亚卡斯特拉(AmlieOudaCastra)在该报当日刊出的采访中指出,法国政府考虑出售国际足联保送,法国队放水?球王梅西的世界杯冠军真的有争议吗距离2022年12月19日的世界杯决赛,已经过去两个多月了。自从梅西和阿根廷夺得世界杯冠军之后,各种争议不服也不绝于耳。也难怪,毕竟文无第一武无第二,大力神杯只有一个,球场上输了比
友情链接:快好找快生活快百科快传网中准网文好找聚热点快软网