范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

英伟达AI模型可实时用文字P图输入单词或短语,可立刻输出逼真的照片(附在线Demo,可试玩)

  在"一句话生成照片"这件事上,英伟达又一次突破了大伙的想象力。
  他们最新的 AI 模型 GauGAN2 ,不仅能根据字词生成逼真风景照,还能实时用文字 P 图 。
  输入一句"海浪击打岸边石",立刻输出一张逼真照片:
  从单词到短语,这只 AI 全都能 get!
  那感觉,简直是要山得山,要水得水:
  要是觉得哪部分你不喜欢,直接打字就能"P 图":
  上面这些效果,都是英伟达这个叫做"GauGAN2"的模型做出来的,而它的"完整版"功能,还远不止这些。从草图到文字,都能生成风景照
  GauGAN2 的绘制模式,一共分为三种。
  第一种,打字生成图片 。
  我们先试了一下单个词组,"阳光(sunshine)",生成如下图片:
  加上限定词 in the forest 后,AI 立刻就将场景换到了树林里,变成光洒在树林中的场景:
  再多来点限定词也没问题。
  像"冬日树林中的阳光",输入 in winter 后,眼前本来郁郁葱葱的树林立刻"全秃了",换成了雪景下的一幕:
  这效果,u1s1(有一说一)确实不错。
  还能输出不同 style 的风景图,例如输入"大山(mountain)"一词,立刻要山有山,还能给你换不同风格:
  当然,这些不同的风景照也都能继续生成新细节,在 mountain 后加上"beside a river"就能生成山水:
  第二种,"打字 P 图",直接用文字编辑部分图像 。
  只需要把想替换掉的部分圈出来,输入你想要的东西,就能立刻造出各种新颖的风景图:
  嗯…… 英伟达给出的这个 demo,思路也是非常清奇了,"浮在空中的城堡":
  第三种,用涂鸦生成风景照 。
  这是上一代 GauGAN2(2019 年英伟达推出的 GauGAN)的看家本领。
  例如,要是想实现下面这样的"一片天空两个太阳",就完全可以在通过文本生成的图像上,自己手动再加一个。
  这几种玩法叠加在一起,简直让网友们脑洞大开。
  像外媒 ZDNet 就恶搞出来了一种神奇的玩法,在已有的风景上画个人头:
  然后让 GauGAN2 根据已有的画面,再重新生成图画,就会得到如下"人头海岛"的神奇景观:
  不过这可能也对个人画技有所要求,在我们的灵魂画风下,效果看上去就有些…… 不太聪明的亚子。
  那么,生成这一系列风景照的 GauGAN2,背后究竟用了什么原理?
  它与 OpenAI 今年发布的 DALL・E 和 CLIP,又究竟有什么区别?与 DALL・E 有什么不同?
  2019 年,英伟达 GauGAN2 的"前身"GauGAN 正式开源。
  当时的它,还只拥有其中一个能力,就是将涂鸦直接变成风景画,就像「神笔马良」一样,还推出了对应的软件 Canvas:
  当然,这时 GauGAN 已经能随意改变画面风格了,从白天黑夜到春夏秋冬的气质都能稳稳"拿捏":
  据英伟达介绍,GauGAN 采用了一种基于空间适应标准化(SPADE)算法。
  SPADE 算法不仅使用随机的输入图像,还采用了一种被称作"分割图"的图像。在分割图中,每一个像素都会被归类,来生成更接近于真实的图像,这种模式被称作"图对图翻译"。
  ▲GauGAN 的技能点(狗头)
  现在,英伟达将 GauGAN 升级成了 GauGAN2,后者一共采用了 1000 万张高质量的图片、在英伟达 Selene 超算上进行训练,这台超算在 Green500 排行榜上排到世界第二。
  生成这些风景画的效果和"手法",是不是感觉有点熟悉?
  没错,大多数人看到 GauGAN2 的第一眼,可能都会觉得它和 OpenAI 的 DALL・E+CLIP 有点像。
  今年年初,OpenAI 用 DALL・E 和 CLIP 两个模型,做了个"图像版"GPT-3,同样能用一句话生成图片。
  不过,这两个模型生成的内容其实不太一样。
  GauGAN2 专注于生成风景照,DALL・E+CLIP 则更多地生成具体的物体,例如一把椅子或者一个闹钟等。
  这与它们的原理差异也有关系,GauGAN2 更加注重"单词与视觉效果"之间的关系,例如"冬天"这种模糊的状态词给照片带来的效果;DALL・E+CLIP 则更注重"文字-图像"这种有明确对应关系的物体效果。
  据英伟达介绍,GauGAN2 不同于"文本-图像"和"分割图像-图像"一类的模型,它所能产生的照片种类更多,质量也会更高。
  不过,偶尔也会出现点 bug…
  比如给出"沙滩(beach)"一词后,有些生成的画面中出现了语言无法描述的事物。
  对此,英伟达表示,他们在训练中"完全没有用到任何人像照片"。(所以可能是偶然?)
  但这样一来,网友想要的"瑞克摇(Rick roll)"和"鬼畜视频生成",GauGAN2 大概也是没办法实现了。
  但是能生成仿佛梦境中才能见到的画面,也吸引了不少人来试玩。
  这不,有人就晒出了自己生成的抽象画大作,并表示自己非常喜欢这个模型:
  还有人表示,GauGAN2 给出了一些建筑设计的新 idea 啊。
  也有网友觉得这种能够自动生成景观的功能,未来 Adobe 可能也会用上。
  或许就是下一个画手利器?
  最后,GauGAN2 在浏览器上就能试玩,欢迎大家留言讨论自己的体验感受。
  GauGAN2 试玩 Demo 地址:点此直达

搜狗陈伟搜狗分身将打通输入法搜索AI硬件等内部产品5月23日下午消息,近日搜狗推出全球首个3DAI合成主播新小微,基于搜狗人工智能核心技术搜狗分身打造,将在两会进行新闻资讯报道。在接受新浪科技等媒体采访时,搜狗AI交互技术部总经理部分美国AppleWatch用户在睡觉或运动时不断地意外拨打911IT之家6月19日消息AppleWatch经常因拯救人们的生命而受到赞誉,无论是通过检测异常的心率或意外的跌倒,甚至是代表用户呼叫紧急服务,后者是AppleWatch内置的安全功能华米推出AmazfitGTS2智能手表无边界轻薄设计,方形表盘IT之家9月22日消息今天华米推出AmazfitGTS2智能手表,采用了轻薄设计的方形表盘,售价999元。IT之家了解到,AmazfitGTS2比前一代更轻更薄,厚度和重量分别为9IDC2019Q1中国智能音箱市场破千万大关,阿里巴巴百度并列第一IT之家6月6日消息据IDC中国智能家居设备市场季度跟踪报告显示,2019年第一季度中国智能音箱市场出货量达到1122万台,同比增长787。2。其中阿里百度以340万台出货量并列第中国科学院院士张钹人工智能安全问题比信息系统更难克服8月3日晚间消息,全球数字经济大会期间,中国科学院院士清华大学人工智能研究院院长张钹指出,人工智能安全问题比信息系统更难克服,人工智能治理不仅要从法律法规伦理规范等层面去治标,同时人工智能产业担当宣言发布,华为蚂蚁等推五项原则作为引领第四次科技革命的战略性技术,人工智能正在全球范围内蓬勃兴起。但在带来巨大机遇的同时,新型安全风险和治理挑战也与之相伴,如何引导人工智能向善发展正成为产业关注的重点。2019代码反混淆太难,让AI来帮你自动起函数名有的人能把代码写成推理小说。需要一个临时变量的时候就叫temp,需要多个就叫var1,var2。甚至用拼音缩写当函数名,比如查询订单就叫cxdd。要想看懂这样的代码,得联系上下文反OPPO首款智能手表前面板现身双曲面很明显IT之家2月24日消息在即将到来的OPPOFindX2发布会上,OPPO还将带来首款智能手表。目前该智能手表的名称暂时不清楚,不过外观和设计官方已经提前放料,我们有了一定的了解。据爷青回AI把灌篮高手角色真人化,最帅的居然不是流川枫湘北!加油!就这一句话,得勾起多少人难忘的青葱岁月啊。最近,一位外国博主AI搞了个事情,更是让网友们掀起了一波超强回忆杀用AI将灌篮高手真人化。例如我们熟悉的主角樱木花道,在AI的AI独角兽云从科技落户广西将面向东盟开展人工智能应用合作IT之家8月25日消息据广西大数据发展局官方微博,云从科技日前与广西北投信创科技投资集团有限公司达成战略合作协议,双方将在高速车路协同,高速稽查,交通事件处理,船舶无人驾驶等多个人滴滴张博AI能在未来20年大幅降低交通事故死亡人数滴滴出行CTO张博今日在CNCC2019(中国计算机大会)发表主题演讲,集中展示滴滴AI布局,并宣布进一步扩大滴滴盖亚数据开放计划,面向学界新对外开放两个脱敏城市交通指数数据集。滴
169元,小米手环4标准版明早10点开启首卖大屏彩显,腕上支付IT之家6月13日消息6月11日,小米在北京举行了小米手环4暨米家智能新品发布会,会上正式发布了小米手环4,采用了彩色显示屏,提供多彩腕带和各种个性化主题。接入了小爱同学,可以与米一图看懂华米AMAZFIT米动健康手表IT之家6月11日消息今天,华米科技2019夏季新品发布会举行,发布了AMAZFIT米动健康手表。在这款手表上,黄山1号正式应用,这是一款RISCV开源指令集可穿戴处理器。AMAZAppleWatch警告男子存在心房颤动情况,挽救其生命IT之家12月6日消息又有AppleWatch帮助拯救某人生命的事情发现,据外媒ABC报道,近日,来自佛罗里达州沃思湖的74岁的罗伊罗宾逊的AppleWatch提醒他可能发生了房颤苹果AppleWatch获新专利支持FaceID和特殊运动传感器IT之家11月19日消息据patentlyapple报道,美国专利商标局今天正式为苹果发布了一系列52项新授予的专利,暗示该智能手表可能在将来支持FaceID等功能。苹果获得的专利新华社AI合成主播亮相世界通讯社大会感谢IT之家网友剑指架构师的线索投递!IT之家6月15日消息据新华社报道,日前,在保加利亚举办的第六届世界通讯社大会上,新华社AI合成主播亮相当天的人工智能专题讨论会。与真人无异的AI语音真假面你的声音DNA可能会被复制如果有一种技术可以一秒复制或模仿你讲话,你会感到惊喜还是惊恐?进入2019年,AI技术的应用落地越来越多样化。科大讯飞搜狗等技术公司相继发布了语音合成技术的应用。通过AI手段,用户三星可卷起式柔性屏电视专利曝光能像布一样卷起来IT之家1月1日消息目前,智能手机与智能电视都走到了需要进化的十字路口,很巧的是,双方都选择向屏幕可折叠领域发展。继三星GalaxyF曝光之后,有关三星可折叠柔性屏智能电视的呼声也你想离职?IBM的AI九成五能猜到IBM公司CEO罗睿兰(GinniRometty)本周二在接受CNBC采访的时候表示,该公司每天都会收到超过8000份简历。这家科技巨头当前大约拥有35万名员工,在员工管理方面他们预测洪水和检测乳腺癌,谷歌还希望能做更多在SolveWithAI上,谷歌再一次对外展示了AI在应用上的进展。从主题来看,很明显地表达了谷歌希望将AI用于Solve(译为解决)实际生活中的问题。谷歌AI的负责人JeffDeAI所生成文本的最权威评估者并非人类(原标题人类评估已不是NLG的最佳标准,华盛顿大学提出全新观点,网友那是评估人水平不行)AI生成的文本好不好,最权威的评估者竟然不是人类自己?最近,华盛顿大学和艾伦人工智能研究院的耶鲁大学测试人类和AI一起工作,结果令人意外大西洋月刊撰文指出,人工智能正在直接或间接地影响诸如爱情友谊合作以及教学等人类基本社会能力。当人工智能更全面地渗入人类生活时,我们可能还需要一种新的社会契约,一种与机器而不是与他人