范文健康探索娱乐情感热点
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

让AI搞创作谷歌夺回画语权,机器想象力达到全新高度

  在让 AI 搞创作这件事上,谷歌和 OpenAI 正面刚起来了。这不,震惊全网的 DALL・E 2 才新鲜出炉一个月,谷歌就派出名为 Imagen 的选手来打擂台。
  直接上图对比,左边是谷歌 Imagen 选手眼中的"猫猫绊倒人类雕像",右边则是 DALL・E 2 选手的同题创作。
  你觉得哪一位选手的作品更符合题意?而让网友们直呼"DALL・E 2 这就过时了?"的,还不只是这种正面 PK 的刺激。看到这么一张照片,如果不说是 AI 生成的,是不是要先感叹一句两脚兽的摆拍技术越来越高超了?
  输入"折纸作品:一只狐狸和一只独角兽在飘雪的森林里",Imagen 创作出的画面则是酱婶的:
  还可以试试把文字写得长一点。比如《一只非常快乐的毛茸熊猫打扮成了在厨房里做面团的厨师的高对比度画像,他身后的墙上还有一幅画了鲜花的画》…(啊先让我喘口气)Imagen 也轻松拿下,要素齐全:
  看到这,机器学习圈的网友反应是这样的:
  不是吧,这才一个月就又更新换代了?
  求求别再震惊我了。
  这事儿热度一起,很快就破了圈。吃瓜群众们立刻就想到一块去了。
  以后可能没图库网站什么事儿了。
  那么这个来自谷歌的新 AI,又掌握了什么独家秘技?具体详情,我们一起接着往下看。增强「理解」比优化「生成」更重要
  文本到图像生成我们之前介绍过不少,基本都是一个套路:CLIP 负责从文本特征映射到图像特征,然后指导一个 GAN 或扩散模型生成图像。
  但谷歌 Imagen 这次有个颠覆性的改变 —— 使用纯语言模型只负责编码文本特征,把文本到图像转换的工作丢给了图像生成模型。语言模型部分使用的是谷歌自家的 T5-XXL,训练好后冻结住文本编码器。图像生成部分则是一系列扩散模型,先生成低分辨率图像,再逐级超采样。
  这样做最大的好处,是纯文本训练数据要比高质量图文对数据容易获取的多。T5-XXL 的 C4 训练集包含 800GB 的纯文本语料,在文本理解能力上会比用有限图文对训练的 CLIP 要强。这一点也有着实验数据做支撑,人类评估上,T5-XXL 在保真度和语义对齐方面表现都比 CLIP 要好。
  在实验中谷歌还发现,扩大语言模型的规模对最后效果影响更大,超过扩大图像生成模型的影响。
  看到这有网友指出,谷歌最后采用的 T5-XXL 参数规模还不到最新 PaLM 语言模型 5400 亿参数的 1%,如果用上 PaLM,又会是啥样?
  除了语言模型部分的发现,谷歌通过 Imagen 的研究对扩算模型作出不少优化。首先,增加无分类器引导(classifier-free guidance)的权重可以改善图文对齐,但会损害图像保真度。解决的办法是每一步采样时使用动态阈值,能够防止过饱和。
  第二,使用高引导权重的同时在低分辨率图像上增加噪声,可以改善扩散模型多样性不足的问题。第三,对扩散模型的经典结构 U-Net 做了改进,新的 Efficient U-Net 改善了内存使用效率、收敛速度和推理时间。
  对语言理解和图像生成都做出改进之后,Imagen 模型作为一个整体在评估中也取得了很好的成绩。比如在 COCO 基准测试上达到新 SOTA,却根本没用 COCO 数据集训练。
  在 COCO 测试的人类评估部分也发现了 Imagen 的一个缺点,不擅长生成人类图像。具体表现是,无人类图像在写实度上获得更高的人类偏好度。
  同时,谷歌推出了比 COCO 更有挑战性的测试基准 DrawBench,包含各种刁钻的提示词。实验发现,DALL・E 2 难以准确理解同时出现两个颜色要求的情况,而 Imagen 就没问题。
  反常识情况,比如"马骑着宇航员"两者表现都不佳,只能画出"宇航员骑着马"。但是 Imagen 对"一只熊猫在做咖啡拉花"理解更准确,只错了一次。DALL・E 2 则全都把熊猫画进了拉花图案里。
  △ 大概"马骑着宇航员"有点反常识(狗头)
  对于要求图像中出现文字的,也是 Imagen 做得更好。除了最基本的把文字写对以外,还可以正确给文字加上烟花效果。
  AI 画画越来越出圈
  说起来,AI 作画这件事,最早便源起于谷歌。2015 年,谷歌推出 DeepDream,开创了 AI 根据文本生成图像的先河。
  △ DeepDream 作品
  但要说相关技术真正开"卷"、出圈,标志性事件还得数 2021 年 OpenAI 的 DALL・E 横空出世。当时,吴恩达、Keras 之父等一众大佬都纷纷转发、点赞,DALL・E 甚至被称为 2021 年第一个令人兴奋的 AI 技术突破。
  随后,语言理解模型和图像生成模型多年来的技术进展,便在"AI 作画"这件事上集中爆发,一系列 CLIP+GAN、CLIP + 扩散模型的研究和应用,频频在网络上掀起热潮。
  从此一发不可收拾,技术更新迭代越来越快。DALL・E 2 刚发布的时候就有网友发起一个投票,问多长时间会出现新的 SOTA。当时大多数人选了几个月或 1 年以上。
  但现在,Imagen 的出现只用了 6 周。随着 AI 画画效果越来越强大,受众范围也不断扩大,突破技术圈进入大众视野。前一阵,就有 AI 画画应用登上苹果 App Store 图形与设计排行榜榜首。
  现在最新的潮流,是各路设计师排队申请 Midjourney、Tiamat 等商业化产品的内测,刷爆社交网络。
  如此出圈,也给 OpenAI 和谷歌这样的大公司带来很大压力。出于 AI 伦理、公平性等方面考虑,DALL・E 2 和 Imagen 都没有直接开源或开放 API。各自也都在论文里有大篇幅涉及风险、社会影响力的内容。
  OpenAI 选择了内测模式,而谷歌还在做进一步研究和规范,等到确保 AI 不被滥用之后再择机公开。现在想体验 Imagen 的话,有一个在线 Demo 演示。可以从给定的几个提示词中自由组合出不同场景。
  快来试试吧~
  Demo 地址:
  https://gweb-research-imagen.appspot.com
  论文地址:
  https://gweb-research-imagen.appspot.com/paper.pdf
  参考链接:
  https://twitter.com/ak92501/status/1528861980702146560

世界癌症日AI对癌症治疗有什么帮助?2月4日是世界癌症日。据世界卫生组织,全球范围内,近六分之一的死亡由癌症造成,近70的癌症死亡发生在低收入和中等收入国家。2015年癌症造成880万例死亡,最为常见的癌症类型为肺癌麦当劳用AI解读顾客想吃什么最近你有没有在任何餐厅接受推荐订餐?你是否根据天猫的推荐更改订单?当有个声音推荐你喜欢的产品时,你是否担心公司正在阅读你内心深处的想法?事实上,这些餐厅购物网站或公司的确在这样做。小米手表正式发布腕上小型手机,1299元IT之家11月5日消息小米手表价格刚刚已经正式公布,1299元,今天下午5点开启预定,11月11日0点全渠道首卖。小米手表采用1。78英寸AMOLED方形大屏,44mm表盘像素密度谷歌聘请零工经济工人,背地里继续训练军事AI北京时间2月7日下午消息,据外媒TheIntercept报道,谷歌聘请大量零工经济工人来完成之前极具争议的人工智能项目,该项目先前为公司与五角大楼的合作项目。这些工人是通过一家名为阿里巴巴浅雪希望天猫精灵3年追平亚马逊销量阿里人工智能实验室昨日发布了天猫精灵系列的三款新品。阿里巴巴集团副总裁A。I。Labs总经理浅雪表示,2019年1月,天猫精灵从上市到销量突破1000万台,仅用了18个月,比亚马逊IT之家开箱小米有品飞狗无线地面清洗机图赏IT之家8月15日消息日前,小米有品推出了一款飞狗无线地面清洗机,支持扫地吸尘和拖地功能,众筹价1299元。IT之家已拿到这款产品,现在为大家带来开箱图赏。飞狗无线地面清洗机采用米1999元起,华为智能眼镜XGENTLEMONSTER今日正式开售IT之家9月13日消息今年三月,在巴黎举办的华为P30系列发布会上,华为对外展示了一款同韩国眼镜公司GENTLEMONSTER合作研发的智能眼镜。当时GENTLEMONSTER的CLG发布全球首款可卷曲OLED电视,春季开卖IT之家1月8日消息去年LGDisplay在CES上发布了65英寸可卷曲电视原型机,现在已经过去一年时间,LG在今年的CES上推出了其消费者版本,这款旗舰4KOLED可卷曲电视Si柔软的科技小米申请智能围巾专利IT之家8月24日消息现有的智能产品往往是出现在移动设备家居智能生活等方面,但是智能服饰却很少有品牌涉及到。不过据小米最近申请的专利显示,其似乎有意拿常见的衣服开刀了。小米近日申请苏宁发布小Biu空调Pro版变频波轮洗衣机等新品IT之家9月19日消息9月19日,首届小Biu粉丝狂欢节于广州CEChina现场开启,苏宁推出了多款小biu新品。小Biu是苏宁旗下的一个智能品牌,定位是科技时尚品质,目标人群是追网红电动狗波士顿动力的商业化探索不论是跑酷能手,还是灵魂舞者,波士顿动力的网红机器人一亮相,就会吸引一大批网友的眼球。近日,波士顿动力发布了一段新的视频,主人公SpotMini机器狗站在镜头面前,随着背景音乐跳了
OPPOWatch2系列智能手表发布搭载双曲面3DAMOLED60Hz柔性屏,1299元起IT之家7月27日消息在今天下午的OPPOWatch2全智能旗舰手表发布会上,OPPOWatch2系列智能手表正式发布,共包含三个版本,分别为OPPOWatch2(46mm)OPP最高直降400元,石头扫地机器人双12全网最全购买攻略IT之家12月11日消息最为2018年最后一波超级大促,双12期间,石头扫地机器人推出了最高直降400元直减活动,力度持平双11。小编总结了一份石头扫地机器人双12全网最全购买攻略谷歌AI可在嘈杂环境中区分声音,准确率达9211月13日消息,据VentureBeat报道,在语音嘈杂的环境中,要想分辨出有几个人讲话在什么时间讲话,对于机器来说非常困难。但谷歌人工智能(AI)研究部门在语音识别方面取得了新华为云推出新冠肺炎AI辅助诊断服务,CT量化结果可秒级输出IT之家2月11日消息根据华为云微信公众号消息,华为云与华中科技大学蓝网科技等合作,研发并推出新型冠状病毒肺炎AI辅助医学影像量化分析服务。据介绍,该技术基于华为云计算机视觉与医学小米手表迎来第三次系统更新新增计算器指南针App,支持模拟实体门卡感谢IT之家网友走去哪儿的线索投递!IT之家3月31日消息据IT之家网友投稿,小米手表今日迎来第三次系统更新,新增计算器App指南针App海拔气压计App,同时支持手表端独立开通交小米手表尊享版开启预售1999元,送399元TWS耳机IT之家2月28日消息2020年2月28日,小米推出的小米手表尊享版正式开启预售。据IT之家了解,小米手表尊享版将于2月28日上午1000至3月3日上午959分,在小米商城小米之家三星GearS3国行推送Tizen4。0健康功能升级,菜单分类改进感谢IT之家网友Ampoule的线索投递!IT之家3月7日消息根据官方的消息,三星GearS3国行现已推送Tizen4。0系统,主要升级了一些健康功能,菜单分类也进行了改进。更新日到手价239元起,荣耀手环6NFC正式开启预售1。47英寸AMOLED全面屏,磁吸快充IT之家11月3日消息荣耀正式发布最新一代智能手环荣耀手环6。其中荣耀手环6售价249元,荣耀手环6NFC版售价289元,11月4日0点正式开启预售,到手价239元起。IT之家获悉全球首家石头手持无线吸尘器H6通过德国莱茵T220V吸力无损耗认证IT之家5月7日消息据石头科技官微消息,石头手持无线吸尘器H6通过德国莱茵TV吸力无损耗认证,也是全球首个获此认证的吸尘器。石头科技称,基于TV莱茵开发的吸力标准2PfGQ2807亚马逊语音助手Alexa去年被100多万人求婚,均拒绝10月15日消息,据国外媒体报道,亚马逊智能语音助手Alexa目前已被用于上千万台亚马逊以及第三方推出的设备,消费者也能通过Alexa与相关的产品进行互动,有意思的是,不少用户在互华为WATCHGT智能手表发布高分屏,2周续航IT之家10月16日消息此次发布会华为还发布了华为手表GT(HUAWEIWATCHGT),其具有出色的电池续航能力以及所需的所有活动跟踪功能。WatchGT基于华为的专有平台(而非