范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

给一个词就能模仿你的笔迹,Facebook这个AI强大到不敢开源代码

  机器之心报道
  编辑:陈萍
  你在纸上写个词,AI 只要看一眼就能模仿你的笔迹,还是看起来毫无破绽的那种。
  Facebook 近日公布了一项新的图像 AI——TextStyleBrush,该技术可以复制和再现图像中的文本风格。
  借助该技术,你只需要输入一个词作为「标准」,AI 就能全篇模仿你的书写风格,一键执行,效果可谓惊艳。
  此外,你还可以用它替换不同场景中的文字(比如海报、垃圾桶、路标等)。下图中左侧为原始场景图像,单词显示在蓝色矩形中;右侧为文本替换后的图像。
  从图中可以看出,各种风格的字体 AI 几乎都能 hold 住。下图中每个图像对在左边显示输入源样式,在右边显示新内容(字符串),左右两端字体看起来风格完全相同。与源图像相比,输出的图像在外观上似乎都有些模糊,但我们可以看到,在大多数情况下,该技术似乎工作得很好。
  与其他字迹模仿 AI 相比,TextStyleBrush 功能更强大,可以从更细微的角度分析文字样式,从而做到在各种角度和背景下进行字迹模仿。
  下图是酱油瓶(Soya)替换为茶瓶(Tea)的实现过程:
  这款强大的模仿神器正是 Facebook AI 推出的「TextStyleBrush」,只需输入一个单词,就能完美复现笔迹。这项技术的原理类似于文字处理 APP 中的样式笔刷工具,可以将文字和风格分开。
  论文地址:https://scontent-sjc3-1.xx.fbcdn.net/v/t39.8562-6/10000000_944085403038430_3779849959048683283_n.pdf?_nc_cat=108&ccb=1-3&_nc_sid=ae5e01&_nc_ohc=Jcq0m5jBvK8AX--fG2A&_nc_ht=scontent-sjc3-1.xx&oh=8b7e8221bba5aba6b6331c643764dec5&oe=60EF2B81 数据集地址:https://github.com/facebookresearch/IMGUR5K-Handwriting-Dataset
  它具有以下特点: 只需要一个单词,就能复制照片中的文字风格。使用该 AI 模型,你可以编辑和替换图像中的文本。 与大多数 AI 系统不同的是,TextStyleBrush 是首个自监督的 AI 模型,使用单个示例词一次性替换手写和图像中的文本。 将来它会在个性化信息和字幕等领域释放新的潜力,比如在增强现实 (AR) 中实现逼真的语言翻译。 通过公布这项研究所具有的能力、方法和结果,研究者希望推动对话和研究,以发现这类技术的潜在应用,如深度假文本攻击——这是人工智能领域的一大挑战。
  由于 TextStyleBrush 也可能被用来制作误导性的图像,所以 Facebook 的 CTO 在个人社交网站表示,他们只发布了论文和数据集,但没有公开代码。并表示正如我们对 deepfakes 的方法一样,我们认为共享研究和数据集将有助于构建检测系统并提前预防攻击。
  可以学习文本风格表征的 TextStyleBrush
  用 AI 生成图像一直在以惊人的速度发展,这种生成技术能够重现历史场景,或者将照片变成梵高等绘画风格。现在,Facebook AI 已经建立了一个可以替换场景和手写文本风格的 AI,只需要一个单词作为输入。
  虽然大多数 AI 系统都可以完成定义明确的、专门的任务,但构建一个足够灵活的 AI 系统,以理解现实场景中文本和手写体的细微差别,具有很大的挑战。这意味着需要了解众多的文本样式,不仅包括不同的字体和书写风格,而且也包括不同的转换,如旋转、弯曲的文字以及图像噪声等问题。
  Facebook AI 提出了 TSB(TextStyleBrush)架构。该架构以自监督的方法进行训练,没有使用目标风格监督,只使用了原始风格图像。该框架可以自动地寻找图片真实风格。在训练时,它假设每个词框有真实值(出现在框中的文本);推理时,它采用单一源样式图像和新内容(字符串),并生成带有目标内容的源样式的新图像。
  该生成器架构是基于 StyleGAN2 模型。然而,它有两个重要的限制:
  首先,StyleGAN2 是一个无条件模型,这意味着它通过对一个随机的潜在向量进行采样来生成图像。但 TextStyleBrush 必须要生成指定文本的图像。
  其次,TextStyleBrush 生成的文本图像风格不受控制。文本风格涉及全局信息(例如调色板和空间变换),以及精细的比例信息组合(例如单个笔迹的细微变化。
  研究者通过内容和风格表征来调节生成器以解决上述限制。通过提取特定于层的风格信息并将其注入到生成器的每一层来处理文本风格的多尺度特性。除了以期望的风格生成目标图像外,生成器还生成表示前景像素 (文本区域) 的软蒙版图像。通过这种方式,生成器可以控制文本的低分辨率和高分辨率细节,以匹配所需的输入风格。
  该研究还引入了一种新的自监督训练准则,该准则使用字体(typeface)分类器、文本识别器和对抗式鉴别器来保留源风格和目标内容。首先,研究者通过使用预训练的字体分类网络来评估生成器捕获输入文本风格的能力。另外,他们使用预训练文本识别网络来评估生成图像的内容,以反映生成器捕获目标内容的效果。总而言之,这种方法能够对训练进行有效的自监督。
  实验
  表 2 提供了评估不同损失函数、风格特征扩展以及训练 TSB 时 mask 的作用消融实验结果。实验结果显示,TextStyleBrush 生成的图片在 MSE(合成误差)上大幅降低,PSNR(峰值信噪比)、SSIM(结构相似性)均获得了提高。
  表 3 是在三种数据集图像上测得的文本识别准确率。实验结果显示,TSB 的识别效果最好,在 IC13 上的识别准确率为 97.2%,IC15 上的识别准确率为 97.6%,TextVQA 上的识别准确率为 95.0%。
  表 4 提供了生成的手写文本的定量比较,将 TSB 方法与 Davis 等人 [14] 专门为生成手写文本而设计的 SotA 方法进行了比较。FID 分数越低,生成质量越好。显然,TSB 方法优于以前的工作。
  TextStyleBrush 证明了 AI 在文字上面可以比过去更加灵活、准确地识别,但这项技术仍然存在许多问题,如无法模仿金属表面的字符或彩色字符等, Facebook 希望这项研究能继续扩展,突破翻译、自主表达和 deepfake 研究之间的障碍等。
  失败案例。
  参考链接:
  https://ai.facebook.com/blog/ai-can-now-emulate-text-style-in-images-in-one-shot-using-just-a-single-word

天问一号探火国家航天局发布祝融号火星车拍摄影像天问一号探火国家航天局发布祝融号火星车拍摄影像5月19日,国家航天局发布我国首次火星探测任务天问一号探测器着陆过程两器分离和着陆后火星车拍摄的影像。图像中,着陆平台驶离坡道以及祝融小米坚持全球最高标准保护你的安全与隐私坚持全球最高标准小米安全与隐私宣传月完满落幕6月29日,第二届小米安全与隐私宣传月活动完美落幕。活动通过多形式多层次全方位展示了小米在信息安全与用户隐私保护方面的实践和成就,进一步2050年,地球和月球之间能否实现航班化?不断的前进,不断的探索关于第一点的空天飞机,咱们国家一直在大力发展,这是区别于空叉垂直回收的更先进的可重复使用飞行器。老样子还是三步走,第一步是火箭发射,子机返回重复利用,这个去年变异生物是否在我们身边隐藏?变异生物大家首先想到的是核废料引起的变异,这大家不得不想到2011年日本福岛核电站发生大规模泄露,日本为了避免大规模爆炸直接采用海水给核电站降温,从而减少进一步的核扩散,但这些降温中国投资147亿!四万人奔赴台湾海峡,建成首座公铁两用跨海大桥中国大陆砸下147亿奔赴台湾,打造世界最长的跨海公铁两用大桥。这条世界最长跨海公铁两用大桥在我国福建福州平潭岛,这是座跨海大桥连接台湾海峡,大桥名字叫作平潭海峡公铁两用跨海大桥,也中国4300吨盾构机,拦腰打穿喜马拉雅山,只为建设高海拔第一铁路中国在建设世界最高海拔的铁路,为了这条铁路,我国将打穿世界最高海拔的山脉喜马拉雅山,克服诸多施工中的极端天气和施工难题,这将是一项创造多项世界记录的浩大工程,那这个工程到底是什么呢中国斥资4万亿,人工打造第二条黄河,为何会遭到印度强烈反对?我国为何要花费如此多的金钱去建造第二条黄河?第二条黄河说建就能建吗?当我国提出要将西藏的水引向新疆,试图人工建造第二条黄河的想法时,不少国家都称这不太可能实现,因为该工程十分浩大实极端高温会给人类带来什么?我们能在极端高温下生存吗?人类从未在如此炎热的星球上生活过,我们对即将发生的一切毫无准备。灼热的太阳当温度飙升至46C以上时,热量就会导致人们死亡。阳光让你几乎无法睁开眼睛,空气中夏天的香瓜怎么选?20年果农教你1招,保证你买不到糖精瓜又到了分享美食的时间,哈喽,我是高兴!俗话说春吃芽,夏吃瓜。现在正是甜香瓜大量上市的季节,甜瓜又叫香瓜,吃起来又脆又香又甜。甜瓜的香气传得很远,你刚走进街头,就能闻到在巷尾贩卖的甜邮票中的口腔视界(四)阳光灿烂的世界波兰美女夏日时光汽车复古微笑外国东欧原版明信片好莱坞电影明星梦露古巴1995年极限片意大利明信片缅甸传统民族服饰笑容明信片瑞士首日封1997年邮政日笑脸四联票瑞士2011年附捐邮票燕辽生物群谢氏红山蜥与地球上曾经生存过的蜥蜴们蜥蜴属于一种称为鳞类爬行动物的动物家族,它是有鳞目蜥蜴亚目内爬行动物的总称。在地球生命史上蜥蜴大都在沙漠森林和山脉周围生活,据统计地球上生存和灭绝的蜥蜴种类有近10,000种。地球
如果我们现在不采取行动,地球95的海洋表面将发生更糟的变化根据周四发表的研究,除非人类控制碳排放,否则到本世纪末,95的地球海洋表面将发生变化。海洋表面气候,由地表水温酸度和矿物文石的浓度定义许多海洋动物用来形成骨骼和贝壳支撑着绝大多数的宇宙中最热的系外行星被加热到4300度在以往的认知中,大家可能错误地以为恒星都是比较热的,行星普遍比恒星冷得多。但是行星KELT9b可能帮助大家打破常规的认知。因为,有些恒星比这颗系外行星要冷得多。每隔一天半,一颗木星通古斯陨石坠落科学家仍在争论什么114年前爆炸并吓坏了西伯利亚中部鄂温克人和俄罗斯人的陨石的性质即使在21世纪仍然是一个谜。苏联研究员列昂尼德库利克(LeonidKulik)在1920年代和30年代发现坠落的天体我们的宇宙是盘录像带么?逻辑,是我们了解周边事物的基础,宇宙按照规则在演变,万物按照法则在运行,所有的一切都逃不过因果,那么,一切都是被安排好的么?先说物理层面,爱因斯坦说上帝不会掷骰子,虽然现在人们还无2011年诺贝尔物理学奖得奖者是什么星座2011年诺贝尔物理学奖被分成两半,一半授予SaulPerlmutter,另一半共同授予BrianP。Schmidt和AdamG。Riess,以通过观测遥远的超新星发现宇宙加速膨胀世界九大最顶尖的物理强国一英国点评英国是著名的物理学强国。比如英国物理学会(InstituteofPhysics,IOP)享誉世界,尤其是成立当时,曾经一系列惊人的发现和激进的思想正在颠覆经典物理学的有序神舟十三号即将返航,航向东风着陆场,首次快速返回,有多快?正值江南谷雨时节,位处巴丹吉林沙漠边缘的东风着陆场依然干燥凉爽,正是返回舱着陆的好天气。在未来十多年里,这里都将是天宫空间站执行完任务回家的航天员们的落脚点。在太空过春节,看冬奥的人类为什么要找外星人?不仅是好奇,还有一个关乎文明存亡的秘密你是否想过,我们为什么要寻找外星文明?看似简单的问题背后,其实隐藏着一个关乎文明存亡的秘密。时间回到1974年11月16日。这天,趁着当时世界上最大的单口径射电望远镜阿雷西博望远镜暗骑士外星卫星的奇异传说与现实相遇黑暗骑士卫星的传说已持续多年,是一个迷人的故事,一张看似平凡的NASA照片与无线电早期捕获的看似神秘的无线电波的报道捆绑在一起,形成了最终的太空阴谋论。它是这样的一个远古的外星太空月球上有水吗?天文学家多年来一直想知道月球上是否存在冰。那么月球上有没有水呢?1994年1月25日,由大力神火箭从范登堡空军基地发射克莱门汀环月探测器,2月21日进入月球轨道,该探测器重424千双雄会!4月5日晨火星合土星4月5日晨,火星合土星,从地球上看去,两者相距很近,最近时角距离仅有20角分,相当于满月视直径的三分之二。两颗行星如此靠近是难得一见的,届时只要天气晴朗,大气透明度好,在视野开阔的