范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

皮克斯技术指导辞职读博研究AI设计怪物,从游戏王卡牌开始

  让 AI 画人脸见得多了,要是让 AI 画个幻想中的怪物又如何?
  来看几个,先是人形的:
  再来个兽形的:
  还有诡异到说不出来属于什么型的:
  你可能会问,这很难吗?
  毕竟现在用 GAN 生成人脸都能以假乱真,生成怪物只要"瞎画"就行了,又不需要像谁。
  一位从皮克斯辞职又跑去读博的小哥 Vavilala,最近就在研究让 AI 辅助人类原画师设计怪物这件事。
  他的答案是:难,但不是同一种难。
  如今的 GAN 比如英伟达的 StyleGAN2,在生成怪物任务上存在一个大问题:
  只擅长改变画面的风格,但里面的怪物在人类看起来还是同一种。
  他开始思考,如何才能让 AI 创造出新的怪物?关键在控制噪声
  让 AI 生成怪物图像,首先要面对问题是数据集变了。
  像 StyleGAN 系列所用的高清人脸数据集 FFHQ 里面,有 7 万张人脸照片,而且都是大致朝向正面的大头照。
  虽然人的性别年龄肤色表情不一样,但好歹整体结构是相同的,都是一个鼻子两个眼。
  小哥用的怪物数据集是从 YGOPRODeck 上获取的卡牌游戏《游戏王》中的 1 万多张插画,其中可以算怪物的有 6800 张,这里面的怪物可是什么样都有。
  怪物的图片资源本来就少还要分成不同种类,全身画像在姿势上差异也很大,相当于是稀疏型数据集。
  数据集变了,算法也要相应的改变。
  先看看 StyleGAN 系列原版的算法。
  StyleGAN 一代继承自 ProGAN,采用渐进式训练,从 4x4 分辨率开始,每层训练到稳定再将分辨率翻倍,直到 1024x1024。
  ▲来自 Towards Data Science
  4x4 到 32x32 分辨率层的特征能改变姿势、发型、脸型、五官等能识别一个人身份的粗粒度特征。
  从 64x64 到 1024x1024 分辨率层就只能调整一下皮肤的颜色和皱纹斑点等细节特征了。
  同时 StyleGAN 系列又靠在每个分辨率层的卷积后添加噪声获得更丰富多样的面部特征,增强图像的质量。
  在初代 StyleGAN 论文中有这样一个实验:
  如下图所示,(a) 是在所有层添加随机噪声,(b) 是无噪声,(c) 是只在 64x64 分辨率及以上的层添加噪声,(d) 是只在 4x4 到 32x32 分辨率的层添加噪声。
  从结果可以看出,对于生成人脸来说需要在所有层上添加噪声。
  高分辨率层的噪声能够增加脸上和背景物体上的细节 (a、c 对比 b、d),低分辨率层噪声又控制头发的卷曲看起来不那么夸张 (a 对比 c)
  小哥在用游戏王数据集训练的 StyleGAN2 上做了同样的实验。
  结果发现,噪声对于生成怪物来说同样重要,但又有所不同。
  用无噪声方法生成的怪物图像在 FID 分数上惨不忍睹 (越小代表生成的图像质量越好)。
  在所有层加入噪声会好一些,而只在 32x32 分辨率以上的层加入噪声效果会更好。
  这是因为稀疏型的怪物数据集特征太杂太多,画面还是全身的,噪声改变一点点很容易就面目全非。
  等一下,这难道不就创造了新的怪物么?
  仔细看上图,生成的几种怪物质量并不算高,容易出现不完整的特征和几种不同类型的特征胡乱拼凑。
  修改噪声得到的图像还不可控,因为噪声是随机生成的,不同噪声对最终结果的影响也是不可解释的。
  去掉低分辨率层的噪声这个方法,可以减少噪声对怪物图像粗粒度特征的影响,获得高质量图像图像的同时也保留了通过改变噪声获得随机细节的能力。
  现在有了适用于生成怪物的魔改版 StyleGAN2,最开始那个问题,让 AI 设计出新的怪物要怎么做?
  其实还是靠去掉低分辨率层的噪声,这么一个简单的改动就能解决。可控的创新
  还是先看一下之前的做法。
  StyleGAN2 的后续研究中,阿尔托大学提出了 PCA 方法 (Principal Component Analysis,主成分分析)。
  通过 PCA 可以在隐空间中找到代表某种特征变化的方向,沿着特定方向修改隐变量 (latent variables) 能做到独立可控制的修改人脸特征。
  如果在生成怪物任务上沿用在所有分辨率层添加噪声的训练方法,PCA 的效果又不行了。
  此时改变隐变量反倒成了对风格的修改,怪物看起来还是同一种。
  改了,但没完全改。
  在低分辨率层不添加噪声的训练方法再次发挥了作用。
  少了低分辨率层噪声的干扰,PCA 方法更容易找出有意义的修改方向,让 AI 在中间一列原图的基础上设计出新的怪物。
  还提出实用 Workflow
  另外值得一提的是,这位小哥不愧是在大公司实际业务上锻炼过又回到学术界的,写论文不忘了探讨一下如何打造方便一线设计师操作的工作流程。
  比如将魔改版 StyleGAN2 部署到 A100 上推理时间平均可达 0.05 秒,能满足即时操作的要求。
  再用 Streamlit 工具可以用很少代码创建交互式的图形界面,用滑块一类的控件方便地调整参数。
  论文最后展示了使用 GAN 中常见的截断技巧 (Trunction)、风格混合和 PCA 方法结合,是怎么一步步设计出新的怪物的。
  论文一作 Vaibhav Vavilala 来自伊利诺伊大学厄巴纳-香槟分校。
  他的导师是 CV 大牛 David Forsyth,《计算机视觉:一种现代方法》的作者。
  论文地址:
  https://arxiv.org/abs/2108.08922
  参考链接:
  [1]StyleGANhttps://arxiv.org/abs/1812.04948
  [2]StyleGAN2https://arxiv.org/abs/1912.04958
  [3]PCAhttps://arxiv.org/abs/2004.02546
  [4]https://towardsdatascience.com/progan-how-nvidia-generated-images-of-unprecedented-quality-51c98ec2cbd2

聊天机器人有了长期记忆,遇到不懂的还能上网搜索聊天机器人一直是人工智障的代表。尽管从GPT3开始,AI生成的文本已经能做到以假乱真,但这仅限于生成一段话。在连续聊天中,AI不会记得自己之前说过的话,就像下面这样AI这种前后矛盾佳明推出星战主题智能手表续航1周,售价400美元IT之家10月7日消息迪士尼为了星球大战天行者崛起的宣传已经推出了很多联名产品,比如联名的地雷形可口可乐联名美联航飞机联名乐高联名雷蛇键鼠联名阿迪达斯X翼战机UltraBoost跑名为机器狗Max,腾讯正式发布首个软硬件全自研的多模态四足机器人IT之家3月2日消息根据腾讯官方的消息,今天,腾讯正式发布首个软硬件全自研的多模态四足机器人机器狗Max。官方表示,机器狗Max采用了足轮融合一体式设计,采用了腾讯Robotics华为官宣WatchGT2保时捷版本,10月22日见IT之家10月15日消息华为官方微博刚刚发布预热视频,WatchGT2保时捷版本10月22日见。金属表带IT之家了解到,9月份爆料者evleaks就曾表示华为将为WatchGT2P亚马逊人工智能Alexa更新主动预感功能无需人工干预即可控制其他设备IT之家1月26日消息早在去年9月,亚马逊宣布Alexa将能够在无人工干预的情况下主动采取行动,并称之为Hunches。当用户授权允许后,Alexa将从用户习惯中学习并通知用户是否魅族立式无线超充40W将于4月29日开售,售价199元IT之家4月27日消息在今年的魅族18系列发布会上,魅族官宣将推出一款40W的立式无线充电器,售价199元。今日,魅族配件官方宣布,魅族立式无线超充40W将于4月29日1000开售AI修复历史珍贵影像,教你如何用彩色高清还原70多年前的场景你对历史这个词的第一印象是什么?很多人的脑海中最先冒出来的,或许是像下面这样粗糙颗粒老旧模糊的黑白影片图源1951年纪录片抗美援朝但现在,在AI修复技术的帮助下,那些模糊的影片也能AI进军摇滚圈,发布了一张金属乐专辑利用人工智能编曲,似乎已经不是一件新鲜事。但是你有听说哪个AI发布专辑吗?这个专辑的作者是一个叫DeepSlayerXL的智能程序,它基于TransformerXL语言模型训练,可米家十字四门冰箱4月24日预售496L容量立体送风,到手价3499元IT之家4月23日消息根据官方消息,米家十字四门冰箱496L版将于4月24日全渠道开启预售,5月1日开售。这款冰箱具有一级能效,零售价3999元,到手价3499元。米家十字四门冰箱三星与珠宝商推出特别版GalaxyWatch3,售价3040元起IT之家5月12日消息根据外媒GSMArena消息,三星近日与珠宝商Tous进行合作,推出了一款特别版的GalaxyWatch3智能手表。该产品重新设计了表盘以及表带,同时搭载专属谷歌WearOS添加Gboard输入法,将支持QWER全键盘输入IT之家5月7日消息根据外媒消息,今日谷歌WearOS正式宣布将自家的Gboard输入法带到智能手表的WearOS系统,支持全键盘输入,兼容多种语言。这款输入法还支持语音输入Emo
未来智能走向何方人有人的用途,机有机的用处撰文王飞跃中国自动化学会监事长中国科学院自动化研究所复杂系统管理与控制国家重点实验室主任当今最好的人工智能程序到底有多智能?它们是如何工作的?能做些什么?我们有必要担心机器比人类聪国外公司推出紧急救援服务搭配苹果AppleWatch跌倒检测功能使用IT之家5月26日消息据外媒AppleInsider消息,TelusHealth公司在加拿大推出了一项安全服务,这项服务利用苹果AppleWatch的跌倒检测功能来帮助弱势人群。这苹果AppleWatch将很快支持手势操控IT之家5月20日消息苹果公司今天预览了一长串即将推出的新的无障碍功能,包括AppleWatch的AssistiveTouch,它将允许用户在不用触摸显示屏或操作按键的情况下控制A苹果AppleWatchSeries7新爆料平边直角设计,新增绿色配色IT之家5月19日消息据外媒9To5Mac报道,爆料者JonProsser透露,苹果新款AppleWatchSeries7的外观将会采用类似于iPhone12和iPadPro的平边外媒上手Wristcam给苹果AppleWatch增添拍照功能的第三方表带5月10日上午消息,Wristcam是一款独特的产品,它给AppleWatch加了个外接摄像头,满足了很多人对这款产品的想象,外媒AppleInsider近期对它进行了上手体验。W华为WatchGT2Pro10。1。2。36固件更新新增血氧自动检测感谢IT之家网友小土苟的线索投递!IT之家11月6日消息10月30日,华为在国内正式发布了WatchGT2Pro手表,运动款售价2188元,时尚款售价2388元。根据网友投稿,华为亚马逊Alexa语音助手登陆微软Xbox游戏主机IT之家3月5日消息据外媒XDA消息,微软Xbox游戏主机现已支持亚马逊的Alexa语音助手。玩家可以通过语音指令操控游戏机,比如开关机启动喜欢的游戏暂停等等。AlexaApp已经谷歌WearOS已开放自定义第三方Tiles,开发者可自行制作应用小部件IT之家3月13日消息一年前,谷歌对WearOS进行了一项重大更改,谷歌智能手表获得了Tiles功能,用户可将喜欢的应用程序以类似小部件的形式添加到表盘中。然而,自该功能发布以来,亚马逊Alexa语音助手登陆兰博基尼Hurac225nEVO,可控制空调及座椅加热等IT之家4月1日消息据外媒theverge消息,兰博基尼于3月31日正式宣布亚马逊Alexa语音助手现已支持兰博基尼最新的HuracnEVO跑车,用户可以像控制智能家居设备那样操控苹果申请神奇床垫专利,可监测睡眠充当无声闹钟3月27日消息,据外媒报道,苹果公司已经申请了一种非常有未来范儿的床垫传感器专利,它可以监测人们的睡眠情况,然后在早上通过轻轻移动人们来唤醒他们。在专利文件中,苹果声称其在研发一种下围棋的DeepMind成了药神,这事儿和你我都有关这将改变医学,改变研究,改变生物工程,生物学家AndreiLupas这样评价Alphabet旗下的DeepMind最新推出的蛋白质结构预测AIAlphaFold2。它将改变一切。最