范文健康探索娱乐情感热点
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

皮克斯技术指导辞职读博研究AI设计怪物,从游戏王卡牌开始

  让 AI 画人脸见得多了,要是让 AI 画个幻想中的怪物又如何?
  来看几个,先是人形的:
  再来个兽形的:
  还有诡异到说不出来属于什么型的:
  你可能会问,这很难吗?
  毕竟现在用 GAN 生成人脸都能以假乱真,生成怪物只要"瞎画"就行了,又不需要像谁。
  一位从皮克斯辞职又跑去读博的小哥 Vavilala,最近就在研究让 AI 辅助人类原画师设计怪物这件事。
  他的答案是:难,但不是同一种难。
  如今的 GAN 比如英伟达的 StyleGAN2,在生成怪物任务上存在一个大问题:
  只擅长改变画面的风格,但里面的怪物在人类看起来还是同一种。
  他开始思考,如何才能让 AI 创造出新的怪物?关键在控制噪声
  让 AI 生成怪物图像,首先要面对问题是数据集变了。
  像 StyleGAN 系列所用的高清人脸数据集 FFHQ 里面,有 7 万张人脸照片,而且都是大致朝向正面的大头照。
  虽然人的性别年龄肤色表情不一样,但好歹整体结构是相同的,都是一个鼻子两个眼。
  小哥用的怪物数据集是从 YGOPRODeck 上获取的卡牌游戏《游戏王》中的 1 万多张插画,其中可以算怪物的有 6800 张,这里面的怪物可是什么样都有。
  怪物的图片资源本来就少还要分成不同种类,全身画像在姿势上差异也很大,相当于是稀疏型数据集。
  数据集变了,算法也要相应的改变。
  先看看 StyleGAN 系列原版的算法。
  StyleGAN 一代继承自 ProGAN,采用渐进式训练,从 4x4 分辨率开始,每层训练到稳定再将分辨率翻倍,直到 1024x1024。
  ▲来自 Towards Data Science
  4x4 到 32x32 分辨率层的特征能改变姿势、发型、脸型、五官等能识别一个人身份的粗粒度特征。
  从 64x64 到 1024x1024 分辨率层就只能调整一下皮肤的颜色和皱纹斑点等细节特征了。
  同时 StyleGAN 系列又靠在每个分辨率层的卷积后添加噪声获得更丰富多样的面部特征,增强图像的质量。
  在初代 StyleGAN 论文中有这样一个实验:
  如下图所示,(a) 是在所有层添加随机噪声,(b) 是无噪声,(c) 是只在 64x64 分辨率及以上的层添加噪声,(d) 是只在 4x4 到 32x32 分辨率的层添加噪声。
  从结果可以看出,对于生成人脸来说需要在所有层上添加噪声。
  高分辨率层的噪声能够增加脸上和背景物体上的细节 (a、c 对比 b、d),低分辨率层噪声又控制头发的卷曲看起来不那么夸张 (a 对比 c)
  小哥在用游戏王数据集训练的 StyleGAN2 上做了同样的实验。
  结果发现,噪声对于生成怪物来说同样重要,但又有所不同。
  用无噪声方法生成的怪物图像在 FID 分数上惨不忍睹 (越小代表生成的图像质量越好)。
  在所有层加入噪声会好一些,而只在 32x32 分辨率以上的层加入噪声效果会更好。
  这是因为稀疏型的怪物数据集特征太杂太多,画面还是全身的,噪声改变一点点很容易就面目全非。
  等一下,这难道不就创造了新的怪物么?
  仔细看上图,生成的几种怪物质量并不算高,容易出现不完整的特征和几种不同类型的特征胡乱拼凑。
  修改噪声得到的图像还不可控,因为噪声是随机生成的,不同噪声对最终结果的影响也是不可解释的。
  去掉低分辨率层的噪声这个方法,可以减少噪声对怪物图像粗粒度特征的影响,获得高质量图像图像的同时也保留了通过改变噪声获得随机细节的能力。
  现在有了适用于生成怪物的魔改版 StyleGAN2,最开始那个问题,让 AI 设计出新的怪物要怎么做?
  其实还是靠去掉低分辨率层的噪声,这么一个简单的改动就能解决。可控的创新
  还是先看一下之前的做法。
  StyleGAN2 的后续研究中,阿尔托大学提出了 PCA 方法 (Principal Component Analysis,主成分分析)。
  通过 PCA 可以在隐空间中找到代表某种特征变化的方向,沿着特定方向修改隐变量 (latent variables) 能做到独立可控制的修改人脸特征。
  如果在生成怪物任务上沿用在所有分辨率层添加噪声的训练方法,PCA 的效果又不行了。
  此时改变隐变量反倒成了对风格的修改,怪物看起来还是同一种。
  改了,但没完全改。
  在低分辨率层不添加噪声的训练方法再次发挥了作用。
  少了低分辨率层噪声的干扰,PCA 方法更容易找出有意义的修改方向,让 AI 在中间一列原图的基础上设计出新的怪物。
  还提出实用 Workflow
  另外值得一提的是,这位小哥不愧是在大公司实际业务上锻炼过又回到学术界的,写论文不忘了探讨一下如何打造方便一线设计师操作的工作流程。
  比如将魔改版 StyleGAN2 部署到 A100 上推理时间平均可达 0.05 秒,能满足即时操作的要求。
  再用 Streamlit 工具可以用很少代码创建交互式的图形界面,用滑块一类的控件方便地调整参数。
  论文最后展示了使用 GAN 中常见的截断技巧 (Trunction)、风格混合和 PCA 方法结合,是怎么一步步设计出新的怪物的。
  论文一作 Vaibhav Vavilala 来自伊利诺伊大学厄巴纳-香槟分校。
  他的导师是 CV 大牛 David Forsyth,《计算机视觉:一种现代方法》的作者。
  论文地址:
  https://arxiv.org/abs/2108.08922
  参考链接:
  [1]StyleGANhttps://arxiv.org/abs/1812.04948
  [2]StyleGAN2https://arxiv.org/abs/1912.04958
  [3]PCAhttps://arxiv.org/abs/2004.02546
  [4]https://towardsdatascience.com/progan-how-nvidia-generated-images-of-unprecedented-quality-51c98ec2cbd2

机器人堆叠研究新进展,DeepMind提出新基准10月13日消息,人工智能研究实验室DeepMind近日为提高机器人的物体堆叠能力提出新基准。DeepMind的研究小组通过RGB堆叠技术(RGBStacking)对机器人进行强化半年时间拍摄8省市10个案例,聊聊智能中国究竟是什么2021年年初,我们决定到各个行业的一线,拍摄关于智能中国的故事。如今,自媒体做视频似乎已经是大势使然。但作为一家以AI为主线的科技自媒体,实在觉得对着镜头读稿子没什么意思。AI这OPPOWatchFree智能手表发布全场景睡眠监测,仅重33克,售价549元IT之家9月26日消息今天下午OPPO举行未来玩机发布会,正式发布了OPPOK9Pro智能手机OPPOWatchFree智能手表OPPO智能电视K975英寸等一系列新品。硬件方面,助力听障用户,小米展现小米闻声小爱伴读声音游戏等技术IT之家10月28日消息,小米公司近期开展了小米技术嘉年华活动,现场展示多种前沿技术。根据官方报道,小米为帮助听障残疾人士,开发了小米闻声小爱伴读声音转换技术,以及UWB一指连电梯99元,小米米家电水壶2正式开售7字型手柄设计,1。7L容量IT之家9月24日消息今日,小米米家电水壶2正式开售,采用7字型手柄,拥有1。7L容量,售价99元。IT之家了解到,米家电水壶2采用7字型手柄,放下水壶到按下开关距离缩短,配置18到手价2399元,小米米家扫拖机器人2Pro开启预售支持高频声波震动拖地IT之家9月1日消息今日,小米米家扫拖机器人2Pro开启全渠道预售,到手价2399元。IT之家了解到,米家扫拖机器人2Pro搭载新一代LDS激光导航系统,同时标配一个500mL独立小米米家扫拖机器人2Pro正式发布5200mAh电池声波震动拖地,到手价2399元IT之家8月31日消息今日,小米正式发布了米家扫拖机器人2Pro,内置5200mAh容量电池,支持与小爱语音联动,预售到手价2399元,将于明日(9月1日)全渠道开启预售。拖地方面小米负责人在线活动今晚举办智能穿戴专场四位负责人答疑IT之家7月21日消息今晚小米社区正在举办负责人在线活动稳定性专场,解答对于小米智能穿戴设备的问题,时间为20002100。可穿戴部总经理高原可穿戴部副总经理程亮可穿戴部高级测试工英伟达NVIDIACloudXR已集成在VMwareWorkspaceONEXRHub中IT之家10月16日消息,NVIDIA和VMware近日宣布推出WorkspaceONEXRHub,可帮助企业将XR串流传输至云端。该产品还集成了NVIDIACloudXR。IT之立减130元天猫精灵方糖R智能音箱69元新低IT之家1月30日消息2019年4月18日,阿里巴巴人工智能实验室发布了天猫精灵CC天猫精灵方糖R两款产品,方糖R建议零售价199元,现特惠价69元,点此购买。方糖是天猫精灵家族产IT之家开箱天猫精灵方糖2金砖版智能音箱图赏天猫年货节,天猫精灵宣布与20多家智能家居合作伙伴推出了多款数字年货,其中就包含土豪味儿十足的天猫精灵智能音箱方糖2金砖版,IT之家已经拿到了这款产品,为大家带来开箱图赏。这款定制
IBM将建新AI研究中心,旨在开展颠覆性研究项目北京时间2月19日消息,IBM将在巴西圣保罗建立一个专注于围绕AI解决方案开发的研发中心,对一些具有颠覆性的项目进行研究,有可能促进人工智能领域的模式发生转变。该中心将是IBM人工IT之家开箱小米小爱触屏音箱Pro8图赏8英寸屏幕够大!IT之家12月18日消息此前小米官方宣布了小爱触屏音箱Pro8正式发布,这款集成了平板的音箱采用8英寸屏幕,配备50。8mm钕铁硼内磁扬声器,正式售价599元,首发价499元。现在天猫精灵发布智能垃圾分类系统,可自动适应不同城市要求IT之家9月6日消息今日,阿里人工智能实验室公布一项内部代号为浣熊的智能垃圾分类系统,可根据不同城市垃圾分类标准,自动识别上万种常见垃圾,并进行垃圾分类的智能系统。目前,智能垃圾分Digitimes采用microLED的智能手表将于2020年上市IT之家6月26日消息根据台湾媒体Digitimes的报道,RiTdisplay(铼宝)预计,全球首批采用microLED显示模块制造的microLED智能手表将于2020年上市。外媒看三星人造人路还很长1月15日消息,据国外媒体报道,三星旗下StarLabs实验室在2020年CES上带来了最新的虚拟人项目Neon,在业内引起了一片轰动。但是该演示项目并没有整合人工智能大脑,功能显韩国首尔将安装3000个AI摄像头可判断是否有尾随IT之家1月3日消息韩国电子与电信研究所称,将在今年7月前在首尔瑞草区率先安装3000个可预测犯罪的AI摄像头。据悉,这些摄像头可监测路人的位置出现时间和行为模式,判断拍摄对象是正AI发明家申请专利遭拒不属于人类IT之家1月3日消息据腾讯科技报道,去年由Surry大学教授瑞安阿伯特领导的九人小组在向美国英国和欧洲专利局提交了人工智能机器人设计的专利。不过,英国知识产权局和欧盟专利局都拒绝了FBIWarning智能电视存隐私泄露风险,长期被忽视IT之家12月2日消息之前曾有报告称智能电视存在隐私泄露的风险,近日美国联邦调查局也发布警告称相关的智能电视产品存在着对用户个人隐私泄露的风险。11月26日,美国联邦调查局波特兰总外媒AppleWatch4心电图功能即将上线,苹果已经开始培训员工11月29日上午消息,外媒报道称,苹果公司已经开始给员工发内部培训文件,让自己员工先熟悉AppleWatchSerise4的心电图功能,此功能预计将在watchOS5。1。2中正式三星LG领衔Q3全球电视市场,两家国产品牌进前五IT之家11月22日消息据韩国先驱报的消息,IHSMarkit公布了今年第三季度的最新全球电视市场份额。其中数据显示,三星LG两家韩国企业仍然是这一领域的主导力量。IT之家获悉,7首次跌破3000元,小米电视4A65英寸明日0点抢购价2949元IT之家11月10日消息在双11期间,小米电视4A65英寸迎来新的优惠,原价3399元,预约11月11号0点2949元限时限量抢。小米电视4A65英寸采用4KHDR显示屏,内置2G