范文健康探索娱乐情感热点
投稿投诉
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文
国学影视

99行代码实现冰雪奇缘特效的太极再进化,胡渊鸣团队快手联合打造

  机器之心报道
  机器之心编辑部
  99 行代码实现《冰雪奇缘》特效的续集来了,太极编译器再次升级。
  得益于计算机仿真技术的不断发展,我们能够在电脑中重建越来越逼真的现实世界,制作出《冰雪奇缘》等优秀的特效电影。
  但逼真的场景、丰富的细节离不开超高精度的物理模拟,因此特效的每一帧几乎都是用经费烧出来的。
  现代动画电影(包括《冰雪奇缘》等),经常使用基于物理的动画生产特效,丰富感官的体验。基于粒子的表示是其中常用的方法。场景越大,粒子就越多。比如,要模拟一个 300 米长的溃坝场景中的水,可能会需要数千万粒子,而这些粒子的存储需要大量显存。比如说,如果需要96GB的显存,则需要购置大量高端显卡,如 4 块 NVIDIA Quadro P6000 GPU。
  哦,对了,一块 P6000 在 Amazon 上的售价约为 4000 美元,而这样的 GPU,你要买 4 块。显然,这个成本不是普通家庭能玩得起的。
  针对这一现状,快手、麻省理工、浙大、清华的研究者进行了物理编译器自动量化方面的研究,提出了一套用于量化模拟的新的语言抽象和编译系统——QuanTaichi。它可以使用低精度量化的数字数据类型并将其打包(packing)以表示模拟状态,从而减少了内存空间和带宽消耗。有了这项技术的加持,高精度的物理模拟只需要一块 GPU 就能实现。
  QuanTaichi 的实现基于 MIT CSAIL 胡渊鸣等人之前提出的「太极(Taichi)」编程语言和编译器,使开发人员可以轻松地在不同的全精度和量化模拟器之间进行切换,以探索最佳的量化方案,并最终在空间和精度之间取得良好的平衡。相关工作已经入选图形学顶会 SIGGRAPH 2021,也已经被合入到了太极的开源 Github 库中。
  论文链接:https://yuanming.taichi.graphics/publication/2021-quantaichi/quantaichi.pdf 项目地址:https://yuanming.taichi.graphics/publication/2021-quantaichi/ GitHub 地址:https://github.com/taichi-dev/quantaichi
  下面这个视频展示了量化后的仿真结果。两只兔子形烟雾(4亿体素)演化的逼真程度和全精度浮点数的结果不相上下。但需要指出的是,这个 demo 需要的存储空间仅为全精度浮点数模拟的二分之一!
  为了验证结果,研究人员还做了一些用户调研,测试题大致如下。你能分辨出哪个是量化后的吗?
  同样的技术还可以应用在手机端,使得物理模拟在手机端提速 40%,让运算能力不太强的手机运行更复杂的效果。
  总体来看,QuanTaichi 不仅可以在通用 GPU 计算领域大幅提升研发效能,助力游戏中的物理模拟、大尺度图像处理、媒体编解码、科学计算等方向,还适用于太极平台上应用的各类模型,能够提升存储空间的使用效率,也有助于太极技术生态的未来发展。
  目前,太极技术已经让快手成为首个推出实时液体及烟雾模拟动态效果的短视频和直播平台,行业首发了「别哭鸭」、「我要去潜水」、「火焰超能力」等特效。其中,「圣诞快乐」魔法表情成为爆款,有 74 万用户拍摄并上传了视频,大约有两千多万用户观看了太极支持的这款魔法表情。
  技术细节
  用于模拟的量化数字数据类型
  在 QuanTaichi 中,研究者提出了以下几种自定义数值类型:
  1. 自定义整数类型(Custom Int)由用户指定位数的整数类型,包括有符号类型和无符号类型;
  2. 自定义浮点数类型(Custom Float):由用户指定位数的浮点数类型,QuanTaichi 为其提供了三种实现: 定点数类型(Fixed-point):定点数使用一个自定义整数加一个缩放因子表示,读取乘以缩放因子实现整型数到浮点数的转换;读取时做相反的操作;
  普通自定义浮点数类型(Floating-point):由用户指定的小数和指数部分组成;
  共享指数浮点类型(Shared exponent):同样由用户指定的小数和指数部分组成。与普通自定义浮点数类型不同的是,该类型会共享同一个指数部分。物理模拟中的数据通常具有物理含义,当某些数值的绝对值显著大于其他值时,较小的数值通常影响不大。比如:考虑三维速度(u,v,w),当 x 方向的速度的绝对值远远大于其他两个方向时,v 和 w 的数值并不会对模拟造成显著的影响。
  下图是三种自定义浮点数在内存中的组织形式示例:
  位适配器类型
  当前的计算机体系结构并不支持任意位长度的数据读写和计算,因此,研究者在 QuanTaichi 中提出了两种位适配器:
  1. 位结构体(Bit structs)。位结构体允许用户使用多个不同的自定义类型数据(如 custom int 5、custom float 12 等)填充一个完整的计算机硬件原生支持的类型(如 32 位整数等)。
  2. 位数组(Bit arrays)。位数组允许用户在一个硬件原生类型中存储多个同样的自定义类型数据。
  编译器优化
  1. 位结构体融合存储
  这种优化的核心思想是分析 Kernel 的计算流程,将 bit-struct 内部的成员变量尽可能批量写入,减少原子性内存访问次数。
  在实际应用中,一个位结构体中的字段经常一起访问,因此一个位结构体的不同组件很可能被一个 kernel 中的多个语句存储。在这种情况下,研究者对该位结构中的所有存储使用一个 atomicRMW(atomic read-modify-write), 以减少内存访问开销。
  2. 线程安全推断
  判断操作是否为线程安全,如果本身是安全的,则不用费时的原子写操作。QuanTaichi 支持两种访存模式的优化: 按元素访问(Element-wise accesses)。在并行模拟器中,许多操作以「元素」方式进行:每个独立线程一次处理一个粒子或体素,与粒子或体素相关的内存加载 / 存储完全不受数据竞争的影响。在这种情况下,可以安全地使用非原子操作来执行内存加载 / 存储; 位结构体整体存储(Storing the entire bit struct)。之所以使用 atomicRMW 而不是非原子操作,是为了避免原子位结构体中的部分位被程序并发修改。但当位结构体整体存储时,我们并不需要担心这一问题,因此可以使用非原子操作代替计算代价昂贵的 atomicRMW。
  3. 位数组向量化
  考虑以下情形:
  虽然该研究中的系统可以很容易地提高存储效率,但是这种按位 for 循环的计算效率很低,原因有两个。首先,我们必须为模拟的 1 位数值使用硬件原生的 32 位整数寄存器,这只使用了操作位宽度的 1/32。其次,当逐位存储结果时,为了线程安全,代码生成器必须发出大量昂贵的 atomicRMW 操作,因为多个 CPU/GPU 线程可能会在一个 u32 中写入不同的位,从而导致数据争用。为此,研究者实现了以下三种优化方法:按位进行循环向量化;带有偏移量的位向量化读取;位向量化的整数加法。对位数组加载、存储并对算法进行矢量化,以便每次迭代都处理一个完整的 32 x u1 位数组,而不是单个的 u1。
  实验结果
  「生命游戏」测试
  研究者首先在「生命游戏」上测试了他们的系统。生命游戏是一个二维网格游戏,这个网格中每个方格居住着一个活着或死了的细胞。一个细胞在下一个时刻的生死取决于相邻 8 个方格中活着或死了的细胞的数量。如果相邻方格活着的细胞数量过多,这个细胞会因为资源匮乏而在下一个时刻死去;相反,如果周围活细胞过少,这个细胞会因为孤单而死去。
  每个细胞的「生」或「死」两种状态可以用一个位来表示。在 C 语言等传统语言中,用户必须使用 char (u8) 类型来表示细胞状态,除非他们手动打包 / 拆封这些状态。但在 QuanTaichi 系统中,用户可以在不修改任何计算代码的情况下将存储效率提升至原来的 8 倍。
  OTCA 元像素是「生命游戏」中的一种特殊结构,该结构由 2048x2048 个细胞组成,其整体行为与单个细胞行为一致。研究者在单张 NVidia RTX 3080 Ti (10GB) 上实现了 70 x 70 个 OTCA 元像素,即超过 200 亿个细胞的生命游戏模拟。
  欧拉流体模拟测试
  研究者实现了一个基于稀疏网格的 advection-reflection 流体模拟求解器。通过量化方法,他们成功地将每一个网格所需的存储空间从 84 个字节压缩到了 44 个字节。在 NVidia Tesla V100(32GB)上,他们实现了超过 4.2 亿个激活稀疏网格的烟雾模拟。下图分别是量化的方案和模拟结果。
  MLS-MPM 算法测试
  研究者选择了 MLS-MPM 算法测试他们的系统在混合欧拉 - 拉格朗日方法上的有效性。具体来说,他们选择了一种量化方案,使得每个粒子消耗的存储空间从 68 个字节下降到 40 个字节。在 NVidia RTX 3090 上,他们实现了超过 2.3 亿个粒子的弹性体模拟。下图分别是量化方案和模拟结果:
  由于 iPhone 的 GPU 对整型运算增加了额外的优化和加速,因此研究者还在移动设备(iPhoneXS)上测试了量化后的 MLS-MPM 的表现。与台式机相比,移动设备的计算能力相对有限,并且对实时响应有强烈的需求。因此,它们通常只能运行小规模的模拟,存储并不是真正的问题。但在测试中,研究者惊讶地发现:在背景网格上使用量化数据类型仍然是有提升的。因为移动 GPU 通常只支持 32 位整数的高性能原生 atomicAdd,而并不原生支持浮点数的 32 位 atomicAdd。使用「ti.quant.fixed(fration=32)」表示网格数据可以将软件模拟的 32 位浮点数 atomicAdd 转换为硬件原生的 32 位整数 atomicAdd,显著提高了在 iPhone XS 上运行的 MLS-MPM 程序的 P2G 性能。

你的微笑,是我心底永远的暖你的微笑是映入眼帘的是一朵娇艳是雨后炫目的阳光璀璨是果蔬飘香是天际蔚蓝是来自幽谷的溪流缓缓沁润我声声呼唤莫名喜欢你甜甜的笑颜眸光闪闪温柔了长久的期盼自从遇见了你不再寂寞孤单拭去眼角搭载华为海思麒麟(Kirin)710F荣耀20青春版说起华为大家都不陌生,华为旗下好几个品牌做手机,今天小编就给大家来讲讲搭载华为海思自研处理器芯片麒麟710F的荣耀20青春版这款手机。荣耀20青春版手机使用了华为海思自研处理器麒麟惠普星14青春版超薄笔记本电脑小编今天要说的这款去年3月份上市的惠普星14青春版笔记本电脑,这是一款比较轻薄便携的适合商务学生党使用的笔记本电脑,笔记本电脑整体机身重量1kg1。5kg左右。该笔记本电脑搭载第1星光不问赶路人,青春泣血,生命绽放光芒!任正非总裁办电子邮件电邮讲话2021006号签发人任正非星光不问赶路人任正非2021年01月22日克劳塞维茨在战争论中讲过伟大的将军们,是在茫茫黑暗中,把自己的心拿出来点燃,用微光照亮队五四青年节,致敬青春!!轰动全球的一篇短文青春千万不要动不动就说自己老了,错误引导自己!年轻就是力量,有梦就有未来!五四青年节,致敬青春!!德裔美籍人塞缪尔。厄尔曼70多年前写的一篇只有四百多字的短文。首次发表的时候,引起世界互联网本来就是青春饭追逐利润率最大化,这是职场铁定不变的规则,当平台想抛弃你的时候,甚至连声招呼都不打的。而这些大龄的失业者短时间内根本是不容易找到工作的。估计很多大龄应聘者都遇到这样的窘境。抱歉!这当我老了唯一心中藏有我的青春记忆多么希望,在远离红尘喧嚣的青山绿水旁,能和你有一座房子,不需要很大,屋后植果树,房前种花草,要有一扇窗子,我每天清晨,坐在窗前的阳光里写字,然后一抬头,便能看见窗外向我微笑的你,这青春的邂逅那一次的邂逅让我流连忘返那一次的美丽存留心间那一次的泪流婆娑涓涓绚丽的灯光下面裙裾飞扬,红男绿女的翩翩舞姿忽隐忽现,那一刻的流光溢彩总像是梦幻!惊诧之间一只小女轻撞了我一下,怒火之破吉尼斯纪录,狂赚1。68亿,李子柒让我看到了很真实的一幕网络时代,总少不了各种在网络上卖艺,以此来赚取流量的网红,最常见的是在网上直播,比如美食美妆等等。在众多网红中,美食主播李子染算是最成功的一位。和其他直播的喧闹相比,李子染视频里的健澜科技2015西湖论健国际高峰论坛AI改变医疗行业2015西湖论健国际高峰论坛2015西湖论健TM国际高峰论坛,于2015年10月16日17日在杭州黄龙饭店隆重举行。作为第十七届杭州西湖国际博览会中的开幕论坛,西湖论健TM就智慧医健澜科技让科技回归医疗本身2016西湖论健国际高峰论坛健澜科技让科技回归医疗本身2016西湖论健国际高峰论坛让科技回归医疗本身2016西湖论健国际高峰论坛2016WestLakeInternationalMedicalForum201
数名中国留学生在英国谢菲尔德遇袭,警方已拘捕一名犯罪嫌疑人据中国驻曼彻斯特总领馆微信公众号消息,近日,数名中国留学生在谢菲尔德遇袭。中国驻曼彻斯特总领事馆强烈谴责针对中国留学生的暴行,对受害同学进行了慰问,中国学联和侨界也对受害同学给予及长七火箭承前启后,为大国重器扛起家族栋梁既然是说长征7号,那就从长征系列火箭说起吧。新中国在一穷二白的基础上建立起来,最明智的决策一定是两弹一星计划。核武器使中国拥有了无法撼动的威慑力量,卫星与火箭则极大提高了中国科技与畅俊善(原创)看郑州暴雨文畅俊善天水肆横流,黄河泽郑州。城乡千里溢,隧道万车浮。黑发何堪受,不忘初心休。正是青中力,定斩水龙头。2021。7。23日于中国威海作者简介畅俊善笔名自立均善松岩健康导报编辑记者美国研究沈雅梅塔利班的胜利归因于谁?美国不断甩锅缺乏自省沈雅梅塔利班的胜利归因于谁?美国不断甩锅缺乏自省作者沈雅梅,中国国际问题研究院美国研究所所长来源中美聚焦微信平台编辑周悦阿富汗变局无疑是拜登执政以来的第一场外交溃败。绝大多数美国人玩珠子,看见老琉璃却不认识?老琉璃不仅仅是一种材质,也是一种古老的文化传承。极品红色老琉璃珠一对(风化完美)琉璃,是在中国传统玻璃工艺基础上发展起来的特种工艺美术品。根据广雅和韵集的记载,在相当长的一段时间内美国研究约瑟夫奈911事件带来大变局,美国今后仍需努力反恐约瑟夫奈911事件带来大变局,美国今后仍需努力反恐来源尚道战略微信平台编辑周悦2001年9月11日爆发的恐怖袭击,可谓一次震惊全人类的恐怖事件。被困受害者从双子塔跳下的画仍历历在目美国研究肖河9。11事件20年,美国站在新的十字路口肖河9。11事件20年,美国站在新的十字路口作者肖河,中国社科院世界经济与政治研究所副研究员来源世界知识2021年第17期世界知识微信平台编辑周悦光荣不再,梦想破灭,这是威廉曼彻斯七子之歌中的七子分别是现在的什么地方广州湾(今广东省湛江市),1899年至1945年间被法国强行租借。威海卫(今山东省威海市),1898年至1930年间被英国强行租借。旅大(今辽宁省大连市),1895年至1945年间孟晚舟事件百年未有之大变局的缩影9月25日22时14分,中国公民孟晚舟乘坐的中国政府包机抵达深圳宝安国际机场,舱门打开,孟晚舟走出机舱,挥手致意。孟晚舟在机场发表简短讲话,她表示有五星红旗的地方,就有信念的灯塔。10种最致命的毒蛇与其中一种爬行动物相遇可能会让您丧命。它们发出嘶嘶声,它们滑行,不幸的是,对于人类和毫无戒心的猎物来说,它们会咬人。根据世界卫生组织的数据,蛇每年咬伤约540万人,导致81000至被骗三年,近11亿,比亚迪广告门事件终于迎来大结局最近,在三年前引起不小轰动的比亚迪广告门事件又有了后续的发展涉事人双面李鬼李娟因合同诈骗罪获刑这件事也终于迎来了大结局可能有很多人对当时的事件不是那么的熟悉这里小编就为大家简单梳理