硬件光追进入新阶段,Imagination推出DXT系列GPUIP
作为GPU皇冠上的明珠,实时光线追踪技术近年来得到了迅速发展。
然而并不是所有的光线追踪体验都是一样的,正如GPU IP供应商Imagination所说,光线追踪技术可以细分为很多层级,其中第一级光线追踪技术通过软件实现,CPU占用资源较高。第二级光线追踪技术是利用硬件处理光和或者三角形碰撞,从而节省了CPU资源,目前典型的桌面显卡都是采用了这项技术。第三级光线追踪技术开始,就需要支持BVH回溯。BVH是bounding volume hierarchy,这是一种用来管理3D场景中物体的方法。这部分是目前渲染器中最困难的部分,但是可以是渲染器更加高效。第四级光线追踪技术除了光和自动测试的回溯之外,还需要相同光线上的光数统一计算,用统一的指令运行。而第五级技术则需要支持BVH builder,目前作为公司的储备技术。
高级光线追踪技术需要更新的硬件
如上图所述,Imagination认为,从CXT GPU IP开始,光线追踪技术就已经进入到第四级。
日前,Imagination宣布推出IMG DXT系列GPU,将移动设备的光追体验带入到了新阶段。尤其是如今,手机性能越来越高,在手机上玩3A大作已经不再是一种幻象。由此,玩家越来越需要沉浸且流畅的体验、真实的画面、以及更小的发热及更长的待机功耗,所有这些都对GPU有了全新的要求。
总体而言,这款GPU可以从节省面积的0.5 RAC(光线加速集群)配置扩展到高性能的4 RAC设计,涵盖从混合实现方案中的简单阴影到3A大作中的高级光追画面等各类应用。
"通过DXT,可以让光线追踪技术可以尽快铺开,哪怕只有0.5个RAC,也可以快速覆盖市场,从而让真正的内容开发者愿意去进行光线追踪相关开发。"Imagination首席营销官David Harold说道。由于如今手机的光线追踪大部分还是软件实现的,因此无论是资源占用还是功耗,都还不能商用化。
同时,为了快速实现光追技术,Imagination同行业、客户以及合作伙伴,包括手机厂商和游戏厂商共同合作,通过推出PVR2等工具,简单部署光线追踪技术。
DXT详解
旗舰产品DXT-72-2304能够提供超高端移动设备所需的性能,具有72 GTexels/s和2.5 TFLOP FP32算力。与上一代产品相比,其最大单核性能提升了50%。DXT核的单位面积性能密度比IMG CXT GPU高出20%,同时大幅降低了功耗。
如图所示,在可配置内核上,最大的单核配置从CXT-64-2048升级到DXT-96-3072,单核性能提高了50%。并且拥有可选择的光线追踪RAC。
DXT目前包括三个系列。分别面向主流、高端以及旗舰型,提供不同算力、像素填充率以及光线追踪RAC等。
如图所示,不同公司的光线追踪技术有着明显差别,那么为什么Imagination的DXT系列可以一枝独秀?官方透露了几个黑科技。
支持Vulkan的片段着色率(FSR)技术
片段着色率(Fragment Shading Rate,FSR)(在DirectX中也称为可变着色率VRS)是一种可以提高图像表现并降低功耗的技术。FSR允许共享着色器程序的执行结果跨多个片段。因此,不是1:1执行着色器程序,这意味着一个着色器可以覆盖更多像素的区域,从而实现了更高的性能、更低的带宽和更低的功耗。
Imagination表示,开发者可以控制FSR的使用力度,最极端的情况下甚至可以对一个4x4的片段区域只执行一次着色器代码,这意味着只需1/16的资源,从而使工作负载减少近94%。
FSR可以在用户不太注意的地方复用,从而节约资源。另外,FSR功能也适用于光线跟踪。因为着色器调用需要发射的光线更少,因此提交的光线更少并且结果在较大的像素区域上被重新使用。
如图所示,我们可以看到在周边区域,可以运用更多的4X4单元统一着色,而在需要光线追踪的地方,应选择更细致的着色。而缩减光线数量,基本在图像表现上看不出差异。
2D双速率纹理处理
许多先进的游戏依靠大量纹理取样实现高级过滤效果。IMG DXT GPU的纹理处理单元(TPU)内置一个已获得专利的创新特殊模式,能够为这些后处理效果创建一条"快速通道",在使双线性滤波性能几乎翻倍的同时,最大程度地减少面积的增加并降低整体功耗。该GPU不但可以加速诸如游戏后处理和计算图像学应用中的滤镜效果;更高的吞吐量也有助于实现更快、更低功耗的降噪算法,提高光追画面的质量。
数据显示,许多游戏花费大量资源执行后处理算法,以实现景深、光华和模糊等效果。最在这些后处理过程中,纹理采样的重过滤效果在运算逻辑单元(ALU)执行,因此受到TPU瓶颈。解决这一问题的简单方法是增加TPU单元的数量与USC/ALU的比例。然而,这不是好的策略。首先,在常规渲染过程中,ALU与TPU的比率已经是最佳的了。同时,带宽也无法足够满足更多TPU的吞吐率需求。而Imagination的技术可在保持整体平衡的同时,将执行效率提升一倍。
RISC-V技术支持
Imagination持续投入RISC-V的研发,将其成果应用于其产品线中。DXT中使用的遵循RISC-V协议的固件处理器,可以实现40%的固件性能改善,并且该固件已经在其汽车GPU BXS系列产品中得到验证。IMG DXT还受益于RISC-V的电源域特征,把重点放在降低空闲功率关闭不使用的GPU部分和优化随机工作负载性能上。
Pipeline Data Master技术
Imagination的PowerVR GPU从一开始就由固件处理器驱动。固件处理器负责工作负载的高级调度和优先级,允许并发处理不同类型的作业PowerVR GPU具有每个作业类型的数据主控器,计算和2D(或数据移动)。
如示意图所示,通过更紧凑的任务调动,可以使处理器始终在运行提前准备好的数据,从而带来全域5%的画图和计算性能提升。
ASTC HDR支持
Imagination此前已支持Khronos Vulkan API要求的自适应可缩放纹理压缩(ASTC)的低动态范围(LDR)。但是ASTC的高动态范围模式还不能支持。DXT系列新增的HDR功能,可以捕获更多的纹理信息,提高可视范围。
如图所示,从暗到亮,HDR支持可以展现更多细节。
总结
凭借着在光线追踪技术的领先,Imagination实现了GPU IP的准确定位,在如今竞争激烈的市场中,可以与其他便携甚至桌面级供应商扳一扳手腕。Imagination通过推出更具性价比,更低功耗,更高性能的DXT系列,意图将光追技术迅速普及开,从而在GPU市场中继续保持差异化的领先性。
人到中年,真的是输不起已经拥有的东西,很多人往往不知道珍惜,比如我们的工作,总是听到有人抱怨干活多,待遇低,工作环境差,周围一群猪队友,恨不得立刻逃之夭夭。盼星星盼月亮,掰着指头算时间,期待退休的日子有
人到中年,还有酒肉朋友陪伴,已经很不容易了,有没有道理?秋日生活打卡季人这一辈子每个阶段都会有不同的朋友相伴,但是有一种朋友就是经常在一起吃吃喝喝的,被称为酒肉朋友的朋友,却一直被人所诟病,被认为是朋友中不值得交往的。不过很多人到中年的
民间故事马夫半夜喂马,听到两个人对话,他躲进地窖逃过一劫头号创作家明朝时期,安徽省凤阳县有一个吴家庄,庄里住着一个孤寡老人吴老汉,吴老汉父母去世得早,他是吃百家饭长大的,因为家贫,五十多岁了依然是孑身一人。吴老汉从小得到别人的帮助,他非
人到中年最好的修行强者不争,慧者不露著名作家余秋雨说过人的生命格局一大,就不会在琐碎妆饰上沉陷。人生,不过就是一场修行,生活之所以充满痛苦,只因自身格局不大。强大的人,不一定都会成功,但成功的人,一定有大格局。真正厉
人到中年,拼的就是这三样,别不信李家有话说阅读本文前,点击上方卡片一键关注作者李家有话说图片来源网络逆水行舟,不进则退人这一生,究竟在追求什么?这个答案可能多种多样,一千个人会有一千个不同的回答。有些人终生都在追
金鹰收视夺冠,王珞丹长发惊艳,热依扎顾盼生姿,殷桃绝美揽大奖原创202211071654肥罗大电影金鹰奖尘埃落定,人世间和觉醒年代赢麻了。而金鹰奖闭幕式颁奖典礼,也一举拿下0。79的收视,成为同时段收视冠军。随着飞天奖金鹰奖接连公布,本年度
一个冲动的巴掌,毁掉了自己的家庭,教你对付熊孩一招人民网掌掴男童者打碎自己的前程近日,有南京市民鲁某某因自己幼儿园孩子与同班同学打闹擦破头皮,遂上门掌掴5岁闯祸孩童,致其受伤倒地,且将孩童祖父打致骨折。警方通报称,对鲁某某予以刑事
练习和烦恼做朋友以我自己来说,是如何跟烦恼相处处理烦恼的呢?我其实也花了很长时间,例如嗔恨我花了五六天时间,学习如何去和情绪嗔恨去沟通,学习认识自己的情绪,我发觉,很多时候,问题的根源在于,我们其
真正的朋友世间广义的朋友人人都有,而最值得珍惜的朋友,才是真正的朋友。这样的朋友你有吗?真正的朋友,应该是这样不分地域,不分男女不分老幼,不分尊卑。不分贫与富,不分高与低不管远与近,无论得与
财商升级完整的家庭理财规划包括哪几方面?正文共1835字,预计阅读时间5分钟理财规划就是根据一个人的财务和非财务状况,运用规范方法并遵循一定程序为制定切合实际可操作的某一方面或一系列相互协调的规划方案。个人理财是基于人的
这样做馅包子更鲜香多汁有嚼劲猪肉丁发面大包子这么多年做包子馅的方法原来都不对。以前总认为包子馅应该和饺子馅一样,用绞肉机把肉绞好,然后配上切好的菜,拿来做包子馅即可。导致包出的包子无论味道,还是口感,都不好,