七彩虹战斧GeForceRTX4090豪华版首发评测争当AI
在NVIDIA公版FoundersEdition解禁一天后,又到了非公版全面开花的时间点。GeForceRTX4090FE可以千篇一律,但使用旗舰级显卡的用户却有着各种各样的要求,这时候就是该AIC厂商发挥实力的时候了。那么有没有一款RTX4090定位与FE公版相同,但更容易买到,且沉稳低调的型号呢?眼前的七彩虹战斧GeForceRTX4090豪华版似乎就给了一个很好的例子。
虽然没有iGame那般张扬的外形和RGB,但七彩虹战斧GeForceRTX4090依然是实打实的三槽设计。厚重的散热模组设计,时刻都在暗示里面装载着当下最强GPU,搭配经典的战斧系列红黑配色,有了一种西装暴徒的即视感。
那么与FoundersEdition看齐的七彩虹战斧GeForceRTX4090豪华版表现究竟如何?现在就让我们献上首发评测。
来自AdaLovelace的核动力
AdaLovelace名字背后多少带着一些传奇色彩,她是英国数学家,以及拜伦之女,整理阐述分析机文章后,建立了沿用至今循环和子程序概念,并在180年前预言了计算机用途将不限于计算,同时也成为了世界上第一个编译器发明者,被誉为程序之母。用来作为新一代的消费级GPU代号,也正好与商业CPUGPU的GraceHopper遥相呼应。
七彩虹战斧GeForceRTX4090正是使用的是代号AdaLovelace,型号AD102300A1的GPU,NVIDIA利用台积电4N定制工艺和改良的电路设计进一步扩大了芯片规模,时钟频率为2。52GHz,是以往NVIDIAGPU都未曾达到的高度。但同时TGP功耗则可以做到与GeForceRTX3090Ti相当,同样为450W,相当于GeForceRTX4090的每瓦性能是GeForceRTX3090Ti的2倍。
从整体上看,完整的AD102包含了12个图形处理集群(GraphicsProcessingClusters,GPC),72个纹理处理簇(TextureProcessingClusters,TPC),144个流式多处理器(StreamingMultiprocessors,SM),以及搭配了12个32bit控制器的显存接口,共计384bit。
但由于AD102300A1禁用了1个GPC核心,七彩虹战斧GeForceRTX4090总共包含了11个GPC,64个TPC,128个SM,16384个CUDACore,512个第四代TensorCore,128个第三代RTCore。这里不妨让我们放出GeForceRTX4090与GeForceRTX3090Ti,GeForceRTX3090的规格进行对比:
在核心结构上,AdaLovelace最大的变化是相对Ampere架构增大了L1和L2缓存,其中L1缓存可以达到18,432KB,比Ampere的10,752KB多出71。4。总共98,304KB的L2缓存,也比Ampere的6144KB提高了16倍,这让光线追踪,尤其是路径追踪从中获得巨大收益,最终让第三代RTCore的射线三角形求交测试模块数量直接翻倍。
NVIDIA增大缓存容量是有原因的。我们知道从GeForceRTX时代开始,RTCore与TensorCore性能成为了GPU实现实时光线追踪技术以及DLSS深度学习超采样技术的关键。
第三代RTCore在第二代RTCore的基础上,再次将射线三角形求交测试吞吐量。意味着射线三角形求交测试模块由原来的2个再次增加到4个,相对Turing架构的1个射线三角形求交测试模块翻了4倍,并额外增加了下图左下角的透明度微图引擎(OpacityMicroMap,OMM)和右下角的位移式微型网面引擎(DisplacedMicroMesh,DMM)。
其中透明度微图引擎(OpacityMicroMap,OMM)让第三代RTCore拥有2倍速度的透明度遍历(AlphaTraversal),OMM通过减少几何图形透明度(Alpha)测试数量,最终减少着色器的透明度计算。这个新功能可以让开发人员紧凑的描述不规则形状,或者半透明物体,比如蕨类植物、栅栏等等。如果用下图举例,OMM可以让RTCore有效避免第二张图蓝色部分的的计算,从而更有效的执行光线追踪效率。
位移式微型网面引擎(DisplacedMicroMesh,DMM)则可以用10倍的速度执行BVH。DMM也是全新的单元,它用来处理RTCore本地微求交结构网格,通过使用较少的基本求交三角形来描述比以往更复杂的几何形状。
第三代RTCore还引入了着色器执行重排序(ShaderExecutionReordering,SER)技术,通过与游戏设计团队配合,更有效的分配次级射线的排序权重,从而获得更高效的线程排序执行,避免光追运算陷入无意义的次级射线运算的等待中。
第四代TensorCore的FP16、BF16、TF32、INT8、INT4性能相对前一代提升两倍以上,并增加了商业HopperGPU架构中出现的FP8TransformerEngine。得益于AD102GPU中SM处理器增加,每个SM包含了4个第四代TensorCore数量自然也同步增加,最终实现了AI计算性能的显著提升,并衍生出了性能提升神器DLSS3,之后我们会分单独一个章节详细说明。
战斧装甲参上
如果开头所言,为了支撑AD102300A1性能持续输出,七彩虹战斧GeForceRTX4090同样使用了三槽设计的超大散热模组,并覆盖经典红黑撞色装甲,在保持低调的同时展现出力量感。
这样的力量感同样延续到显卡背板,战斧GeForceRTX4090使用了镂空设计,配合侧面露出大面积散热鳍片,更利于热量的快速释放。
为此,散热模组与GPU的相接处使用了真空冰片技术,通过扁平密闭腔体内充冷凝液,在吸收热量后通过相变原理快速导出热量。而在鳍片与热管之间,沿用了一套回流焊工艺,使热管与鳍片间紧密相连。
最后配合98mm直径的三风扇设计,搭配2648热管,组成了战斧GeForceRTX4090眼前这套散热系统。
由于使用了16pin(12VHPWR)接口,供电相数为143,战斧GeForceRTX4090随机提供了一套3x8pin转16pin电源转接线,相对公版的4x8pin转16pin少了1个8pin,但从实际表现来看,战斧GeForceRTX4090并没有与4x8pin的RTX4090产生明显差距。
在压力测试中,战斧GeForceRTX4090,能够看到通道供电接近500W,GPU功耗450W,与公版表现相当。与此同时,GPU最高温度为65,相对公版的68更低一些。
这里放上红外线散热图,可以看到最高温度集中在扇热鳍中段。
顺带一提,在接口配置上战斧GeForceRTX4090与公版保持同步,包括1个HDMI2。1和3个DisplayPort4。1a。
加速AI创作
又到了喜闻乐见的测试环节,由于战斧GeForceRTX4090更注重创意内容制作上的表现,我们也准备了一套内存和容量更大的测试平台,比如32GBDDR54800X2,共64GB。以及2TBPCIeSSD,并使用24线程的Corei912900K处理器,Z690主板,1250W电源等,参考配置如下图,除此之外,作为对比我们使用GeForceRTX3090、GeForceRTX3090Ti进行陪跑。
在基础性能测试中,惯例引入检测DirectX11和DirectX12的3DMarkTimeSpy,3DMarkTimeSpyExtreme,3DMarkFireStrikeExtreme,3DMarkFireStrikeUltra,PortRoyal和VRMarkBlueRoom进行检测。
可以看到,相比GeForceRTX3090Ti,战斧GeForceRTX4090能够轻松提升50到80,特别是4K性能和光线追踪性能差距明显,第三代RTCore以及更多的CUDACore、GPU缓存起到了显著的作用。
为了考验GPU的实际水平,我们也是用了几个常见的3A游戏作为参考,其中包括《地铁:离乡》,《古墓丽影:暗影》,《边境》,《光明记忆:无线》,《Wolfenstein:Youngblood》等,测试主要聚焦于4K最高画质最高光追效果。
可以看到,战斧GeForceRTX4090帧率能够轻松跨越4K100FPS大关,4K最高画质拉满光追对于GeForceRTX4090不再是问题。
简单的热身之后,让我们进入内容创作实战环节。从参数上看,战斧GeForceRTX4090的GDDR6X显存仍然为24GB,但实际上通过与美光合作实现了电路设计以及信号上的优化,显存峰值显存带宽已经提升到了1TBs,24GB显存容量将能够更轻松的构建4K乃至8K的内容。这也是为什么接下来的我们的内容创作测试都会围绕更高分辨率的内容创作形式作为参考。
不仅如此,GeForceRTX4090也首次加入AV1双编码器。AV1编码是由英特尔、微软、亚马逊、谷歌、网飞等网络巨头组成的开放多媒体联盟AOMedia所推出的免费编码格式,在国内已经获得了哔哩哔哩、爱奇艺支持。它的特点是能在相同文件体积下拥有更高清的画质,或者相同清晰度的画质下拥有更小的体积。
如果与GeForceRTX30系列进行对比,GeForceRTX40系列的AV1编码器能比H。264编码器效率高出40。这意味着AV1编码器能够利用现阶段可以进行1080p串流视频的带宽,实现1440p甚至更好的画质。如果视频平台支持AV1实时直播推流,在同样的带宽占用下,可以轻松播放2K或者4K的视频,而播放4K的带宽也将可以用来播放更高分辨率的内容。
得益于24GB的显存容量,战斧GeForceRTX4090融入了2个AV编码器,组成了双编码的形式,这是12GB以上RTX40系列GPU才拥有的特权,能够实现同时处理4个4K60FPS视频,1台电脑完成多路4K画质60FPS输出等以前不敢想象的玩法。
在实际测试中,我们先使用了Resolve18对4K30FPS和8K30FPS的视频进行编码,由于GeForceRTX3090不支持AV1编码,这里使用H。265替代。能够看到,战斧GeForceRTX4090的效率加速了将近60。
渲染能力则主要围绕BlenderBenchmark进行。BlenderBenchmark主要测试了GPU的渲染输出能力,在Moster、Junkshop、Classroom按个场景中,战斧GeForceRTX4090相对GeForceRTX3090最高提升了102的性能。
而在VRay5Benchmark中,则会考验到GPU的CUDA性能和光线追踪性能,能够看到战斧GeForceRTX4090提升也是翻倍的。
在经常被利用于创建模型的OctaneRenderRTX会对GPU的光线追踪性能以及渲染输出有着很高的要求。在复杂测试场景下,会考验GPU每秒产生的样本率。可以看到战斧GeForceRTX4090最高性能提升也能达到110以上。
TensorCore的AI性能也已经成为GPU测试项目之一,利用AI实现低分辨率图片无损向高分辨率图片输出变得更为常见。这里我们使用了ON1ResizeAI2022作为参考,分别将五张9MB左右,4000x6000分辨率图片,输出成更大的8000x12000图片,也就是将图片横向与纵向分辨率放大一倍,容量也达到了将近60MB。这里让我们先来看一下输出的最终效果。
如果战斧GeForceRTX4090与上一代GeForceRTX3090比较,可以看到实际运行时间压缩了40以上。
最后在放出测试常客SPECviewperf2020,这是一款包含3dsmax、Catia、Creo、Energy、Maya、Medical、SNX、Solidworks等诸多专业软件,由于SPEC组织基于工业标准的OpenGL图形显示卡效能测试分析软件。测试本事使用C语言编写,主要用于测量运行在OpenGLAPI下的3D图形性能。
能够看到战斧GeForceRTX4090相对GeForceRTX3090最低提升40左右,最高可达130以上。
简而言之,更多数量的CUDA,强劲的第三代RTCore和第四代TensorCore,以及更快的24GBGDDR6X显存,都让战斧GeForceRTX4090在创作性能上有了成倍的提升,鉴于售价与上一代GeForceRTX3090想等,甚至更低,战斧GeForceRTX4090在内容创作环节已经突出了强有力的性价比。
必杀:DLSS3
对于一款旗舰级显卡而言,创作性能爆表远远不够,因为战斧GeForceRTX4090另一个必杀技是DLSS3,这项技术伴随着新显卡推出,并且已经获得了市面上35款主流游戏的支持。
与我们以前理解的DLSS2。X不同,DLSS3已经不再是传统意义上的单一技术,它是一个软件与硬件协同的技术合集,包含了DLSS2超分辨率技术,AI生成帧,加入对NVIDIAReflex支持。在硬件层面,依靠第四代TensorCore与光流加速器共同协作,实现像素级的测量场景,并云端的NVIDIA超级计算机则夜以继日的寻找提升高质量图像的途径。在软件层,DLSS3包括DLSS2超分辨率技术,AI生成帧,加入对NVIDIAReflex支持。
换而言之,DLSS3开启的本身也意味着原生开启了NVIDIAReflex技术,能够有效提升系统响应延迟,在毫秒必争的电竞赛事中是非常有必要的。
新光流加速器与DLSS3搭配,能够计算出场景中的所有像素是如何从一个像素移动到另一个像素的,其中就包括阴影、光反射和粒子等光流场信息。同时通过神经网络分析,分析之前帧与当前帧,最终获得一个高清且自然的效果。
简单的说,战斧GeForceRTX4090拥有DLSS3之后,游戏帧率更高的同时,画质也更好了。为了让大家有更直观的感受,我们将GeForceRTX3090的DLSS2与战斧GeForceRTX4090的DLSS3进行对比。
在传统的3DMarkDLSS22K分辨率测试中,能够看到战斧GeForceRTX4090性能提升70以上,似乎在情理之中。
如果把分辨率提升到4K甚至8K,那么GeForceRTX3090将会被战斧GeForceRTX4090甩数条街,战斧GeForceRTX4090在DLSS3加持下,性能直接提升了125和170,8K分辨率下能够流畅的运行93FPS画面,4K168FPS画面,达到了相当离谱的程度。
在游戏中也是如此,我们从35款DLSS3游戏中选出了《赛博朋克2077》、《微软飞行模拟》、《瘟疫传说:安魂曲》、《逆水寒》、《F122》作为参考,并引用《UnityEnemies》《UnrealEngine5:Lyra》两款DEMO作为对比。
在与GeForceRTX3090的对比中,战斧GeForceRTX4090可以轻松拿下200以上的帧率提升,最高提升甚至可以达到420。
不仅如此,《逆水寒》DLSS3版本首次使用了路径追踪也就是全景光线追踪作为测试场景,因此最终导致了GeForceRTX3090原始帧率只有7FPS,而GeForceRTX4090在开启DLSS3之后能够达到79FPS,差距非常大,也印证了DLSS3搭配全新光流加速器达到了很好的画质提升效果。
这里我们奉上一段ICAT截取的画面作为参考,DLSS3不仅流畅度更有保障,光影效果也处理得更为自然。
AI光影加速一把手
在一轮性能与体验的轮番轰炸后,七彩虹战斧GeForceRTX4090豪华版给我们留下了深刻的印象,战斧GeForceRTX4090设计简约却相当有力,发挥出了AdaLovelaceAD102核心应有实力,通过优化后的电源与散热设计,将GPU的通道功率推到了500W,但核心温度控制在了70以下,并保持足够安静的运行,做到这几点都是相当不容易的。
更重要的是,战斧GeForceRTX4090所搭配的24GBGDDR6X显存,AV1双编码器,第三代RTCore、第四代TensorCore以及DLSS3,都成为了性能提升的杀手锏。仔细想想,上一次在隔代旗舰级显卡之间较量,性能轻而易举提升100甚至300的景象,已经很久没有发生了。
战斧GeForceRTX4090通过强大的硬件堆叠以及巧妙的技术结合,实现了一套11大于2的效果,这不免也让人期待起七彩虹iGame系列的强力表现。总归而言,在FoundersEdition之外,战斧GeForceRTX4090的表现,足够成为设计师们或者想体验高性能游戏体验玩家们不错的选择。毕竟在剥离RGB之后,还能有如此强劲表现的显卡,在当下的选择中其实也是不多的。
双眼皮术前需要了解的事双眼皮项目相信大家都不会陌生,但是应该如何选择适合自己的,整形医生来支招。重庆星荣整形外科医院医生吕巍介绍,一般情况下,双眼皮项目分为全切和埋线两种,具体选择哪种方式需要根据求美者
老病,走向死亡的插曲年龄渐长,越来越接近人生的尽头,也越来越感受到人生的真相。世事一场大梦,人生几度悲凉。总以为努力可以改变一切,坚持会走向成功。可惜,在老病面前,再高远的理想,再强健狂妄的人,也会被
激荡清风正气凝聚党心民心党的十八大以来深入推进党风廉政建设和反腐败斗争述评新华社北京9月6日电题激荡清风正气凝聚党心民心党的十八大以来深入推进党风廉政建设和反腐败斗争述评新华社记者孙少龙党风廉政建设和反腐败斗争,是党的建设的重大任务。党的十八大以来,以习
8个市县被点名通报!国务院联防联控持续整治层层加码国家卫生健康委监督局二级巡视员妥佳。中国网董宁中国青年报客户端北京9月8日电(中青报中青网记者刘昶荣)在今天下午召开的国务院联防联控机制新闻发布会上,国家卫生健康委监督局二级巡视员
你当过管长吗?每天早上叫醒香妹儿的不是梦想也不是闹钟而是小区里面喊做核酸的喇叭新都人的核酸都喊出了新花样你当过管长吗?做核酸变成了小区运动会创意十足趣味满满在新都做核酸不仅有新都话还有客家话香妹
1984年,北京一环卫女工突然收到30亿,第二天就壕捐24亿,为啥?1984年,北京政府大门前,一个穿着环卫工人衣服的老妪迈着有些虚浮的步伐,走了进去。大厅的顾问看她年龄大了,上前搀扶,谁知这个老人说的下一句话,使他愣在了原地。老人说我要捐赠24亿
四川的小三峡,是驴友和自驾游爱好者的桃花源,就在内江头条创作挑战赛三峡风光,是无数旅游爱好者都不会错过的山水美景,从古至今都有无数的文人墨客对三峡风光进行过赞美,郭沫若在蜀道奇一诗中,把三峡峡区的雄奇秀逸风光,描绘得淋漓尽致。其实在
中兴远航30S纯真国货推动5G普及普惠老人用也贴心在当下诸多的手机产品中,其实很难找到一款老少皆宜的手机,要么就是慢慢的科技感和硬核感让众多银发族难以跟得上数字化时代的快速发展,要么就是专门针对于银发族们的老年机。而此次中兴为我们
广州出发郴州3天游,打卡仰天湖,徒步高椅岭小东江今天给大家介绍一条汽车郴州3天游行程,打卡高山草原仰天湖,徒步碧水丹霞高椅岭雾漫小东江。郴州,航拍中国第三季湖南篇就有介绍,地处北纬25度,东接江西赣州,南邻广东韶关,西接湖南永州
话说景州塔景县含利塔(宋)全称释迦文舍利宝塔,俗称景州塔,位于景县城内,是原开福寺内三大主要建筑之一。另两处主要建筑千佛阁无量殿,在文革中被毁,只有这座古塔得以幸存。以其巍巍雄姿俯视广袤的冀
速看郑开同城化超级工程,未来可期如果说(18)郑州都市圈是中原城市群经济区发展的核心,那么郑开同城化则是郑州都市圈战略中的大棋,而无论向南向北的一体化还是向东的同城化,郑州中心城区和空港副城都是引领都市圈发展的双