来了,来了!大家期待我们CG世界独家的4090显卡CG向专业评测终于来了! 9月21号NVIDIA发布了GeForceRTX4090GPU,基于AdaLovelace架构,拥有760亿个晶体管、16384个CUDA核心和美光24GBGDDR6X显存。看着这些优越的性能数据,很多小伙伴都很想知道在实际CG制作中的实际表现如何。 经过一系列的联系和申请,在十一长假前,我们终于拿到了由七彩虹提供给我们的iGameGeForceRTX4090VulcanOC显卡。 拿到显卡后,小编就趁着小伙伴们十一假期外出游玩的时间,加班加点把常用的软件测试了一波,来吧,一起来看看到底如何?(文章有点长,请耐心慢慢看) NVIDIAAdaLovelace架构 iGameGeForceRTX4090VulcanOC采用全新第三代RTXNVIDIAAdaLovelace架构,据官方介绍说其性能和效率相当给力,在游戏性能和设计领域应用上、神经网络渲染和更多领先的平台功能方面实现巨大的代际飞跃。接下来给大家详细的介绍一下NVIDIAAdaLovelace架构,4090应用到的一些新技术以及相比以前的一些提升。 第四代TensorCore NVIDIATensorCore推动并加快了AI技术的变革,包括NVIDIADLSS以及可让帧率更大幅提升的全新NVIDIADLSS3。 凭借英伟达在HopperH100数据中心GPU上首次推出的全新FP8Transformer引擎,Ada的全新第四代TensorCore拥有不可思议的飞快速度,可将吞吐量提升4倍,达到1。4TensorpetaFLOPS。 第三代RTCore NVIDIA发明的RTCore在视频游戏中实现了实时光线追踪。这种搭载在GPU上的特殊核心专为处理性能需求密集的光线追踪工作负载而设计。 Ada架构采用的第3代RTCore不仅将光线与三角形求交性能提高了一倍,还将RTTFLOP峰值性能提高了一倍之多。 新款RTCore还配备全新OpacityMicromap(OMM)引擎和DisplacedMicroMesh(DMM)引擎。OMM引擎可大幅提升对alpha测试纹理进行光线追踪的速度,此类纹理通常应用于树叶、颗粒和围栏。DMM引擎能够以近乎9倍的速度构建光线追踪边界体积层次结构(BVH),而所占用的显存只有之前的二十分之一。从而实现几何复杂场景的实时光线追踪。 着色器执行重排序 高级光线追踪技术需要计算同一场景中数百万条光线照射在诸多不同类型材质上的效果,这就使得着色器只能低效地处理一系列截然不同的工作负载。(在渲染3D场景时,着色器用于计算恰当的亮度、暗度和颜色级别。每一款现代游戏都需要使用到着色器。) 着色器执行重排序(SER)技术能够动态调整这些工作负载的顺序,让原本低效的流程变得异常高效。SER可将光线追踪操作的着色器性能最高提升2倍,或将游戏的帧率最高提升25。 DLSS3 NVIDIADLSS3是AI驱动图形领域的革命性突破,可大幅提升性能。DLSS3由GeForceRTX40系列GPU所搭载的全新第四代TensorCore和光流加速器提供支持,可利用AI创造更多高质量帧。 AV1编码器 基于Ada架构的全新显卡配备了支持AV1编码的全新第八代NVIDIA编码器(NVENC),可为主播、广播爱好者和视频通话用户带来更多新的尝试和体验。 技术的效率比H。264高40,这有助于主播在保持直播推流比特率不变的情况下,将画面分辨率从1080p提高到1440p,且画质依然稳定。 七彩虹iGameGeForceRTX4090VulcanOC显卡详细配置,如下图 外观 首先来开个箱,新品开箱总是令人激动又兴奋哈,在这里给大家晒晒包装盒子的正反面。这款就是咱们七彩虹iGameGeForceRTX4090VulcanOC显卡啦,看着亲切不? 开箱开箱!打开最上面是我游自在,应该是iGame的品牌新主张。 下面是七彩虹iGame的LOGO。 打开之后里面是一些配件。 打开中间盒子,里面包含保修卡、说明书,还配了防静电手套和清洁布,可以说非常贴心,细节拉满。 再下面一层就是七彩虹iGameGeForceRTX4090VulcanOC显卡啦,转接线,主板灯光同步线,以及LCD智屏支架。 重头戏来了,显卡登场!全新的锖(qing)铁色外金属骨骼,摸着手感贼好。 还有Vulcan智屏,采用可拆卸设计,搭配附赠的底座能够独立展示,配合iGameCenter可自定义显示内容,实现个性化可玩交互。 转一圈展示 (动态GIF图展示) 特别介绍这个LCD智屏,800216分辨率的磁吸智屏,分体磁吸式设计让它的玩法更加多样,实现不同的个性化展示方式。智屏的底部、背部都拥有磁吸触点,支持侧插及竖插两种磁吸模式。 更有智屏底座,使用USB线连接至电脑,可放置于桌面中进行单独展示。 配合最新2022版iGame控制软件(iGameCenter),实现自定义内容展示。 当玩家将智屏放置于桌面中时,可将灯板吸附于显卡侧面磁吸触点中。 背面三角元素设计能帮助更好的散热,旋涡(Vortex)散热器,集合iGame真空冰片科技、全新聚风镰环扇叶以及9根8热管组件。 接口方面呢,3个DP1。4a接口1个HDMI2。1接口,玩游戏最重要的一键超频功能,说到超频呢,咱们就先来测一测3DMark。 3DMark 想要玩游戏得到更高的帧数呢,就需要动动小手,把一键超频按钮按下去(按下去会亮蓝色灯),在3DMark4K分辨率游戏场景中当DLSS关闭的时候,平均56。95FPS,DLSS开启后平均170。22FPS。 相信不少小伙伴都发现了,前面配图显卡旁边那个有点帅的小机箱。这个小机箱是七彩虹提供的积木。第一次拼装这种小积木,看着简单,配件可是非常多的,小编我用了六个小时才拼装好,不要笑我,确实难拼哇! 你看看这说明书的厚度,就晓得拼装的难度了!小编一开始有点急躁,但慢慢的静下心来,一点点拼装出来还是非常有成就感的,拼好之后放在机箱里,帅!家里有小朋友的也可以让小朋友学习怎么去拼,在休闲娱乐中了解电脑主机的构造。想要的小伙伴可以去微信小程序COLORFUL官方旗舰店购买哟!〔害羞〕 积木成品样子。 OK,我们回过头继续说显卡。看完外观,来看看重量。相较于3090来说,厚了很多,由于使用了金属外壳,稍微比3090重了一点点,但不多,怕显卡比较重会下坠的问题,小伙伴们也不用担心,七彩虹贴心的准备了显卡支架,一点不用慌 软件测试 介绍这么多其实最重要的还是要看看这款iGameGeForceRTX4090VulcanOC显卡在我们CG行业软件中的性能怎么样,这次我们准备了大家平时常用的渲染器和软件来测试:Vray、Arnold、Redshift、Octane、FStormRender、D5、Omniverse、Blender、UE5、达芬奇,可谓相当全面了。测试对比使用RTX3090显卡,测试走起 VRay 首先咱们来看看VRay渲染的表现。这次测试三个场景,并用官方测试工具VRayBenchmark测试分数,三个场景都使用下面图中的参数设置,38402160的尺寸,256的采样值限制,0。01的噪点限制,以及NVIDIAAIDenoiser的降噪方式。具体参数如下图 第一个场景:花和蜜蜂 这是一个近景特写镜头,非常的精细。花蕊使用的是VRayFur(Vray毛发),整个场景有大约230万面,渲染比较慢的是蜜蜂的模糊反射,以及花瓣渲染时间不够产生过多的噪点。 未降噪和降噪的效果,降噪大大的减少渲染时间,快速的渲染成图。 渲染时间:3090渲染时间6分58秒,iGameGeForceRTX4090VulcanOC渲染时间3分40秒,从时间上就能明显感觉到这款4090的优势了。 注:以下绿色条代表七彩虹iGameGeForceRTX4090VulcanOC显卡,灰色条代表RTX3090显卡,越短说明渲染越快,跑分工具则分数越高越好。 第二个场景:调音台 这个场景使用了相机景深效果,场景面数大约157万,场景大量的模糊反射,越近噪点看得越清楚,用CPU渲染这些模糊反射的时候相当慢。场景虽然比较小,但是越是这种近景特写,渲染越耗时,也最能体现硬件性能,渲染产品的小伙伴都懂。 未降噪和降噪的效果,效果还是很明显的。 3090渲染时间4分31秒,iGameGeForceRTX4090VulcanOC渲染时间2分25秒 第三个场景:室内办公室 这个室内场景面数大约106万,有着大量玻璃的折射反射,还有地面和家具的模糊反射,都需要大量时间来渲染。 未降噪和降噪的效果,做室内的小伙伴对噪点可算是恨之入骨了,渲染又慢 3090渲染时间3分40秒,iGameGeForceRTX4090VulcanOC渲染时间2分10秒。 下面来看看渲染测试工具分数,测试VRayGPUCUDA以及VRayGPURTX,这里测出来的分数越高越好。 VRayGPUCUDA3090以及iGameGeForceRTX4090VulcanOC渲染分数。 VRayGPURTX3090以及iGameGeForceRTX4090VulcanOC渲染分数。 VRay在渲染方面,iGameGeForceRTX4090VulcanOC速度大约是3090的两倍,采样速度明显比3090快很多,在近景特写景深和模糊反射计算时,iGameGeForceRTX4090VulcanOC的速度也明显优于3090! 对于VRay这个老牌渲染器小伙伴们都很熟悉了,至今应该也是使用人数最多的渲染器之一,强大的渲染能力和效果,在建筑行业一骑绝尘,建筑动画的痛点就是渲染时间过长,渲染质量不够还产生大量噪点,室外树有时还会闪烁,使用显卡渲染显存不够还渲染不了大场景。这次我们找的这个几个近景特写,都是我们工作中比较常见的景别,在光线采样和降噪上都给显卡带来很大的挑战。尽管在3090上表现不俗,但是在iGameGeForceRTX4090VulcanOC面前还是略显弱了一些,16384个CUDA核心结合光线追踪加速渲染更能够帮助节省一半以上的时间。 Arnold Arnold的这个场景是老演员。今天我们测试使用38402160进行渲染,场景人物模型全身都是金属的模糊反射。 最终我们测得3090渲染时间2分16秒,iGameGeForceRTX4090VulcanOC渲染时间1分14秒。 Blender Blender我们找了两个新面孔场景,一个工具渲染测试。同样参数统一,渲染分辨率都为38402160,采样值1024,在设置中更改为显卡渲染。 第一个场景:冰山 场景面数103万左右,全场景的水面折射、反射,渲染快慢完全看显卡性能了。 最终我们测得3090渲染时间为4分50秒,iGameGeForceRTX4090VulcanOC渲染时间2分13秒。 第二个:概念城市 这是一个鸟瞰场景,物体数和面数要远远大于上面的场景。有309万面,在视口操作上虽然3090和4090相差不大,但在某一刻模型量大的时候,明显能感觉iGameGeForceRTX4090VulcanOC更顺滑一些。 3090渲染时间1分48秒,iGameGeForceRTX4090VulcanOC渲染时间1分钟。 Blender渲染测试工具使用到的场景图。 3090每分钟采样值,越高越好。 iGameGeForceRTX4090VulcanOC每分钟采样值,越高越好。 Blender渲染方面,iGameGeForceRTX4090VulcanOC渲染速度也大约是3090渲染速度的两倍。 BLender现在可谓是大家追捧的软件了,每次测试显卡我们也是第一个测试它,因为用起来小编感觉比较顺手。对它的Cycles渲染器和实时渲染Eevee有一种特别喜爱感,所以这次测的场景也比较多。 总体测下来的感受是:快!当时测3090时候操作视口就已经感觉很丝滑了,这次iGameGeForceRTX4090VulcanOC感觉是:唰唰的。NVIDIAOptiX降噪配合交互式光线追踪渲染可在视口中实时快速显示效果,还有iGameGeForceRTX4090VulcanOC的大显存能够快速的助力实时渲染视口中调整资产和贴图,操作没有任何延迟。此外从对比图中我们可以看到每分钟采样数据上iGameGeForceRTX4090VulcanOC明显要优于3090。 Redshift Redshift使用RedshiftBenchmark来测试渲染,RTX降噪为开启,这个场景还是比较经典的,复杂的金属反射,模糊反射,还包含了水面的折射。 3090渲染时间2分32秒iGameGeForceRTX4090VulcanOC渲染时间1分27秒。 大名鼎鼎的Redshift渲染器,可以说各行业都有它的身影,世界上第一个完全GPU加速的有偏渲染器,允许用户调整各个技术的质量,以获得最佳的性能质量平衡的制作。当然了想要达到影视级别的渲染质量,首先硬件要跟得上。Redshift渲染器本身的优秀配合七彩虹iGameGeForceRTX4090VulcanOC显卡就是创作、渲染的利器。 Octane Octane渲染使用OctaneBenchmark进行4个场景的测试渲染,渲染结果分数越高越好。 3090渲染过程以及结果。 iGameGeForceRTX4090VulcanOC渲染结果。 Octane渲染器3090分数668。21,iGameGeForceRTX4090VulcanOC分数1258。24,速度大约也是3090的两倍。 Octane渲染器,是C4D用户用到最多的渲染器,Octane渲染器是世界上第一个真正意义上的基于GPU、全能、基于物理渲染的渲染器。这几个场景也是官方出的几个比较经典测试小场景。 C4D复杂的场景渲染非常慢,特效粒子,模糊反射,复杂的运动模拟等,这些都是非常考验显卡性能。iGameGeForceRTX4090VulcanOC可以解决在硬件上的不足,全新的AdaLovelace架构,加速项目场景渲染。 FStormRender FStormRender渲染器可能有的小伙伴不知道,这个渲染器在显卡加持下渲染也是非常快的,而且特别小巧。下面就来看看渲染速度如何,先放设置图,渲染采样值设置为1000。 这次的测试场景是一个厨房,面数虽然不多,大约59万,但是每样物体都有模糊反射,采样值稍微给高了一点,所以渲染起来有点慢。 3090渲染时间6分41秒iGameGeForceRTX4090VulcanOC渲染时间3分39秒。 FStormRender虽然没有那么多的功能,渲染效果和速度还是非常不错的,还自带VRay场景材质灯光转换。 众多渲染器都用到了AI降噪功能,AI降噪能快速的去掉渲染图片的噪点,Arnold,Redshift,Octane,包括Blender的Cycles渲染器全部使用了人工智能加速去噪,让我们用更少的时间得到更好的效果,同时iGameGeForceRTX4090VulcanOC是光线追踪渲染最快的GPU,在测试中无论是计算通透的玻璃还是桌面模糊反射和采样速度iGameGeForceRTX4090VulcanOC都体现出极大的速度优势,与DLSS3着色器执行重排序结合时,实时渲染速度高达4倍左右。 Omniverse 接下来看看Omniverse表现怎么样,场景直接使用Omniverse官方的场景来测试,在设置方面视口使用38402160分辨率。场景中有照射进来的阳光,各种布料,木纹,是相对比较复杂的场景,一切都是实时渲染,相对来说会慢些。 先来看看4k视口分辨率下,操作方面。 (30904k视口操作) (40904K视口操作) 在视口操作上通过上图可以看出iGameGeForceRTX4090VulcanOC比3090流畅度要顺滑很多,3090操作起来延迟过高。 渲染方面,在都渲染4K分辨率的情况下3090渲染100帧时间为45秒,iGameGeForceRTX4090VulcanOC渲染100帧时间为21秒。可以感受到NVIDIA自家的软件在自家硬件上跑,配合度是相当完美。无论是采样,降噪,还是出图速度都快的一批! Omniverse我们之前介绍和使用很多次了,它可以实时联动多个软件同时创作,上面测试了那么多个渲染器,其实都是可以用不同的软件在Omniverse中实时联动,支持3Dmax,Maya,UE5等数十种软件,就算在世界各地也可以在同一个场景中创作,无论多么复杂的场景,都不需要在不同软件之间相互导来导去,省去大量的重复工作,Omniverse还有强大的AI智能运算功能,特效模拟,无论用什么软件创作,Omniverse都能够把所有无缝整合到一起,更有RTX4090光线追踪加速,超大的24GB显存帮助咱们更快更好的完成艺术创作。 D5 D5,一款优秀的国产实时渲染器,身边做建筑表现的小伙伴几乎都在用了。这里我们测试了两个场景,渲染4K视频,16K单帧,室内室外都有大量的反射,玻璃,沙发等都是渲染比较慢的,接下来就来看看D5渲染速度iGameGeForceRTX4090VulcanOC提升了多少。 第一个场景室内3090渲染时间3分54秒,iGameGeForceRTX4090VulcanOC渲染时间2分10秒。 第二个场景室外3090渲染时间13分51秒,iGameGeForceRTX4090VulcanOC渲染时间6分54秒。 第一个场景室内16K单帧3090渲染时间21分42秒,iGameGeForceRTX4090VulcanOC渲染时间16分钟14秒。 第二个场景室外16k单帧3090渲染时间37分52秒,iGameGeForceRTX4090VulcanOC渲染时间22分23秒。 UE5 来测试一下UE5,UE5大场景都是需要比较大的显存的,显存不够会很卡,崩溃,甚至打不开,UE5我们测试了两个官方场景:狐獴和黑客帝国。 黑客帝国 场景通用设置。 场景三角面数约2亿6千万面(单个世界分区)。 黑客帝国场景渲染150帧,3090渲染时间为16分20秒,iGameGeForceRTX4090VulcanOC渲染时间为9分47秒,显存占用了23。5GB,大显存在这里又同样凸显了它的巨大优势,渲染8K没有半点迟疑。 我们又简单测试了下视口帧数,3090大约在4778FPS,iGameGeForceRTX4090VulcanOC大约在5579FPS,没有太多细微差别都很顺畅,但是在某些模型量大,光线计算较多的地方扔能感觉iGameGeForceRTX4090VulcanOC要更流畅。 (3090UE5黑客视口Fps4778) (4090UE5黑客视口Fps5579) 狐獴(mng) 狐獴这个场景是我个人非常喜欢的一个场景,有故事有技术。场景有大量的三角面,有着大量的毛发。依稀记得在测3090时候,操作有点卡,这次在iGameGeForceRTX4090VulcanOC上表现会如何?下面我们来看看。 场景三角面数约8500万。 渲染方面3090渲染时间10分52秒,iGameGeForceRTX4090VulcanOC渲染时间7分13秒,有图有真相。 场景渲染显存占用23。4GB。 接下来是场景视口操作帧数,3090最低帧数大约43FPS,最高约70FPS,iGameGeForceRTX4090VulcanOC最低帧数大约70FPS,最高约103,高低一眼便知了。 (3090狐獴场景视口操作) (4090狐獴场景视口操作) 这里不得不提下DLSS3技术了,它可以帮助你在各种实时视口中更流畅的操作资产。大家平时都会遇到那种大场景,面数贼多,物体数贼多,贴图贼多的场景,这时候在移动视图时候就会各种卡,有时候根本移动不了。有了这个DLSS3技术加持,这个问题就可以得到大大改善,它可以加速视口渲染,提升工作效率,像UE5这种又需要大显存,还需要视口中实时操作的软件来说,这无疑是巨大的福音! 好了,为了大家方便比较,贴心的小编细心的P了一张图,放出总软件对比图,方便小伙伴们观看: DaVinCi 最后咱们来测试一下后期调色软件达芬奇表现怎么样,我们在Davinciresolvestudio18中对RTX3090和iGameGeForceRTX4090VulcanOC进行了渲染和运算的测试。 首先是渲染测试,我们使用两段经过处理的剪辑分别在两张显卡进行渲染操作,对比所用时间。且本次测试中两段剪辑的导出设置除名称外其他内容均不进行调整。导出设置如下: 第一段剪辑共有四个节点,添加了射光、模糊、发光、风格化等效果(如下图)。 为了最大限度地降低电脑其他因素对结果产生的影响,每一段剪辑我们都需要渲染三次后取平均值来作为对比数据。如下图(上:iGameGeForceRTX4090VulcanOC下:RTX3090) 通过上图我们可以看到,RTX3090渲染该剪辑所用时间为43秒,iGameGeForceRTX4090VulcanOC所用时间约为31秒,相比于RTX3090,iGameGeForceRTX4090VulcanOC新架构带来的强劲算力使得渲染速度更上一层楼。 在另外一段剪辑的渲染测试中,添加了面部修饰、美颜、发光、高斯、模糊等效果(如下图)。 RTX3090的渲染时间为27秒,iGameGeForceRTX4090VulcanOC的渲染时间为25秒,理论上这个差距会随着效果的复杂度和时长的增加而增大。 由以上两段渲染测试可以看出,在iGameGeForceRTX4090VulcanOC强劲算力的加持下,DavinciResolvestudio18的渲染速度相比RTX3090还是有非常明显的提升。 随后,我们又在DavinciResolvestudio18中用神奇遮罩(MagicMask)进行了测试,它使用DaVinciNeuralEngine神经网络引擎,并且配合NvidiaCUDA核心加速能够让我们非常迅速地将画面中的人物进行抠像,并且自动跟踪添加遮罩,非常地Nice! 我们使用了一段常见的素材进行了测试,RTX3090用时为8。5秒,iGameGeForceRTX4090VulcanOC用时为6秒。得益于全新第三代RTXNVIDIAAdaLovelace架构,iGameGeForceRTX4090VulcanOC在神奇遮罩方面的运算速度再一次得到了大幅度的提升。 (达芬奇) 而在8K时间线剪辑方面,RTX3090已经很流畅了,iGameGeForceRTX4090VulcanOC在新架构和CUDA核心的加持下,毫无压力,这里不再赘述。 此外,在对一段剪辑添加非常多的效果之后,RTX30803080Ti会出现显存不足的情况,而此时iGameGeForceRTX4090VulcanOC大显存的优势体现出来,它能够在保证效果的情况下带给我们畅享丝滑的创作体验。 总体来说,iGameGeForceRTX4090VulcanOC在DavinciResolvestudio18中的表现还是非常亮眼的,相比RTX3090在渲染和运算方面速度有了很大的提升,让创作者能够更快地看到效果并进行调整,提高创作效率。那么,调色的小伙伴儿有没有动心呢? (不能摸鱼,我不服) 软件测试完成,渲染各方面都有很大的提升,其中大部分的渲染速度都是3090渲染速度的两倍,具体到实际项目中,可以让整个渲染时间少一半。在大分辨率渲染复杂场景上3090可能需二十小时,而用iGameGeForceRTX4090VulcanOC10小时就完成了。 稍微给小伙伴们透露透露,用iGameGeForceRTX4090VulcanOC偷偷的玩了会赛博朋克2077,在3090和4090都开启DLSS的情况下,iGameGeForceRTX4090VulcanOC比3090的帧数提升也是两倍而且还是在4K分辨率的情况下,真的非常非常Nice,我又开始期待5090了怎么办,哈哈 测试完,望着绚丽机箱,缤纷的显卡风扇光线,七彩虹iGameGeForceRTX4090VulcanOC由衷打动了我。这几天测试的使用感受,真的让我爱不释手了,更或者说我和它配合的很默契。一方面得益于优异的渲染性能,另一方面是优越的设计。最大的感受是散热,全程测试渲染过程中,显卡温度最高60C左右,多数在55度左右,3090渲染的时候温度70多度。还有科技感满满的外观,自定义智屏,绚烂的同步灯带无不让人心动哇!想要我手中这款七彩虹iGameGeForceRTX4090VulcanOC显卡?Emmm,还是自己去买吧。〔飞吻〕