NVIDIAGeForceRTX3050首测最甜RTX,Steam硬件屠榜卡诞生
在过去三年中,入门级游戏PC一直由NVIDIA GeForce GTX 1650坚守下大门,在Steam平台硬件调查中高居榜二,与GTX 1060、GTX 1050 Ti一起霸占前三。
GTX 50系列虽说性价比不错,但面对着游戏不断普及的RTX实时光线追踪技术、DLSS深度学习超采样,乃至近期的DLDSR,都在暗暗提醒着GTX 1650开始力不从心。
在这个时间点,NVIDIA GeForce RTX 3050终于呼之欲出,使得甜点级GPU全面跨入RTX阵营,起始售价1899元,以及确保货多量足的承诺显得NVIDIA这一次更新颇有诚意。毕竟在疫情影响下备料供给仍实属不易。
那么作为三年之后NVIDIA再次交出的甜点显卡答卷,是否真的让人满意?现在就让我们揭开NVIDIA GeForce RTX 3050的性能面纱,爱极物首发评测就此奉上。
得RTX 3060真传
先从核心说起。GeForce RTX 3050实际上与GeForce RTX 3060一样使用了GA106核心,分支为GA106-150-A1。在GA106的完整结构图中,GA106拥有3个GPC(图形处理簇),每个GPC下拥有5个TPC(纹理处理簇),每个TPC里包含2个SM(流式多处理器)。
在Ampere架构分析中我们说过,Turing到Ampere架构中处理单元之间的层级关系没有发生结构性的变化,单个SM(流式多处理器)内会包含1个第二代RT Core(第二代光线追踪内核)用于硬件层面计算射线、三角形求交和访问BVH(包围盒层次,Bounding Volume Hierarchy)数据结构,4个第三代Tensor Core(第三代张量内核)做INT8、INT4深度推理加速,以及128个CUDA Core用于处理FP32、INT32、FP64运算。
从总数量来看,完整的GA106总共包含3个GPC、15个TPC、30个SM,以及3840个CUDA Core,30个第二代RT Core,120个第三代Tensor Core。
也正因为如此,对比GTX 1650的TU117,GeForce RTX 3050的GA106拥有了专门的光线追踪和深度推理加速硬件,这也使得两者之间虽然是迭代关系,但实际上已经截然不是同一款产品。
但指望RTX 3060和RTX 3050之间使用相同的硬件规格是不可能的。为了划分差异,GeForce RTX 3050的GA106-150-A1删掉了一组GPC,即剩下2个GPC,10个TPC,20个SM,2560个CUDA Core,30个第二代RT Core,80个第三代Tensor Core。
展示如下:
这里我们先引用GTX 1650、GTX 1660 Ti、RTX 2060、RTX 3060进行对比,参考如下:
同时可以看到RTX 3050纹理单位为80个,最高频率与RTX 3060的1777MHz相同,显存为8GB GDDR6,唯独可惜显存位宽只有128-bit,带宽224GB/s,TGP功耗为130W。纸面上看趋近于GTX 1660的定位,用来代替GTX 1650也变得顺理成章。
把成本用在刀刃上
由于NVIDIA赋予AIC厂商更多的性能调节余地,GeForce RTX 30系列在不同厂商、细分型号之间也能展现出更多的性能。为了展现1899元基本款GeForce RTX 3050表现,我们在这里选用了七彩虹战斧GeForce RTX 3050 DUO 8G作为参考。
顺带一提,七彩虹一共推出了三个版本的GeForce RTX 3050,除了这里测试的基础款,还包括加强散热的战斧GeForce RTX 3050 8G豪华版,以及白色高性能的iGame RTX 3050 Ultra W OC款。
AIC厂商能够在短时间内拿出三个甚至更多版本的RTX 3050,一部分原因在于之前用于GTX 1650、RTX 2060的散热模组可以快速运用到这一块GPU上,节省了大量的设计、研发资金成本和时间,从而也能有效控制成品售价,进一步提升GeForce RTX 3050的性价比。
七彩虹战斧GeForce RTX 3050 DUO 8G的设计就是很好的参考。显卡本体为双风扇设计,长度253mm,配备2个90mm支持智能启停的散热风扇,以及2根6mm热管。散热器之上,战斧系列的红黑撞色外观,搭配不规则菱形切面外观很有辨识度。
在实际压力测试中,能够看到七彩虹战斧GeForce RTX 3050 DUO 8G满负荷功率在130W左右,符合NVIDIA官方给出的TGP 130W参考。
同时通过红外线测温可以看到,显卡表面最高温度为43.3 ,压力测试下GPU温度为63 ,在GeForce RTX 30系列中也是最低的。
也因为如此,GeForce RTX 3050基础款只需要1组8-pin电源接口即可满足。当然,AIC厂商也会考量使用2组8-pin接口以满足GPU的超频表现。
在数据接口方面,GeForce RTX 3050与其他同门师兄型号看齐,包括PCIe 4.0接口,1个HDMI 2.1,以及3个DisplayPort 1.4a,最高支持4K 120Hz HDR或者8K 60Hz HDR。
不服跑个分
这里到了我们惯例的跑分环节,由于在定位上属于GeForce GTX 1650的升级版,这里我们分别使用GeForce GTX 1650、GeForce RTX 2060进行对比。值得注意的是,目前GeForce GTX 1650售价在2000元上下,与GeForce RTX 3050相同。
另外在配置上尽可能展现GeForce RTX 3050的实力,这里选用了12代酷睿和Z690平台,包括酷睿i9-12900K,ROG MAXIMUS Z690 EXTREME,美光DDR5-4800 32GB x2,Plextor M10P 2TB,以及Thermaltake TPI RGB PLUS 1250W电源。
在检测DirectX 11和DirectX 12的3DMark Fire Strike、Time Spy两个项目中,可以看到GeForce RTX 3050相对GTX 1650有75%到82%的提升,相对于RTX 3060有35%左右的差距,相对RTX 2060也有15%左右的距离。
需要注意的是,GeForce GTX 1650不包含Tensor Core和RT Core,因此在测试光线追踪性能的Port Royal中无法运行。同样,在下图的NVIDIA DLSS测试中,GTX 1650由于没有Tensor Core,也无法运行。有意思的是,测试中显示GeForce RTX 3050的DLSS性能比RTX 2060高出不少。
同样在VRMark三项测试中,我们也可以看到类似的表现。GeForce RTX 3050能够领先GTX 1650有55%到130%,相对于RTX 3060则有30%的差距,相对RTX 2060则有20%左右的差距。
在《最终幻想15》DEMO的4K测试中,由于GTX 1650不支持DLSS,差距被GeForce RTX 3050拉开到了190%。同时与RTX 3060有32%的距离,与RTX 2060有14%的距离。
《最终幻想14》测试结果中GeForce RTX 3050则与RTX 2060相当。
轻松征服1080p
既然GeForce RTX 3050目标是用来替代GTX 1650,那么游戏自然不会绕过。前面已经提到,GeForce RTX 3050使用的是Ampere架构的GA106核心,与GeForce RTX 3060一脉相承,同时具备RTX 30系列才有的第二代RT Core和第三代Tensor Core,在实时光线追踪和深度学习超采样上效率更为高效。
第二代RT Core在Turing架构的基础上将三角形求交模块数量增加到2个,并且一并行的方式运作,同时还增加了一个三角形位置内插模块。这使得在一个周期内,BVH(层次化包围盒)求交和三角形求交比重,由图灵架构时代的4:1,提升到了2:1。另外第二代RT Core还增加了三角形位置内插模块,在实现运动模糊效果的时候,能起到明显的加速效果。
第三代Tensor Core通过每个SM包含4个核心获得了与Turing架构8个第二代Tensor Core相同的性能。但得益于Ampere架构真传,GA106上的Tensor Core能够以4个权重为一组的方式,将已经训练好的权重分组中权重值为0的两个权重修剪掉,透过这个稀疏化处理,实现了推理准确无损情况下等效 100% 的深度学习性能提升,或者说等效每周期每个SM完成1024个FP16 Tensor操作。这使得第三代Tensor Core在每个时钟周期密集计算次数提升2倍,稀疏化加速计算次数提升4倍。
实际游戏测试中,我们分成不包含光线追踪、DLSS的DirectX 11场景,以及包含光线追踪、DLSS的DirectX 12场景,并进行DLSS开启和关闭对比,游戏全程均使用1080p分辨率最高画质。参与测试的GPU除了主角GeForce RTX 3050,还包含GeForce GTX 1650和GeForce RTX 3060。
在不包含光线追踪、DLSS传统游戏场景中,可以看到GeForce RTX 3050距离GeForce RTX 2060大概有10%左右的差距,在《古墓丽影:暗影》中则优于GTX 2060。而相对GTX 1650,GeForce RTX 3050的优势就非常巨大了,提升了70%到250%以上不等。
目前主流游戏支持DLSS数量已经超过120款,开启DLSS之后GeForce RTX 3050帧率明显提升,部分场景表现已经与RTX 2060相差无几,与GTX 1650则最高能有近200%到600%的提升。
一旦开启光线追踪,就没有GTX 1650什么事情了。在与RTX 2060的对比中,平均有15%到20%的性能差距。但要知道目前RTX 2060的定价在3600元左右,比RTX 3050贵了1700元。
让体验更快乐
其实对于玩家而言,N卡带来的快乐才刚刚开始。GeForce的魅力不仅仅在于GPU和性能,GeForce生态所打造出来的游戏体验其实才是最重要的,例如能加快响应速度的NVIDIA Reflex。
在使用GeForce RTX 3050体验《战神4》的时候,会明显感受到键鼠操控的反应速度优于PlayStation 5的体验。一方面源自于GeForce RTX 3050给游戏提供了更多帧率,让玩家接受的信息更多,另一方面则源自于GeForce RTX 3050能提供更快的操控响应速度,其中最主要的技术就是NVIDIA Reflex。
大体上,游戏在系统延迟中可以划分为输入延迟、输入采样延迟、渲染延迟、合成延迟和显示延迟。NVIDIA Reflex要做就是消除GPU与CPU之间的缓冲等待,让CPU优先处理关键帧,确保玩家做出的关键动作,能够迅速呈现在屏幕上。
这里只要搭配支持NVIDIA Reflex的高刷新率显示器、鼠标,在游戏中开启NVIDIA Reflex选项,功能就能开启。因此我们也建议在围绕GeForce RTX 3050装机的时候,也可以优先考虑NVIDIA官网推荐的Reflex配套显示器、鼠标。
开启Reflex之后,能够明显感受到高难度下的奎爷的盾返命中率提升,作为游戏后期用来对抗女武神的必备技能,在PS5不得不花更多时间判断女武神与奎爷的技能释放前摇和判定,但在GeForce RTX 3050开启Reflex之后,上手轻松了很多。
Reflex为《战神4》提供了更快的响应和操作感并非个例,时下流行的《永劫无间》振刀同样能体现出GeForce RTX GPU所能提供的快速操作响应,在遇敌的时候,生存机会也更高。
与此同时,你还能通过NVIDIA官方的智能超频对GeForce RTX 3050进一步压榨。安装了GeForce Experience之后,在任意界面按下Alt+Z,选择性能,就能看到详细的性能监测,能够检测出GPU的实时频率、利用率和功耗等。
同时也可以允许GeForce Experience对GeForce RTX 3050进行自动调试,也就是自动超频。如果你对我们曾经报道的NVIDIA Scanner有所了解,这套自动调试功能实际上就是将NVNDIA Scanner集成到了GeForce Experience中。
这是一套通过AI针对不同GPU体质,做出超频优化调整的功能,没有复杂的调整界面,即点即开。同时,软件也会提醒在高GPU利用率的时候,会暂停AI超频,只有当GPU闲置的时候会重新启动,直至找到针对这块GPU调教的最优解。
虽然目前支持DLSS技术的游戏已经超过了120款,但更多数游戏亦或者老游戏是无法体验到这项来自硬件层面优化的。为此,GeForce还在驱动层面推出了图像缩放技术NVIDIA Image Scaling,即NIS。
图像缩放技术其实已经相当普及,AMD FSR、英特尔XeSS都基于这套原理,而NVIDIA Image Scaling在原有的图像缩放技术上,依据在游戏中的实践经验,升级了一套新算法,包括四个方向的缩放和自适应锐化。
这是一套基于驱动实现的技术,NVIDIA Image Scaling(NIS)不需要游戏支持,只需要在NVIDIA控制面板中将其开启,支持范围从GeForce GTX 900系列以后的GPU到最新的GeForce RTX 30系列,同时专业软件Maya、D5渲染器也同样可以匹配。
在GeForce RTX 3050中开启NVIDIA Image Scaling的方式很简单,只需要在GeForce Experience的设置面板内找到图像缩放,选择缩放比例和锐化即可。在《死亡循环》画面中可以看到NIS表现优于AMD FSR。当然,最好的选择仍然是在游戏中开启DLSS选项。
写在最后:让RTX更甜
经过一系列对比,我们能很轻松的发现NVIDIA GeForce RTX 3050在起始售价与GTX 1650看齐的同时,综合算力实际与GeForce GTX 1660 Ti相当。所不同的是,NVIDIA GeForce RTX 3050拥有第二代RT Core和第三代Tensor Core,能够点亮3A大作画质选项的全部选择,并且在1080p分辨率下流畅运行。
显然,NVIDIA GeForce RTX 3050的出现,让原本需要3000元以上RTX 2060才能触及光线追踪、DLSS的门槛,下降到了1899元,真正触及了主流用户的甜点价位。即便不考虑换新机,GeForce GTX用户也完全可以考虑将GPU的位置更换成GeForce RTX 3050,体验一把特效全开的快乐。
必须承认,GeForce RTX 3050与RTX 3060之间仍有不少细化的空间。面对竞争对手,NVIDIA在产品划分上似乎早已准备好了后手。但在当下,能在短时间内获得一款备货充足,高性价比,并且支持特效全开,能够帮助你在春节假期中快乐游戏的GPU,那么NVIDIA GeForce RTX 3050一定是不错的选择了。