写在开头
继GeForce RTX 5090 D、RTX 5080、RTX 5070 Ti、RTX 5070相继在国内上市之后,第五款RTX 50系家族的成员GeForce RTX 5060 Ti也已经在昨日正式解禁,作为经典60级别的甜品卡,自然也是备受玩家的关注。各大AIC厂商自然也懂各位玩家对甜品卡的期待,也在第一时间推出了自家的超频版产品。
影驰作为核心AIC厂商之一,本次60级别的一共带来了三大系列,分别是金属大师、刃以及FIRE。而今天我们上手的显卡则是GeForce RTX 5060 Ti 金属大师黑金版 MAX OC 16GB。想知道这一代RTX 5060 Ti能否再续荣光,带给玩家惊喜吗,那就接着往下看吧!
规格介绍
开始前,照例讲讲新显卡的规格。GeForce RTX 50系显卡采用了此前NVIDIA在AI领域推出的Blackwell架构,以大卫·布莱克威尔命名,其是一名受人尊敬的数学家和统计学家,在博弈论和统计学领域留下了不可磨灭的贡献,NVIDIA用其名字命名这一架构反映了新平台的开创性和先进的计算能力。Blackwell可以说是NVIDIA近年来更新幅度最大的GPU架构了,相比起之前的架构来说,划时代的引入了神经网络着色器,力图为游戏开创先进、高效更有逼真的渲染方式,带给玩家全新的游戏体验。
相比前代Ada架构,Blackwell的升级聚焦于四大方向:分别是AI算力的爆发、光线追踪技术的革新、显存能效的提升以及划时代的神经网络渲染。
第五代Tensor核心
其中AI算力的爆发就不得不提到Blackwell架构上的第五代Tensor核心,新一代Tensor核心添加了对FP4浮点运算精度的支持。FP4是一种较低的量化方法,类似于文件压缩,可以减小模型推理过程中数据存储和计算量大小,提高计算效率,降低该过程对显存的要求。与大多数模型默认使用的FP16相比,FP4使用的显存不到其一半,并使GeForce RTX 50系列GPU的性能相比上一代提升高达2倍。
第四代RT核心
而光线追踪技术的革新则仰赖于第四代RT核心的加持,相较于第三代RT核心来说,Blackwell架构的第四代RT核心主要提升了检测光线、路径与三角形相交的效能,过往在检测时往往只能检测单个三角形,一旦场景复杂,检测能力不足就容易导致渲染出错等问题,而现在检测能够以簇集方式进行,检测效率更高。同时还有三角形簇集解压缩引擎加持,其新增了Linear-swept Spheres(LSS)功能,可以减少渲染毛发所需的几何图形数量,并使用球体代替三角形以获得更准确的毛发形状拟合,能够让显卡发挥更好的性能但只消耗较小的显存占用。
综合来看,Blackwell架构的光线追踪多边形相交效率是上一代Ada架构的2倍,是Turing架构的8倍,同时还可以节省25%的显存使用率。
第四代RT核心的改进主要是为实现更好的光追效果。其中有两项新技术能够受益,第一项是RTX Mega Geometry技术。随着光线追踪游戏场景的几何复杂性不断增加,游戏画面中几何图形的计算量也呈现出快速增长的趋势。而RTX Mega Geometry技术能够加速构建边界体积层次结构(BVH),使得在实时渲染中可以处理多达100倍的三角形数量。
该技术的出现,也使得开发者能够在游戏场景中使用更复杂的几何图形,而不会影响游戏帧率。过去需要一个个算BVH,现在RTX Mega Geometry能够智能地在GPU上批量更新三角形簇,减少了的负担,既保证了性能,也兼顾了图像质量。相信随着这些技术的不断发展和应用,未来的游戏将能够呈现出更加逼真和细腻的视觉效果,同时保持高效的性能表现。
另外一个能够受益的技术则是Curve Primitive,方便光追在曲面中的应用,例如一位男士的头发可能需要多达400万个三角形,再加上光线追踪技术,画面所需要的运算负载极大。NVIDIA则通过第四代RT核心中的Linear- Swept Spheres(线性扫描球体)技术有效减少了渲染头发所需的几何体数量,以球形代替多边形,更贴合头发的形状,从而将占用量大幅缩减至三分之一,并进一步提升了实际帧数,让头发的渲染效果更加自然流畅。
GDDR7显存
第三点改变则是显存效率的提升,Blackwell架构中还首次加入了对GDDR7显存的支持,此前GDDR6显存的信号编码为NRZ/PAM2,而RTX 40系上的GDDR6X则是PAM4编码。最新的GDDR7显存,信号编码改成了PAM3,NRZ/PAM2每周期提供1位的数据传输,PAM4每周期提供2位的数据传输,而PAM3每两个周期的数据传输为3位。说人话就是,新的编码机制可以使杂讯失真比减小,信号品质更清晰,同时还能带來更高的显存运行频率以及更低的电压,根据NVIDIA的介绍,使用GDDR7显存后,数据传输速率可达GDDR6时的2倍,并且功耗接近GDDR6的一半,经典加量还减价。
神经网络着色器
接着我们再细说一下这一代架构最大变化,NVIDIA这次将Blackwell架构的SM单元直接称为神经网络着色器。相比较于之前的可编程着色、CUDA统一着色、通用计算着色来说,其最大的变化就是引入了AI,AI将会彻底改变GPU的着色方式。
在Blackwell架构中,NVIDIA 进一步拓展了神经网络渲染的范畴,引入了诸多创新元素,包括神经网络纹理压缩(Neural Textures)、神经网络材质(Neural Materials)、神经网络体积(Neural Volumes)、神经网络辐射场(Neural Radiance Fields)以及神经网络辐射缓存(Neural Radiance Cache)等,这些元素共同构成了神经网络渲染中神经网络着色的重要呈现方式。
这里举个例子让大家能够更简单的理解神经网络渲染,过去复杂的物品或大量异材质的贴图往往会占用相当大的内存空间,如果叠加光追的话,计算量将会更大。然而,得益于神经网络渲染技术中的神经网络材质功能,这一问题得到了显著改善。开发者可以先在离线渲染出物品的光照数据,然后再用这些数据训练一个小的AI模型,游戏运行时只要实时调用这个AI模型当场推理就好了,这样就能还原出想要的光照效果了,再配合神经网络纹理压缩技术,就能显著降低实际生成的材质数据量,从而在占用更少显示内存的同时,实现了细节更丰富的材质表现,达到了实时生成如电影般细腻素材的效果。
目前神经网络渲染技术已经得到了微软的大力支持,未来也将会加入到DirectX中,玩家能够体验到更真实的游戏世界。
而在硬件层面,由于神经网络渲染的加入,Blackwell架构的SM单元相较于RTX 40系的Ada架构还是有不小变化的,Ada架构内的SM内,SM单元会拆分成一半的CUDA专门用于处理FP 32(单精度浮点数),另一半则依需求动态调整去处理FP32和INT32(32位整数)。而在Blackwell架构上,SM单元则改成了CUDA核心可以完全依需求动态处理FP32和INT32的形式。
另外一个改进是,过往的着色工作往往只有SM单元的Shader在处理,而Blackwell架构上引入了神经网络渲染以后,使得Blackwell架构上的第五代Tensor核心也能共同分担着色工作,大大提高了着色效率。
这样改进的好处是,Blackwell架构能够进一步针对神经网络渲染工作进行排序,即把传统的着色工作分配给Shader,而需要动用神经网络渲染的工作负载则可以给到Tensor核心上,两种核心同时运用,效率最高可以提升2倍之多。并且得益于Tensor核心也加入了可编程渲染管线,现在开发者或API也能更好的调用Tensor核心,未来游戏内我们能见到的AI技术势必越来越多。
先进的AI管理处理器
此外,AI的应用也越来越多,不仅游戏中应用AI技术,现在连可编程渲染的过程里也引入了AI,因此如何去分配显卡内部多样化工作就成了一个问题。如过往显卡在开启DLSS玩游戏时,其中应用到的语言模型和游戏引擎需要同时与GPU的不同核心交互,生成游戏帧,但是往往很难做到每一帧都有一致的生成时间,亦或者是游戏AI对话的响应不够及时,这些情况都会造成游戏体验不友好。
而Blackwell架构为了解决这一问题,引入了AI管理处理器(AMP)。它能够实时调度资源,确保在神经网络渲染、帧生成和 AI 驱动的游戏交互中实现智能化的任务分配。这种设计不仅带来了更高效的性能输出,还让显卡在游戏渲染和 AI 运算之间实现了绝佳的平衡,确保帧的间隔均匀,对话类型的AI能够及时响应,玩家的游戏体验一致性能够比较好的保障。
GeForce RTX 5060 Ti 16GB规格
说了这么多,接下来给大家介绍一下GeForce RTX 5060 Ti 16GB的硬件规格,作为RTX 50系的一员,核心采用了新的GB206芯片,核心代号为GB206-300-A1。在架构上拥有3个GPC,但每个GPC包含的TPC并不相同。GeForce RTX 5060 Ti 16GB上总共集成了18个TPC,36个SM单元,144个TMUs纹理单元,48个ROPs光栅化处理单元以及4608个CUDA核心。
在工艺制程方面,新的GB206芯片沿用了TSMC 4nm 4N NVIDIA Custom Process工艺。核心面积为181mm2,内部晶体管数量则有219亿,虽然在芯片面积以及晶体管数量上相比上代少了一些,不过得益于更先进的架构设计,GeForce RTX 5060 Ti 16GB的CUDA核心数比上代多出了5.8%。基础频率与Boost频率也有小幅上升,由原来的2310MHz与2535MHz提升至现在的2407MHz以及2572MHz,想必性能也有不小的长进。
除此之外,GeForce RTX 5060 Ti 16GB还配备了全新的GDDR7显存,显存等效频率可达28Gbps,同时16GB的大容量显存也能为玩家提供高分辨率下的极致帧率,同时还能兼顾大部分AIGC用户的应用需求,多重黑科技加持下,高分辨率出图也可更加高效。同时视频输出接口也进行了升级,能够兼顾高分辨率与高刷新率,后续开箱显卡时我们会详细介绍。
最后再说说影驰GeForce RTX 5060 Ti金属大师黑金版MAX OC 16GB显卡与MSRP版本的RTX 5060 Ti有何区别,二者最主要的差距还是在Boost频率以及TGP上限方面,我们手上的这款显卡Boost频率能够去到2602MHz,相比MSRP版本的2572MHz高了约30MHz,同时TGP上限也由180W提升至200W,给极客玩家更多的超频空间。
显卡外观赏析
在外包装设计上,影驰GeForce RTX 5060 Ti 金属大师黑金版 MAX OC 16GB显卡还是熟悉的味道,采用经典的黑灰配色设计,正中央是巨型的金属大师LOGO,异常抢眼。底部则是NVIDIA标志性的绿色,左下角还有三年质保与个人送保字样,让玩家买的放心用的放心。
包装盒的侧边则印刷了16GB GDDR7字样,更大的显存配置能够带来更多的创作可能。
包装背面就比较常规了,主要是一些显卡的卖点介绍以及RTX 50系显卡的参数,包括散热、核心、质保等。旨在让玩家更全面的了解自己手上的这款利器。
继续开箱!初见影驰GeForce RTX 5060 Ti 金属大师黑金版 MAX OC 16GB显卡还是非常惊艳的。整体采用黑灰色的设计,方方正正的造型尽显凌厉本质,金属材质的应用以及机甲纹理的加入让整张显卡焕发出不同的质感,观感上也更加硬朗,妥妥的电竞利器。
散热风扇部分,影驰也进行了升级。影驰GeForce RTX 5060 Ti 金属大师黑金版 MAX OC 16GB标配三把全新的霜环散热风扇,每把风扇直径90mm,单从规格上就不难看出它的实力强劲。
除此之外,每把散热风扇还标配7片扇叶,采用环形连叶设计,扇叶表面还有三折处理,能够带来更佳的气流效果与更低的噪音表现。
翻转视角看看显卡的背部,其背板采用全金属打造,同时延续了正面机甲的设计风格。大面积的线条切割纹理加上“METALTOP”的标识,让显卡颜值更进一步。
在显卡背部的左侧则是镂空的散热窗口设计,这样做的目的是加速显卡内部的空气流动,达到提升散热的目的。并且镂空窗口也应用了机甲设计风格,既是点缀,也是凸显金属大师辨识度的一种。
再看显卡的顶部,分别是“GEFORCE RTX”以及“GALAX”的标识,给单调的侧边增添了装饰效果。显卡横装时也能让人一眼看出这是来自影驰的NVIDIA显卡。
顶部的正中央则是显卡的供电接口,不同于其他RTX 50系显卡,影驰GeForce RTX 5060 Ti 金属大师黑金版 MAX OC 16GB为单8Pin接口,应对180W的TGP完全足够。
当然,参与供电的不止8Pin接口,显卡底部的PCIe金手指也会参与部分供电。并且这一代显卡的PCIe接口升级成为了5.0速率,这也是首次在RTX 50系显卡上应用,能够带来更高的传输速率,另外仔细看金手指的形状,它和上一代的显卡也有些微的变化。
视频输出接口方面,还是经典的3个DP加1个HDMI的配置,不过规格上有了升级,影驰GeForce RTX 5060 Ti 金属大师黑金版 MAX OC 16GB采用的是DP 2.1b与HDMI 2.1b规格。理论上,这一代显卡的视频输出接口可以轻松实现4K 480Hz和8K 240Hz超高分辨率与超高刷新率的需求。
另外从这个角度看去,影驰GeForce RTX 5060 Ti 金属大师黑金版 MAX OC 16GB显卡的厚度仅有2槽左右,对比其他大哥来说,已经是RTX 50系中比较瘦的一员了。
显卡拆解赏析
看完了外观我们接下来看看这张显卡的内在。拆解影驰GeForce RTX 5060 Ti 金属大师黑金版 MAX OC 16GB还是比较简单的,仅需拧下背板与侧边IO面板的螺丝即可分离PCB与散热器。
拆开后先看看显卡的PCB设计。不得不说60系的显卡PCB就是养眼,影驰GeForce RTX 5060 Ti 金属大师黑金版 MAX OC 16GB的PCB完全可以用小巧玲珑来形容。这个尺寸完全可以做成ITX显卡!
PCB背面就比较简洁了,不过与一般显卡不同,仔细看可以看到其背面还有显存芯片,后续我们会详细介绍。
PCB的中央则是显卡的核心——GB206-300-A1,影驰GeForce RTX 5060 Ti 金属大师黑金版 MAX OC 16GB就靠它驱动,规格方面,核心由TSMC 4N工艺打造,拥有4608组CUDA核心,数量上对比RTX 4060 Ti要高出约5.8%左右,这也就意味着它的通用图形性能会更强,不过实际性能提升究竟有多少,还请接着往下看。
核心的四周则被4颗显存芯片包围,规格上是GDDR7,由三星提供,单颗2GB,正面共8GB。
PCB的背部还有4颗GDDR7显存芯片,同样是单颗2GB,正反两面共组成了这款显卡的16GB超大显存配置。
显存型号为K4VAF325ZC-SC28,内部是512M×32的架构,根据其型号后缀“SC-28”也可以知道,这些显存的数据频率可达28Gbps。
供电部分,影驰GeForce RTX 5060 Ti 金属大师黑金版 MAX OC 16GB采用6+2相供电设计,对于一张功耗只有180W的显卡来说,这样的供电规格是完全没有任何问题的,甚至可以说有点豪华了。
并且每一相供电都使用了低噪稳定的电感以及高效率的DrMOS,其中核心DrMOS型号为DNNO 451Z,来自万国半导体。
显存供电的DrMOS则来自力智,型号为QA3111。
供电接口则是我们熟悉的8Pin接口,并且旁边还有一颗1R0贴片电阻,其主要作用是储存电能并滤除电源中的杂波和干扰,确保向核心等关键部件提供纯净、稳定的电流。
下面看看这款显卡的散热设计,整张显卡的散热系统还是相当有份量的,整个散热系统可分为三部分,分别是散热器主体、金属背板以及主动散热风扇。
率先映入眼帘的就是正中间这个大面积且非常厚实的镀镍铜底座。四周是影驰为显存、电感等部件准备的高导热系数的导热垫。
整个显卡散热模组还是非常硕大的,可以分为左右两个部分,左侧是密密麻麻的散热鳍片,配合气流,能够快速带离热量,提升整体冷却效能。
散热鳍片之下则藏有3根核心热管,其为GPU核心及显存散热提供了高效的散热保障。
散热器的背面同样布满了大量散热鳍片,配合正面的散热风扇,能够吹透整个鳍片,加速内部空气流动,为显卡快速降温。
另外,影驰还给这款显卡的背板也进行了散热改进,首先是金属材质能够提升一定的导热能力,其次是在显存以及核心的背面都贴上了高导热系数的导热垫,能够将这些发热部件的热量快速导到背板上,从而快速散出显卡内部。
主动散热就是外观部分给大家介绍过的霜环散热风扇了,搭配上面介绍的核心热管、镀镍铜底座以及大面积的散热鳍片,共同为每位玩家提供了无与伦比的散热性能和极其安静的使用体验。
测试平台介绍
开始性能测试前介绍一下本次的测试平台, CPU使用的是目前毫无争议的游戏神U—— Ryzen R7-9800X3D,则是来自微星的MPG X870E CARBON WIFI 暗黑主板。内存为G.Skill的幻锋戟Z5 RGB DDR5,在这块主板上能轻松达成DDR5-8000 C38的成绩,并且我们这次选用的是24G×2的套条,确保这张显卡能够释放全部性能。
完整配置如下所示:
理论性能测试
开始测试前,照例还是要“认识”一下这张显卡。从GPU-Z的信息中可以看到影驰GeForce RTX 5060 Ti 金属大师黑金版 MAX OC 16GB的基准频率为2407MHz,Boost频率为2602MHz,这个频率对比前代RTX 4060 Ti的话,可以说提升了不少,同时也要高于MSRP版本的RTX 5060 Ti。作为OC版本的显卡,它的TDP也比稍高一些,默认为180W,最高可达200W,也算是预留了一定的超频空间。
理论性能部分看3DMark,在Fire Strike系列测试中,影驰GeForce RTX 5060 Ti 金属大师黑金版 MAX OC 16GB表现非常亮眼,出色得不像一张甜品卡一样。在Fire Strike系列测试中,这款显卡在1080P分辨率下领先RTX 4060 Ti约31%,在2K分辨率下领先约30%,而在4K分辨率下,两者的差距依然保持在32%左右。
在DX12的Time Spy测试中,影驰GeForce RTX 5060 Ti 金属大师黑金版 MAX OC 16GB同样表现出色,其性能领先RTX 4060 Ti约20%,进一步证明了其在新一代架构下的显著提升。
在光追性能方面,影驰GeForce RTX 5060 Ti 金属大师黑金版 MAX OC 16GB的光追得分达到10417,领先RTX 4060 Ti约27%。这一提升幅度甚至可以用飞跃来形容,充分展现了RTX 50系显卡在光追计算上的强大能力。此外,在最新的Speed Way测试中,这款显卡的性能提升也超过了27%,不得不说60级别的甜品卡是真香,再次捍卫了高性价比甜品卡的荣光。
DLSS 4专项测试
看完了理论性能部分的测试,接着我们再来看看本次RTX 50系显卡最“顶”的升级,DLSS 3在RTX 40系显卡上引入了帧生成技术,能够依靠AI在两帧之间生成一帧AI帧,从而实现帧数的翻倍,用过的玩家都说好!不过由于每生成一个新的帧都需要光流加速器和 AI 模型参与,因此生成多帧的开销相当高昂,而过高的性能开销会带来瓶颈,导致帧率提升受限。
而这次DLSS 4全新升级,引入了多帧生成技术,它可以利用 AI 为每个渲染帧额外生成多达3帧!相比传统渲染的方式,能够最多实现8倍的性能提升。无论是对性能、显存的开销还是延迟都比之前要好了许多。
另外,由于多帧生成技术,输出的帧多了,要给每一帧都安排一个合理的间隔刷新才能让观感更好。因此NVIDIA还引入了专属的Flip Metering来代替CPU Pacing,它将帧节奏逻辑转移到显示引擎,让GPU能够更精确地管理显示时间,尽可能的将每一帧画面的生成时间保持一致,从而提高整体游戏视觉的流畅感。不过由于Flip Metering是硬件级的控制器,因此DLSS 4的多帧生成目前只有RTX 50系显卡支持。
同时DLSS 4 还引入了图形行业首个 Transformer 模型实时应用。熟悉AI的应该对它很熟系了,它在AI生成领域已经应用多年了。基于Transformer架构的 DLSS 超分辨率和光线重建模型,相比之前DLSS使用的卷积神经网络(CNN)模型来说,具备2倍的参数量和4倍的计算量。在游戏场景中,能够提供更高的稳定性、更少的拖影、更高的细节和更强的抗锯齿能力,使画面更加清晰、流畅和逼真。
不过虽然DLSS 4的多帧生成功能是RTX 50系显卡的独占功能,但新的Transformer模型将会逐步下放至DLSS 3、DLSS 2等,将适用于所有GeForce RTX显卡。并且根据NVIDIA的说法,超过75款游戏和应用将在GeForce RTX 50系列开售时支持DLSS 4的全新DLSS多帧生成功能,包括《赛博朋克2077》《战神:诸神黄昏》《心灵杀手2》《霍格沃兹之遗》等,《黑神话:悟空》也将于今年晚些时候升级支持 DLSS4的多帧生成。随着时间的推移,支持DLSS 4的游戏和应用数量将不断增加。
简单介绍完,我们再看看DLSS 4的理论表现如何,还是经典的3DMark测试。不得不说影驰GeForce RTX 5060 Ti金属大师黑金版MAX OC 16GB搭配上DLSS 4后,帧数就跟打了鸡血一样,开关前后的性能简直天壤之别!其中2K分辨率下,开关前后性能差距足足有4倍之多。4K分辨率时帧数差距直接就是7倍。最离谱的还要属8K, 影驰GeForce RTX 5060 Ti金属大师黑金版MAX OC 16GB在DLSS 4加持下可以做到79 FPS,要知道在DLSS 3下,这款显卡几乎不可能实现8K,或许以后甜品卡也能畅享8K游戏也说不定。
接着我们看看DLSS 4在实际游戏中的表现,率先登场的就是有着“显卡杀手”之称的《赛博朋克2077》,它的设置页面是目前支持DLSS 4游戏中最为丰富一款,除了能够设置DLSS 4的多帧生成外,还可以切换DLSS 4的另一个特性——Transfomer Mode,据说能够让画质更清晰,同时还能改善此前的拖影问题,对玩家可以说是一大利好。
我们直接来一波对比,左侧为Transformer模型,右侧则是原本的CNN模型。从第一个场景来看,Transformer模型能够带来更多的细节。例如左侧图片中的栏杆倒影,这部分表现是比较清晰的,而CNN模型中则几乎不可见。
第二个场景也是能够一眼看出区别的,例如金属门的纹理细节以及砖墙的接缝处,明显是Transformer模型的优化要更好一些。
这个场景的区别主要在于地板细节刻画以及右侧铁栏杆部分,采用Transformer模型的情况下,地板细节更接近真实世界,并且铁栏杆的细节也能更好的还原。而CNN模型则会丢失比较多的细节,虽然不影响观感,但总有种“失真感”。
不过Transformer模型目前也并非万能,毕竟是由AI生成而来,因此在部分细节上还是有些错误的。例如下方的窗口部分,阳光照射下应该是斑驳的光影,比较正确显示的应该是CNN模型中的样式。整体来看,现在Transformer模型瑕不掩瑜,大幅改善的画面细节能够给玩家带来更精致的游戏展现。
在实际游戏测试中,影驰GeForce RTX 5060 Ti 金属大师黑金版 MAX OC 16GB在原生分辨率下只能跑29 FPS,几乎无法畅玩游戏。开启DLSS 3以后,游戏帧数为101 FPS,体感已经非常流畅了。开启DLSS 4以后,影驰GeForce RTX 5060 Ti 金属大师黑金版 MAX OC 16GB能够做到187 FPS,对比原生分辨率,性能足足提升了6.4倍。1 1% Low帧数也几乎追上了DLSS 3下的平均帧数,整体游戏体验更加出色。
DLSS 4带来的性能提升是有目共睹的,不过也有玩家担心DLSS 4的画质表现如何,这里我们也在游戏中截取了部分画面,第一个场景其实差距不大,肉眼很难分辨出区别。
第二与第三个场景还是能够看出部分细节的,例如第二幅图中的霓虹灯牌,DLSS开至性能档以后,能够看到灯牌与前面三张图有些许差异,不过你得靠细致的对比才能看出。实际游戏过程中很难发现,基本不影响观感。
总的来说,DLSS对画质的影响没有玩家想象中那么大,甚至于在纹理细节上能够不输或超越原生分辨率。如果你是敏感型玩家,那建议可以开至平衡档,在画面质量和帧率之间能够做到很好的平衡。如果你是追求超高帧率,那性能档也绝对可用,细节保留也不错,不对比基本看不出,同时帧率还能进一步提高。
第二款游戏则是NVIDIA在前段时间强力推荐的《半条命2》RTX版,这款游戏不仅支持了DLSS 4,同时也在游戏中加入了RTX神经网络辐射相关的技术,与初始版本的《半条命2》相比,画质可以说是史诗级的进步!
实测下来,只能说《半条命2》RTX版对硬件的开销极大,在原生1080P分辨率下,所有画质、光追均开至最高,不开启超分选项时,影驰GeForce RTX 5060 Ti 金属大师黑金版 MAX OC 16GB帧数为52 FPS,属于能玩但不够好玩的程度。在开启DLSS 3质量档以后,游戏帧数瞬间来到了135 FPS,体验都变得丝滑了许多,而继续开启DLSS 4质量档,游戏帧数又直接来到了239 FPS,对比原生1080P的表现,性能提升高达4.6倍!
DLSS 4带来的性能提升是有目共睹的,同时DLSS 4的画质也表现极佳,这里我们还是在游戏中截取了部分画面,基本上可以说DLSS对画质的影响没有玩家想象中那么大,甚至于在纹理细节上能够不输或超越原生分辨率。
另外,游戏设置中还可以切换DLSS 4的另一个特性——Transfomer Mode,这里我们也截图了相同的场景进行对比,从下图可以看出Transformer模型能够带来更多的细节。例如左侧图片中的墙壁,这部分表现是比较清晰的,细节也更多,而CNN模型中则几乎不可见。图片中主体的木屋纹理也是Transformer模型下会更清晰,线条更锐利。
我们测试的第三款DLSS 4游戏是《霍格沃兹之遗》,支持DLSS 4技术以后可以在设置看到帧生成部分多了一些选择,其中×2则是原本DLSS 3的帧生成,而×4则是RTX 50系独有的多帧生成功能,另外你也可以选择插2帧的方式,也就是所谓的×3选项。
实际测试过程中,《霍格沃兹之遗》这款游戏优化还是不错的,1080P分辨率画质光追均设置最高的情况下,影驰GeForce RTX 5060 Ti 金属大师黑金版 MAX OC 16GB在不开任何超分的情况下,平均帧为71 FPS。如果开启DLSS 3质量档,此时帧数已经能够做到123 FPS了,属于是高刷与画质的完美组合。开启DLSS 4以后,帧数可以进一步提升至224 FPS,对比原生1080P的表现,性能提升了约3倍以上。
第四款游戏我们测试的是《星球大战》,一样你能在设置中看到其帧生成功能已经支持×4的选项,也就是DLSS 4多帧生成功能。
实测DLSS 4在这类优化欠佳的游戏中确实大有用处,在1080P原生分辨率下,影驰GeForce RTX 5060 Ti 金属大师黑金版 MAX OC 16GB的平均帧仅有97 FPS,整体游玩体验还不错。而开启DLSS 4质量档以后,游戏平均帧直接暴增至276 FPS,游戏体验就像变天一样,丝滑得不像在玩3A,更像在玩网游一样,对比原生1080P的表现,足足有2.8倍左右的提升。即便是对比DLSS 3的160 FPS,那也提升巨大。
接下来我们再测一下第一款国产3A大作、去年的热门单机游戏《黑神话:悟空》,去年发售时,这款游戏也是率先支持了DLSS 3帧生成功能,如今它还支持了RTX 50系显卡的DLSS 4多帧生成,游玩体验将会更加顺畅,开启方式也很简单,在游戏菜单设置中即可找到4X的选项。
我们在1080P下将画质调整至影视级,全景光追也拉到最高,此时影驰GeForce RTX 5060 Ti 金属大师黑金版 MAX OC 16GB在不借助任何超分技术的条件下,原生帧数为27 FPS。开启DLSS 3后,帧数提升至77 FPS,已经可以流畅运行游戏了,不过你肯定不满足于此,我们接着开启DLSS 4,帧数可以进一步提升至138 FPS,性能相比原生分辨率提升超过5倍,非常夸张。
最后一款游戏是我们的老熟人《漫威争锋》,这款游戏在RTX 50系显卡首发之时,它还没有完全适配DLSS 4,玩家想要体验多帧生成功能还需要依靠NVIDIA App的DLSS 4优设功能。不过现在《漫威争锋》也正式支持DLSS 4了,与上面的游戏一样,玩家在游戏设置中就能直接开启,并且提供了2x、3x以及4x选项,玩家可以随意选择是插一帧、插两帧还是插三帧。
实测影驰GeForce RTX 5060 Ti 金属大师黑金版 MAX OC 16GB在1080P全高设置下,不开超分,帧数为111 FPS,甚至已经快满足高刷的游戏需求了。开启DLSS 3后帧数可以达到225 FPS,相比原生分辨率已经提升了一倍以上,如果再开启DLSS 4多帧生成,性能对比原生分辨率直接提升3倍以上,377 FPS的表现妥妥的电竞3A。同时延迟以及1%Low表现也非常出色,反应在游戏中会更加跟手,体感更佳。
当然,如果你想玩的游戏还不支持DLSS 4,那也不用担心,NVIDIA App还提供DLSS 4优设功能,说人话就是能够让游戏强开DLSS 4,像此前的《漫威争锋》,在未更新前,玩家可以直接在NVIDIA App中简单设置,就能将帧生成调至“4×”,一键实现多帧生成。目前也有不少游戏支持DLSS 4优设功能,感兴趣的玩家可以前往体验。
DLSS 4多帧生成功能的问世,毫无疑问为玩家带来了前所未有的游戏体验升级。与上一代RTX 40系的DLSS 3帧生成功能相比,它再次实现了帧数的惊人飞跃。影驰GeForce RTX 5060 Ti 金属大师黑金版 MAX OC 16GB在DLSS 4技术的加持下,无论是3DMark理论测试还是实际游戏体验,都展现出了卓越的性能提升。
在相同的画质设置下,影驰GeForce RTX 5060 Ti 金属大师黑金版 MAX OC 16GB的表现远远超越了RTX 4060 Ti。实际测试中,在上述六款游戏里,开启DLSS 4的影驰GeForce RTX 5060 Ti 金属大师黑金版 MAX OC 16GB,帧数几乎是RTX 4060 Ti的两倍!在部分极其吃硬件的游戏中,帧数甚至可以接近三倍左右,非常夸张!
另外,值得一提的是,与DLSS 4一起到来的还有全新的NVIDIA Reflex 2技术。延迟一直是电竞中绕不开的话题,玩家的每个动作都会经过复杂的计算,再在屏幕上渲染,这其中的每一步都会增加延迟。虽然延迟往往只有几十毫秒,但是你却能明显的感觉到游戏的不流畅、卡顿。
为了尽可能的降低延迟所带来的不良游戏体验,NVIDIA发布了NVIDIA Reflex技术,它可以使GPU和CPU同步,确保最佳响应速度和低系统延迟。目前NVIDIA Reflex已集成到超过100款游戏中,可以将PC延迟降低50%。
而GeForce RTX 50系显卡再度升级,带来了NVIDIA Reflex 2技术。它结合了Reflex低延迟模式与Frame Warp技术。它可以把最新的鼠标输入指令同步给渲染帧,及时更新渲染的游戏帧并在渲染帧被发送到显示器之前获取最新的鼠标信息,通过刷新渲染的游戏帧以进一步减少延迟,将PC延迟进一步降低多达75%。
另外,Frame Warp的加入,能够进一步将延迟降低。当一个帧被GPU渲染时,CPU会根据最新鼠标或手柄输入计算工作流中下一帧的视角位置。Frame Warp从CPU采样新的视角位置,然后将GPU刚才渲染的帧扭转到最新的视角位置。在渲染帧被发送到显示器之前,在尽可能最新的时间进行扭转操作,确保屏幕上反映最新鼠标输入。
而当Frame Warp转移游戏像素时,图像中可能会产生缝隙撕裂、镜头位置的变化会让游戏场景中显示新的部分。NVIDIA则开发了一种优化了延迟的预测渲染算法,该算法使用来自先前帧的视角、颜色和深度数据,对这些撕裂空白的像素进行准确的图像修复。玩家可以通过更新的视角看到没有撕裂的渲染帧,并降低了改变游戏内视角位置而产生的延迟。说人话就是现在NVIDIA Reflex 2还可以根据上一帧的信息去脑补一些空白的像素,有种无中生有但你又看不出来的感觉。
首发支持NVIDIA Reflex 2技术的游戏是《THE FINALS》以及《无畏契约》,后续我们也会第一时间带给大家该技术的详细评测。
游戏性能测试
DLSS 4技术确实令人惊叹,它能够显著提升游戏的帧数表现,为玩家带来更加流畅的游戏体验。不过,正如你所知道的,目前并不是所有游戏都支持DLSS 4,因此我们还需要测试影驰GeForce RTX 5060 Ti 金属大师黑金版 MAX OC 16GB在常规游戏以及支持DLSS 3的游戏中的性能表现。
在3DMark的DLSS 3性能测试中,影驰GeForce RTX 5060 Ti 金属大师黑金版 MAX OC 16GB在2K分辨率下,相较于RTX 4060 Ti,性能提升幅度大约为32%。而在4K分辨率下,开启DLSS 3后,性能领先幅度也基本保持在29%左右。考虑到两款显卡的CUDA核心差距仅约5%,不得不说,NVIDIA的Blackwell架构确实为性能带来了显著的提升。
实际游戏表现又如何呢?这里我们选取了11款游戏进行测试,包含光追及光栅性能方面的测试,而游戏画质方面均全部选择最高画质,光追设定部分,如有则采用最高。
实测1080P分辨率下,影驰GeForce RTX 5060 Ti 金属大师黑金版 MAX OC 16GB还是非常让人惊喜的,其能够轻松应对绝大多数游戏,甚至在一些优化良好的游戏中,如《F1 22》和《光明记忆:无限》,能够达到200+ FPS,接近300 FPS。而在硬件压力较大的游戏如《黑神话:悟空》中,这款显卡也能达到77 FPS,在《赛博朋克2077》中更是超过了100 FPS。总体而言,影驰GeForce RTX 5060 Ti 金属大师黑金版 MAX OC 16GB在3A游戏中表现出色,性能整体比RTX 4060 Ti强约20-30%。
图像视频创作性能测试
看过了游戏,下面就是专业创作领域的内容了。在专业创作领域,影驰GeForce RTX 5060 Ti 金属大师黑金版 MAX OC 16GB同样展现出了不俗的实力。在PCMark10 Extended综合场景测试中,这款显卡在游戏和数字内容创作方面的得分较RTX 4060 Ti高出9%-20%,然而在生产力子项中,新显卡的表现略低于预期,推测与当前驱动程序优化程度有关。
针对办公软件的专项测试显示,影驰GeForce RTX 5060 Ti 金属大师黑金版 MAX OC 16GB与RTX 4060 Ti在日常办公场景下表现相当,整体性能稍微领先4%左右。两者均能轻松应对文档处理、电子表格和演示文稿等任务。无论是专业创作还是日常办公,影驰GeForce RTX 5060 Ti 金属大师黑金版 MAX OC 16GB都能提供足够的性能保障。
在图像编辑与视频创作领域,通过UL Procyon基准测试发现两款显卡在静态图像处理性能上几乎持平(差距仅2%),但在视频剪辑任务中,影驰GeForce RTX 5060 Ti 金属大师黑金版 MAX OC 16GB凭借新一代NVENC编码器实现了20%的领先优势。
这种代际提升在Adobe Premiere Pro和DaVinci Resolve的Benchmark测试中也尤为明显——影驰GeForce RTX 5060 Ti 金属大师黑金版 MAX OC 16GB在视频渲染与导出任务中较前代产品提升26%-30%,总体来说就是内容创作的效率更高了。
3D渲染创作性能测试
在图像与视频创作领域,影驰GeForce RTX 5060 Ti 金属大师黑金版 MAX OC 16GB展现了令人瞩目的性能优势。而在3D渲染创作方面,这款显卡同样不负众望,尤其在Blender和V-Ray两款专业渲染软件中,其表现令人惊艳。在Blender的渲染测试中,这款显卡的性能领先RTX 4060 Ti约20%左右,无论是复杂场景的光影处理还是材质细节的呈现,都能显著缩短渲染时间。而在V-Ray的RTX项目测试中,领先幅度更是高达30%以上,充分展现了其在光线追踪上的强大能力。
D5 Render作为一款基于DXR光线追踪技术的GPU渲染器,其画面质量备受好评。全新的影驰GeForce RTX 5060 Ti 金属大师黑金版 MAX OC 16GB在这款软件中不仅支持DLSS 3帧生成,还可以通过NVIDIA App实现最新的DLSS 4多帧生成功能。
实测显示,在开启DLSS 4后,渲染预览的流畅度大幅提升,帧数稳定在200 FPS左右,1% Low帧数也能保持在89 FPS。相比之下,未开启DLSS时的45 FPS就显得有些相形见绌了,DLSS 4下的性能提升对比不开启任何超分时,足足有4倍之多。即便与DLSS 3相比,新显卡的性能依然能领先前代显卡约30%-40%。
在工业领域的SPEC2020测试中,影驰GeForce RTX 5060 Ti 金属大师黑金版 MAX OC 16GB继续展现出卓越的整体性能。在多项测试中,其性能较RTX 4060 Ti平均提升15%-20%,而在3dsmax-07项目中,性能提升幅度更是高达56%。无论是3D渲染、光线追踪还是工业级创作,影驰GeForce RTX 5060 Ti 金属大师黑金版 MAX OC 16GB都以强劲的性能表现,为创作者提供了高效可靠的创作工具。
NVIDIA编解码测试
接下来的测试则是介绍RTX 50系显卡的编解码器,GeForce RTX 50系列显卡上换装了第9代NVENC编码器与第6代NVDEC解码器,在视频规格上支持AV1 UHQ(超高画质 AV1)与MV-HEVC(多视角HEVC)编解码。同时由于GeForce RTX 50系列显卡还升级支持DisplayPort 2.1 UHBR20输出,单一通道支持20Gbps带宽,因此用户可以体验到令人惊叹的HDR视觉效果、超高分辨率和更流畅的游戏体验。
这里我们直接使用NVIDIA提供的4K60片源与工程文件分别测试AV1、H.265以及H.264下的编码导出时间。实测同一段素材下,影驰GeForce RTX 5060 Ti 金属大师黑金版 MAX OC 16GB导出三段视频的时间分别是16秒、15秒以及14秒,效率比RTX 4060 Ti快了56%、73%以及79%。
同时,我们也对导出的不同格式的视频进行了画质对比,实测AV1编码的视频在画质上与H.265或H.264也没有明显差距,无论是在文字、人像还是建筑等画面里,三者的画质可以说是伯仲之间,如果不特地标注其格式,一般人很难用肉眼分辨出来。随着目前越来越多视频网站、剪辑软件和硬件厂商的推动,未来AV1势必会成为下一个最受欢迎的格式。
值得一提的是,GeForce RTX 50系显卡还能够支持4:2:2色度取样的视频编解码,这将节省CPU的负担,加快创作速度。上面的图表里也可以看到我们的测试成绩,实测导出时间会比上代显卡快不少,毕竟RTX 40系显卡不支持该功能,仅支持4:2:0色度采样,如果一定要4:2:2导出只能靠CPU软解。
4:2:2色度采样的视频文件采用的是YUV颜色格式,与存储红色、绿色和蓝色(RGB)值不同,颜色被存储为亮度Y、蓝差色度U和红差色度V。在这类视频中,视频的完整亮度将被保留,而原始色度信息只保留一半,因此相比4:4:4的视频,其视频帧数据量仅有不到三分之二,而相比4:2:0的视频又能提供两倍的颜色分辨率,因此创作者采用这种格式拍摄,能够在保留更多色彩信息的同时还能减少文件大小和带宽需求。
AI性能测试
如今,AI技术已成为各行各业关注的焦点,尤其是在国产大模型爆火之后,AI的应用场景愈发广泛,几乎成为各领域的“标配”。而显卡作为AI运算的核心硬件,其性能表现直接影响AI任务的效率。RTX 50系显卡则针对AI进行了改进,其中最值得说道的就是其加入了对FP4精度模型加速处理的支持,它相比此前RTX 40系上的FP8精度,能够实现更快的生成速度,同时显存占用也更低。
在测试中,我们使用了UL Procyon的FLUX.1 AI Image Generation Demo For NVIDIA进行评估。结果显示,在FP8精度模型测试时,影驰GeForce RTX 5060 Ti 金属大师黑金版 MAX OC 16GB能够以29.678秒的速度生成一张图片,而RTX 4060 Ti由于显存不足,无法完成测试。当切换到FP4精度模型后,影驰显卡的性能进一步提升,生成一张图片仅需15.667秒,效率几乎翻倍,之所以能够实现如此之大的进步,一方面是显卡性能本身的提升,另一方面则是因为FP4精度作为一种低精度量化技术,能够在保持模型性能的同时显著降低显存占用和运算复杂度,从而大幅提升AI任务的效率。
新显卡引入的FP4精度模型除了流畅之外, FP4精度模型生成的图片也非常能打,从下图就能看出来,其与FP8生成的图片几乎没有区别,无论是对关键词的理解还是图像的质量,都非常有保障。对于AI爱好者和创作者来说,影驰GeForce RTX 5060 Ti 金属大师黑金版 MAX OC 16GB无疑是更优的选择。其16GB的大显存和对FP4精度的支持,使其在AI任务中具备更强的竞争力,能够轻松应对复杂的AI运算需求
看过了FP4以及FP8,我们再看看影驰GeForce RTX 5060 Ti 金属大师黑金版 MAX OC 16GB在Stable Diffusion中FP16下的表现如何,还是用UL Procyon进行测试,在比较轻松的SD 1.5文生图测试里,影驰GeForce RTX 5060 Ti 金属大师黑金版 MAX OC 16GB生成一张图的速度仅需66.543秒,效率比上代显卡快了14%。而即便是在压力比较大的SDXL中,,生成一张图的速度也仅为29.43秒,同样领先RTX 4060 Ti约31%。
在AI文本生成测试中,影驰GeForce RTX 5060 Ti 金属大师黑金版 MAX OC 16GB显卡也展现出了卓越的性能。通过MLPerf Client v0.5大语言模型进行测试,该模型基于meta的Llama 2 7B开源LLM打造,涵盖了内容生成、创意写作以及对不同长度文本进行总结摘要等四项AI任务。影驰GeForce RTX 5060 Ti 金属大师黑金版 MAX OC 16GB在每一项测试中均表现出了非凡的统治力,性能提升幅度最高可达53%,遥遥领先于前代RTX 4060 Ti。
此外,我们还使用UL Procyon的AI Text Generation测试了更多的大语言模型,影驰GeForce RTX 5060 Ti 金属大师黑金版 MAX OC 16GB的优势依然显著。在基于Llama 3.1 7B LLM打造的Phi-3.5测试中,该显卡取得了3167分的优异成绩,相比RTX 4060 Ti提升了20%。当测试扩大至13B参数的Llama 2时,影驰GeForce RTX 5060 Ti 金属大师黑金版 MAX OC 16GB依然能够流畅应对,而RTX 4060 Ti由于显存限制,回答速度极慢,几乎无法正常使用,整体性能被RTX 50系显卡远远甩在后面,差距高达7.5倍以上。
总的来说,无论是AI生图,还是AI本地大模型部署,影驰GeForce RTX 5060 Ti 金属大师黑金版 MAX OC 16GB显卡充分证明了其在AI性能方面的强大实力。对于需要高效处理AI任务的用户来说,这款显卡无疑是一个非常理想的选择。
功耗与温度表现
最后一项测试烤机,这也是许多玩家关注的重点。得益于影驰GeForce RTX 5060 Ti 金属大师黑金版 MAX OC 16GB出色的散热配置,整体表现非常出色。在室温20℃下,Furmark烧机10分钟后,整张显卡的温度并不高,核心仅有61.7度,显存温度更是低至54度,此时显卡的最大功率为180W,风扇转速也维持在1600 RPM左右,几乎听不到噪音。
横向对比RTX 4060 Ti时可以看到,虽然新显卡的TDP提升了,不过整体的烤机功耗并不算高,核心满载温度仅高了2℃左右,而显存温度甚至低了16℃,非常夸张。这一切都要归功于这款显卡的豪华堆料,使得其整体的散热效果极其出色,但是要是能够将体积缩小至ITX的大小,那想必会更香一些。
评测总结
通过本次深度评测可以看出,影驰GeForce RTX 5060 Ti金属大师黑金版MAX OC 16GB诚意满满,凭借全新NVIDIA Blackwell架构和GDDR7显存实现了跨代提升,各方面也堪称“完美”。在外观设计方面,影驰GeForce RTX 5060 Ti金属大师黑金版MAX OC 16GB在外观设计上延续了“金属大师”系列一贯的硬朗风格,同时融入了新的美学元素。外观配色上,这一代金属大师除了有我们上手的黑灰色版本,还打造了全新的白色版本。不同于以往单一的黑灰色主题,多种样式供玩家自由选择,打造别样的装机风格。
散热方面更是影驰GeForce RTX 5060 Ti金属大师黑金版MAX OC 16GB的一大亮点,甜品级显卡但却配备了三风扇的豪华散热系统。配备高密度大面积鳍片组,并在尾端设置了贯穿式通风开孔,确保空气流动顺畅,将热量迅速排出。核心热传导方面,散热器内部使用了大尺寸纯铜底座直触GPU芯片,将核心热量高效导出。实测烤机状态下,无论是核心还是显存都非常“冷静”,60℃甚至更低的温度表现对比其他RTX 5060 Ti也是遥遥领先。
性能方面则是这款显卡带给我们最大的惊喜,影驰GeForce RTX 5060 Ti金属大师黑金版MAX OC 16GB展现了跨代级的性能提升。在1080P分辨率下,相比上代RTX 4060 Ti平均性能提升20%-30%,部分优化良好的游戏甚至可实现240+ FPS甚至接近300 FPS的电竞级体验。而在DLSS 4技术加持下,这款显卡的性能提升更是夸张,对比原生分辨率,最高可以提升6倍以上,彻底颠覆了甜品级显卡的性能上限。
特别值得一提的是,影驰GeForce RTX 5060 Ti金属大师黑金版MAX OC 16GB配备的16GB GDDR7大显存,在AI训练和内容创作领域表现尤为出色。无论是AI大模型的本地部署,还是达芬奇Resolve中的8K视频编辑,亦或者是时下热门的AI生图,其大显存的配置能显著降低数据交换频率,将渲染时间大幅缩短,真正实现了“创作加速”。简单来说,它不仅仅是甜品级游戏利器,更是高性价比的创作工具。
最后再聊聊选购建议,毫不客气的说影驰GeForce RTX 5060 Ti金属大师黑金版MAX OC 16GB是一张性能够用,性价比够高的甜品级显卡,不少3A大作都能流畅运行,搭配DLSS 4更是惊喜,同时还有16GB能够入门AI或创作领域。如果你想体验最新的RTX 50系显卡,感受全新的黑科技,那这款显卡应该是目前最优的选择。现影驰GeForce RTX 5060 Ti金属大师黑金版MAX OC 16GB已于京东、天猫、商城等影驰官方旗舰店铺正式上架,感兴趣的小伙伴可以前往选购哦!
本文转载于:https://www.sohu.com/a/885274713_223764 如有侵犯,请联系dddazheyh@163.com删除
丁丁打折网©版权所有,未经许可严禁复制或镜像 ICP证: 湘ICP备20009233号-2
Powered by 丁丁打折网本站为非营利性网站,本站内容均来自网络转载或网友提供,如有侵权或夸大不实请及时联系我们删除!本站不承担任何争议和法律责任!
技术支持:丁丁网 dddazhe@hotmail.com & 2010-2020 All
rights reserved