内行评测:七彩虹RTX 5070 Ultra W OC首发评测丨小幅加强版4070S,但我有DLSS 4啊!
本期内行评测为大家带来的是RTX 50系列显卡首发型号中的最后一款——RTX 5070的深度评测内容。在经历了发售延期,并中途穿插着AMD发布9070系列显卡后,这款最终起售价定在4599元的RTX 5070究竟表现如何?接下来就让我们参考七彩虹 iGame GeForce RTX 5070 Ultra W OC 12GB显卡的实测结果,与大家展开聊聊~

硬件与技术升级
在进入实测之前,还是让我们先来了解一下RTX 5070的产品定位,以及相较上代又有哪些硬件和技术上的升级。
事实上,如果单纯从CUDA核心数量来看,RTX 5070相较前代不增反降,由RTX 4070 SUPER的7168个减至现如今的6144个,但是Blackwell新架构下的Tensor Core算力几乎翻倍,并且能参与到更深层次的显卡渲染流程中,所以RTX 5070在实际性能表现中还是有正向提升的,关于这点在下面的技术解析和实测中我们再和大家详细说明。除此之外,RTX 5070最大的提升莫过于显存了,GDDR7版本的显存带宽相较上代大幅提升了约33%,基本持平了RTX 4070 Ti SUPER上256位GDDR6X版本的显存带宽。

参看上面这张配置对比图表,相信大家不难看出RTX 5070的产品定位其实是和RTX 4070 SUPER保持一致的,都是面向有2K高刷新率游戏需求的玩家。所以在首发定价方面,RTX 5070的起售价也大概维持在了上代的区间内,甚至还稍微下调了一些,由RTX 4070 SUPER的4899元降至现如今的4599元。
即便显卡售价不增反降,但物理规格提升大幅放缓也确实是显而易见的。那么在物理规格提升幅度有限的前提下,新一代显卡该如何提高玩家的购买欲望呢?答案就在RTX 50系显卡的架构和技术更新之上,这一代RTX 50系显卡可以说是英伟达全面拥抱AI的产物。

相较于RTX 40 系列显卡Ada Lovelace架构下的SM单元,RTX 50 系列显卡Blackwell架构下的SM单元在CUDA、Tensor Core、RT Core上都有不小的提升。首先是CUDA核心,虽然对比RTX 40 系列显卡来看,RTX 50 系列显卡一个SM单元内的CUDA数量并未发生改变都是128个,但RTX 50 系列显卡的每一颗CUDA核心均具备处理FP32和INT32的能力。

其次是升级至第五代Tensor Core,这一代的Tensor Core引入了对FP4和第二代FP8等低精度数据格式的支持。一方面低精度数据在运算速度上有天然优势,另一方面低精度数据的应用也有效降低了各类模型对于显存空间的占用。并且,在RTX 50 系列显卡上,着色器可以同时调用CUDA和Tensor Core的数据处理能力。

正因如此RTX 50 系列显卡上的着色器也迎来了升级,英伟达把它称为神经网络着色器(Neural Shaders)。在神经网络着色器的帮助下,图形渲染管线上的数据将被重新排列并分类,然后交由CUDA和Tensor Core同时处理,这当然也大幅提升了图形渲染的效率。

同时英伟达还赋予了神经网络着色器AI学习的能力。相较此前基于固定光照模型的渲染,神经网络着色器可以通过训练AI模型来学习复杂的渲染过程,最终实现动态调整、实时优化画面渲染效果。
最后RT Core也在RTX 50 系列显卡上升级至了第四代。第四代RT Core引入了三角形集群求交引擎、三角形集群解压引擎、线性扫描球体三个全新的引擎。

其中两个三角形集群引擎主要服务于Mega Geometry功能,线性扫描球体则是为了优化动物毛发、植物枝叶等曲线形态的光照效果,而它们的共性均在于用更少的算力来实现更加顺滑且真实的光照效果。这里我们举个运用Mega Geometry功能的例子,如果你以第一人称视角游玩游戏,第四代RT Core会将你眼前的容易发现细节变化的部分画面用高精度模型来还原光照效果,而在远处不容易发现细节变化的部分画面则用低精度模型来还原光照效果,这样整个画面的光照变化就会更加迅速且符合人眼逻辑,同时也降低了算力上的损耗。

了解完硬件架构上的提升,是时候展开分析一下英伟达为RTX 50 系列显卡量身定制的重磅技术,相信也是大家最关注的重点——DLSS 4是如何实现的?
相较于DLSS 3,DLSS 4的底层模型发生了巨大转变,由传统的卷积神经网络(CNN)升级成了现如今在AI大模型领域被广泛应用的Transformer架构模型。Transformer模型的自注意力机制可以提升显卡对图像全局结构和画面细节的掌控能力;更好的上下文理解可以提升显卡对动态场景(运动模糊)和复杂光线场景(高对比度区域)的处理能力,减少画面伪影;Transformer模型还能通过分析低分辨率图像的特征,更加精准的重建出高分辨率图像中的细节。简单点说,就是RTX 50 系列显卡在Transformer模型的助力下,运用AI技术实现了多帧合成、细节增强且具备运动补偿能力的新一代超分辨率技术。


DLSS 4中另一个感知更强的技术是Multi Frame Generation,也就是多帧生成。与DLSS 3上的帧生成相同的是,DLSS 4上的多帧生成仍需要收集帧与帧之间运动、深度、信号偏移、曝光、光流等海量信息。与DLSS 3上的帧生成不同的是,DLSS 4上的多帧生成不再需要额外的光流加速器硬件,而是直接通过AI计算生成。在RTX 50 系列显卡强大AI算力的支持下,现如今的多帧生成最多可在两个原生帧之间补充三帧。并且由于补充帧不再经由光流加速器,而是直接进入渲染管线,也有效降低了补帧带来的延迟。

至此想要让玩家更加放心的使用DLSS 4功能,英伟达还需解决两个问题,一个是补帧不规律带来的卡顿,另一个则是补充多帧带来的操作延迟。
为了减少补帧不规律带来的卡顿问题,英伟达在Blackwell架构中引入了Flip Metering硬件。DLSS 3中生成帧的控制逻辑其实是先由CPU处理后再反馈给GPU,Flip Metering的出现让RTX 50 系列显卡自身就可以处理生成帧的控制逻辑,这样就避免了CPU与GPU间传输信息所产生的通信延迟。同时,Flip Metering还能优化生成帧的显示时序,确保生成帧以更平滑的方式呈现,减少视觉上的卡顿和撕裂。

前面我们讲到过DLSS 4的多帧生成从底层逻辑上就比DLSS 3的帧生成延迟要低,但补帧,尤其是补多帧,总归避免不了延迟增加,于是英伟达将Reflex也升级至了第二代。Reflex 2不仅优化了上一代的GPU渲染队列管理,根据输入的紧急程度动态调整GPU任务的优先级,还引入了Frame Warp技术。如何简单理解Frame Warp技术,就是在多帧生成的过程中优先参考鼠标等外设的移动信息去生成下一帧,以达到减小延迟的目的。

技术解析到这,想必大家已经能看出来英伟达在设计RTX 50 系列显卡时的思路转变,没错,这就是全面拥抱AI的一代显卡。DLSS 4各项功能的AI提升,让RTX 50 系列显卡更加拥有战未来的可能性。在RTX 50 系列显卡发售的当天就会有75款主流游戏、应用支持DLSS 4功能。我也相信像DLSS 4这种其实是帮厂商减负的功能,在英伟达的大力推动下,未来会有越来越多的游戏和应用加入进来。

测试平台及显卡展示
外观方面,七彩虹 iGame GeForce RTX 5070 Ultra W OC 12GB 大胆采用了“HIP-HOP”艺术风格为设计核心,引领青春潮流新势力。整卡虽采用 Ultra W 惯用的白色装甲,但亮眼的粉色描边元素为产品注入大量青春活力。同时,显卡外部装甲增加了许多规律的弯曲线条,在视觉上给予巨大的律动感。


除了醒目的粉色装饰线条外,七彩虹还在 iGame GeForce RTX 5070 Ultra W OC 12GB 的细微之处增加了一些“隐藏彩蛋”。例如透明盖板处的浅色涂鸦,以及显卡尾部的iGame Ultra浮雕,这些都让七彩虹 iGame GeForce RTX 5070 Ultra W OC 12GB 视觉观感变得更加饱满。



值得一提的是,相较上代的Ultra系列显卡,这一次 iGame GeForce RTX 5070 Ultra W OC 12GB 获得了灯效的大幅提升。iGame GeForce RTX 5070 Ultra W OC 12GB 的侧边灯带延长并贯穿了整张显卡,搭配上嘻哈风的iGame Ultra纹样,让其在各种装机风格中都能成为最亮眼的存在。


散热方面,七彩虹 iGame GeForce RTX 5070 Ultra W OC 12GB 拥有3把90mm大尺寸环形风扇,内部则采用6*6mm回流焊散热工艺热管,辅以镂空处理的金属背板,形成巨大风压快速带走核心热量。用这种规模的散热去压260W的核心,七彩虹 iGame GeForce RTX 5070 Ultra W OC 12GB 温度表现有多健康想必也不用我多说了吧。



同样的为了尽量避免其他硬件成为测试瓶颈,这次我们依旧搭配英特尔 酷睿 Ultra9 285K 处理器和Kingston FURY Renegade DDR5 6400MHz 32GB*2 内存,与七彩虹 iGame Z890 VULCAN X V20 主板组成最终测试平台。那么接下来就让我们一起来看一下,这张七彩虹 iGame GeForce RTX 5070 Ultra W OC 12GB 显卡的实测表现究竟如何吧。

生产力和游戏实测
实测部分,我们选择在相同平台重新测试RTX 4070 SUPER作为对比项。3DMark软件的各项测试中,RTX 5070相较RTX 4070 SUPER在DX12环境下的提升幅度在11%左右,DX11环境下差距被进一步拉大到了23%左右。六个测试项提升幅度平均下来约为16%,要知道单从核心规模来看RTX 5070其实比RTX 4070 SUPER小了许多,由此可见新的Blackwell架构确实是为RTX 50系显卡带来了可观的性能提升。

生产力测试部分,先来看比较基础的照片基准与视频基准测试。在没开启GPU加速之前,RTX 5070对比RTX 4070 SUPER的平均提升幅度约为9%。在开启GPU加速后,视频基准测试的得分被进一步拉开,RTX 5070的视频处理器能力大幅领先RTX 4070 SUPER约26%。差距拉大的主要原因在于,RTX 5070上新一代的编解码器不但编解码的速度有所提升,还新增了对H265 4:2:2的支持。

在两款渲染软件测试中,Blender三个经典场景都对Shader Core要求较高,所以在Shader Core上占据优势的RTX 4070 SUPER仍可以做到与RTX 5070互有胜负。而Vary的RTX渲染由于RTX 50系显卡加强了光追单元的计算能力,所以RTX 5070较RTX 4070 SUPER有超过20%的大幅提升。

AI生产力部分我们分别测试了RTX 5070文生文和文生图的能力。我们在前面的技术解析中提到过,RTX 50系列显卡在架构上的转变就是用来全面拥抱AI的,所以即便是RTX 5070的核心规模不及上代,但在AI测试本分还是能稳赢RTX 4070 SUPER的。四个文生文模型,RTX 5070相较RTX 4070 SUPER的平均提升幅度约12%。提升幅度最大的当属FP4精度下的文生图速度,基于RTX 50系列显卡新增了对FP4低精度数据的支持,RTX 5070的图片生成速度相较上代快了近70%。
这里FP8精度下的文生图用时并非数据缺失,而是因为相对高精度的文生图对显存容量也有更高的需求,12GB的RTX 5070和RTX 4070 SUPER均未能通过测试。


游戏实测部分,我们按照测试环境对于显卡压力的不同,将其分为光栅和光追两部分进行对比。
2K光栅游戏对于定位中端的RTX 5070来说还是比较轻松的,除了《黑神话 悟空》外,其余所有参测游戏在最高画质档位下,运行帧数都能维持在百帧以上,相较RTX 4070 SUPER平均提升了约15%。

将分辨率上调至4K后,虽然在高分辨率场景下RTX 5070的运行帧数出现了大幅下降,但绝大部分游戏的平均帧数还是能维持在60帧以上,对于一些偏重于剧情的3A大作来说,游戏体验还是比较舒适的,在4K光栅场景下RTX 5070相较RTX 4070 SUPER的提升幅度同样为15%左右。

在光栅游戏测试部分,RTX 5070确实能力压RTX 4070 SUPER一头,但在光追开启后情况就有些不一样了。
从光追游戏的实测帧数结果不难看出,开启高档位光追对于显卡的压力要明显大于分辨率提升。这种高压测试环境下,RTX 5070与RTX 4070 SUPER的帧数表现基本没有差别,显存瓶颈也依旧存在,例如《赛博朋克 2077》与《黑神话 悟空》这两款游戏运行时,RTX 5070与RTX 4070 SUPER两张显卡均会触碰到显存上限,并频繁卡死、闪退。


由此可见,对于在RTX 50系列显卡中定位中端的RTX 5070来说,不上点科技又想要好的游戏体验,游戏画质基本就要止步在4K光栅,或者最高2K光追的水平了。但对于RTX 50系列显卡来说,最主要的卖点就是AI技术在游戏中的实际运用,也就是再度升级后的DLSS 4技术。并且这一次的DLSS 4技术对比DLSS 3、DLSS 3.5来说,从画质和帧数方面都强了非常多。
在进行DLSS 4游戏实测前,有一点需要大家注意,不同游戏开启DLSS 4的方式略有不同,像《赛博朋克 2077》和《霍格沃茨之遗》是更新游戏后,多帧生成在设置中会以2x(生成1帧)、3x(生成2帧)、4x(生成3帧)多档位的形式存在。像《杀手 3》则无需更新应用,在NVIDIA App中的图形界面找到对应游戏开启多帧生成即可,这样的方式其实也是变相提高了DLSS 4对各游戏版本、游戏平台的兼容性。


以《赛博朋克 2077》和《霍格沃茨之遗》为例,纯看数值变化,在开启DLSS 超级性能+补帧x4的最高档位后,游戏平均运行帧数相较原生画质下分别获得了933%和371%的恐怖提升。乍一看非常吓人,实际也确实如此,在Transformer模型下,DLSS 4的超分辨率画质又有了进一步提升,再搭配上RTX 50系独占的多帧生成技术,这些都让RTX 5070的游戏体验有了质的飞跃。

这里我们截取了原生和超分辨率性能档位的游戏画面进行对比,二者在视觉中心的画质表现用肉眼已经很难看出区别,只在物体边缘或者背景处会有轻微模糊的现象,但这在游戏实际运行过程中基本察觉不到。


还有一点我觉得是需要单独说明一下的,虽然DLSS 4给了RTX 5070畅玩4K游戏的可能性,但前提条件是超分辨率的马力要给的足一些。因为多帧生成是需要一个比较不错的基础运行帧率的,否则游戏画面还是会出现明显的抽搐和伪影。以《赛博朋克 2077》为例,可能在4K光追的条件下,超分辨率档位要开到性能或者超级性能才会有比较不错的游戏体验。

总结
从RTX 5070的测试结果再度感受到了老黄刀法的出神入化,相较RTX 4070 SUPER来看,RTX 5070基本上算是一张小幅加强后,以DLSS 4作为主要卖点的显卡。也就是说RTX 5070重点面向的依旧是有2K游戏需求的玩家,只不过有了DLSS 4的加持,2K游戏的体验由高刷新率变为了超高刷新率,这倒是与现阶段一两千元价位的主流显示器配置相符。再考虑到RTX 5070最终4599元的起售价,如果可以原价买到的话,搭配显示器整一套下来应该也能控制在万元以内,就现阶段的正规渠道在售的显卡价格来说,也算是性价比不错的游戏甜品了。

