硬件最前线篇109：哪家最强？RTX4070大战DLSS，XESS和FSR

UL的3Dmark历史悠久，应该是不少同学跑得最多的“游戏”，随着最新版本的3Dmark支持AMD的FSR技术，这样我们就可以用相同一张显卡测试三种技术，我们选择了NVIDIA最新上市的RTX4070。

inno3d超级冰龙RTX4070

DLSS，XESS和FSR是三种不同的图像超采样技术，它们的目的是在提高游戏性能的同时，保持或提高图像质量。它们的原理是将游戏以低于显示器的原生分辨率渲染，然后通过各自的算法将图像放大到原生分辨率。这样可以减少渲染所需的计算资源，从而提高帧率。

RTX4070在DLSS测试提升接近4倍

DLSS是英伟达推出的深度学习超采样技术，它利用专门的张量核心和人工智能模型来对图像进行放大和优化。DLSS通常能够在保持高图像质量的同时，提供最高的性能提升，但它需要RTX系列的显卡和特定支持DLSS的游戏才能使用。

RTX4070在XESS测试29.5%提升，不太完善

XESS是英特尔推出的超采样技术，它也使用了人工智能模型，但不依赖于专门的硬件核心。XESS有两个版本，一个是专为Arc系列显卡设计的，利用了XMX核心来加速人工智能计算，另一个是面向所有厂商的，使用了DP4a指令来进行人工智能计算。XESS在图像质量和性能方面介于DLSS和FSR之间，但它支持更多的显卡和游戏。

FSR是AMD推出的保真度FX超采样技术，它不使用人工智能模型，而是基于传统的空间上采样算法。FSR最大的优点是它支持几乎所有近五年内生产的显卡，并且容易集成到游戏中。FSR在性能方面也有不错的表现，但它在图像质量方面相对较差，尤其是在低质量模式下，最近在GDC也发布了第三代技术

RTX4070在FSR测试提升77.1%

我们看到FSR到了第三代，不仅是性能提升，也提到了减少延迟, 尚未知道是采用类似NVIDIA Reflex类似的方案，然后对于开发者来说非常友好，从FSR2到FSR3代码上并不需要很多的改进，因为这是开源在Github的（这也是PPT里面提到Permissive license，就是MIT授权，最常见的开源协议。）

我们以UE引擎来复习一下FSR系列技术吧， UE自带Spatial Upscaling和Temporal Upscaling（实际上就是类似TAA）两种，一般来说对于低分辨率的超分效果不是很好，所有才有AMD的FSR. 目前UE的插件支持4.27.1以后版本，而Unity则是从2021.2开始支持，对比起DLSS来说，FSR特别支持URP管线，而DLSS仅仅支持HDRP管线。FSR 3 的渲染管线如下：

FSR3管线图

上图大家基本上看到FSR几个版本的原理，FSR2 upscale部分是在PostFX和UI之前，这相当合理，在渲染管线越靠前的部分，性能提升越明显。到了FSR3，我们可以看到Upscale的部分不变，不同地方是在Present之前其实已经保存了两帧，对没错，粉红色和红色的present是正儿八经生成的frame，而灰色的部分就是interpolate（然后还有单独的pacer去present这帧）的frame，字面上性能就翻倍了。不过实际效果，还是要等开发者文档或者上真机测试才能看到。

百科

INNO3D 映众 GeForce RTX 4070 冰龙超级版显卡 12GB 黑色RTX 40系列基于全新设计的 Ada Lovelace GPU架构，核心架构代号是“Ada”，全新一代Ada核心采用台积电的4nm工艺打造，满血版拥有760亿个晶体管，18000个CUDA核心流处理器，相比上代“安培”满血版多70%。全新的SM多单元处理器性能超上一代2倍，精度达到了90TFLOPs，并引入了全新的SM多单元处理器，该技术可实时重新调度任务。光追性能提升2-3倍左右。全新的光追核心在处理光线与三角形求交时，性能提升了两倍。并且全新的Opacity Micromap引擎，将光追的Alpha-test几何性能提升了两倍。还有全新的TC张量核心增加了一个叫“Hopper FP8 Transformer”的新引擎，从而让张量处理性能提升了1.4 PetaFlops。以上多向新技术和引擎的加入，让这一代“Ada”核心即使原始光追性能不足的情况下，仍能确保高帧率，高画质运行，更好的利用GPU资源，最终光追性能提升约2-3倍，整体游戏性能提升25%。此代显卡使用新的NVIDIA DLSS 3技术，在DLSS 3的加持下，游戏性能最高可提升4倍。光追性能方面比上代得到大幅提升，光追游戏最高可提升4倍，在相同功耗下，可以带来超两倍的性能提升。RTX 4070 16GB搭载AD104-250 GPU核心，具有5888个 CUDA核心流处理器，基础频率1920MHz，加速频率2535MHz，显存方面，它配备12GB GDDR6X显存，显存位宽为128位，额定功耗为220W。全新设计的散热模组专为ADA架构GPU研发，使用正逆向风道设计，超大风扇叶，纯铜底座，高规格8热管组合；侧面带有超大RGB灯箱；配送显卡支架；全尺寸金属背板。视频接口：DP 1.4a*3+HDMI 2.1。值0 点评1 原创0 好价2去购买查看详情

百科

XFX 讯景 RX 7900 XT 海外版 PRO 显卡 20GB 黑色“海外版”显卡是由XFX讯景海外设计团队精心开发的高端产品系列，以干练的设计语言、丰富的散热配置、稳定的供电等特点著称。这款显卡使用金属显卡外罩，与金属背板形成浑然一体的金属质感。使用13片扇叶风扇，3*100mm风扇，双滚珠轴承，支持智能温控。使用大面积镀镍真空均热板，6mm直径热管，高低组合鳍片。使用14层环保PCB上设计有全数字17相供电。使用波浪压铸背板，有效防止PCB弯曲，保护PCB背部元件，PCB与背板之间增加导热垫。吹透式设计。带有XFX logo LED灯效。次旗舰型号 RX 7900 XT 拥有 84CU，5376 流处理器，GPU 频率 1500-2400MHz，单精度性能可达 52TFLOPS。显存为 20GB 20Gbps GDDR6，带宽可达 800GB / s，加上 80MB 无限缓存，等效带宽可达 2.9TB / s。显卡的 TBP 功耗为 300W，电源要求为 750W 起。RX 7900 XT 公版长度为 276 mm，2.5 槽厚，接口包括 DP 2.1、HDMI 2.1 和 USB-C。值0 点评1 原创3 好价8去购买查看详情百科

intel 英特尔 Arc A770 独立显卡 16GB英特尔全新锐炫系列 A770独立显卡基于Xe HPG架构打造，采用台积电7nm先进制程工艺，搭载GDDR6规格显存。支持硬件级别的实时光线追踪，并且满足完整的 DirectX 12 Ultimate，并拥有类似 DLSS 的 XeSS 超级采样技术。同时，得益于集成了AV1编码器，拥有比H.264编码器更快的效率，对于加速视频渲染这种创意内容制作更有优势。规格方面，集成32个Xe核心和32个光追单元，拥有4096个FP32单元（也可以说是4096个流处理器），256个纹理单元、12 8个ROP单元，核心频率2.4GHz，搭配显存256-bit 16GHz GDDR6，容量为16GB，带宽为560GB/s，支持PCIe 4.0 x16，整卡功耗225W。从跑分数据来看Arc A770的性能约在RTX3060Ti和RTX3070之间。显示输出接口部分由DP2.0*3和HDMI 2.1。值0 点评8 原创17 好价65去购买查看详情

作者声明本文无利益相关，欢迎值友理性交流，和谐讨论～