硬件最前线 篇109:哪家最强?RTX4070大战DLSS,XESS和FSR
2023-04-28 11:14:56
3点赞
0收藏
1评论
UL的3Dmark历史悠久,应该是不少同学跑得最多的“游戏”,随着最新版本的3Dmark支持AMD的FSR技术,这样我们就可以用相同一张显卡测试三种技术,我们选择了NVIDIA最新上市的RTX4070。
inno3d超级冰龙RTX4070
DLSS,XESS和FSR是三种不同的图像超采样技术,它们的目的是在提高游戏性能的同时,保持或提高图像质量。它们的原理是将游戏以低于显示器的原生分辨率渲染,然后通过各自的算法将图像放大到原生分辨率。这样可以减少渲染所需的计算资源,从而提高帧率。
RTX4070在DLSS测试提升接近4倍
DLSS是英伟达推出的深度学习超采样技术,它利用专门的张量核心和人工智能模型来对图像进行放大和优化。DLSS通常能够在保持高图像质量的同时,提供最高的性能提升,但它需要RTX系列的显卡和特定支持DLSS的游戏才能使用。
RTX4070在XESS测试29.5%提升,不太完善
XESS是英特尔推出的超采样技术,它也使用了人工智能模型,但不依赖于专门的硬件核心。XESS有两个版本,一个是专为Arc系列显卡设计的,利用了XMX核心来加速人工智能计算,另一个是面向所有厂商的,使用了DP4a指令来进行人工智能计算。XESS在图像质量和性能方面介于DLSS和FSR之间,但它支持更多的显卡和游戏。
FSR是AMD推出的保真度FX超采样技术,它不使用人工智能模型,而是基于传统的空间上采样算法。FSR最大的优点是它支持几乎所有近五年内生产的显卡,并且容易集成到游戏中。FSR在性能方面也有不错的表现,但它在图像质量方面相对较差,尤其是在低质量模式下,最近在GDC也发布了第三代技术
RTX4070在FSR测试提升77.1%
我们看到FSR到了第三代,不仅是性能提升,也提到了减少延迟, 尚未知道是采用类似NVIDIA Reflex类似的方案,然后对于开发者来说非常友好,从FSR2到FSR3代码上并不需要很多的改进,因为这是开源在Github的(这也是PPT里面提到Permissive license,就是MIT授权,最常见的开源协议。)
我们以UE引擎来复习一下FSR系列技术吧, UE自带Spatial Upscaling和Temporal Upscaling(实际上就是类似TAA)两种,一般来说对于低分辨率的超分效果不是很好,所有才有AMD的FSR. 目前UE的插件支持4.27.1以后版本,而Unity则是从2021.2开始支持,对比起DLSS来说,FSR特别支持URP管线,而DLSS仅仅支持HDRP管线。FSR 3 的渲染管线如下:
FSR3管线图
上图大家基本上看到FSR几个版本的原理,FSR2 upscale部分是在PostFX和UI之前,这相当合理,在渲染管线越靠前的部分,性能提升越明显。到了FSR3,我们可以看到Upscale的部分不变,不同地方是在Present之前其实已经保存了两帧,对没错,粉红色和红色的present是正儿八经生成的frame,而灰色的部分就是interpolate(然后还有单独的pacer去present这帧)的frame,字面上性能就翻倍了。不过实际效果,还是要等开发者文档或者上真机测试才能看到。
百科INNO3D 映众 GeForce RTX 4070 冰龙超级版 显卡 12GB 黑色RTX 40系列基于全新设计的 Ada Lovelace GPU架构,核心架构代号是“Ada”,全新一代Ada核心采用台积电的4nm工艺打造,满血版拥有760亿个晶体管,18000个CUDA核心流处理器,相比上代“安培”满血版多70%。全新的SM多单元处理器性能超上一代2倍,精度达到了90TFLOPs,并引入了全新的SM多单元处理器,该技术可实时重新调度任务。光追性能提升2-3倍左右。全新的光追核心在处理光线与三角形求交时,性能提升了两倍。并且全新的Opacity Micromap引擎,将光追的Alpha-test几何性能提升了两倍。还有全新的TC张量核心增加了一个叫“Hopper FP8 Transformer”的新引擎,从而让张量处理性能提升了1.4 PetaFlops。以上多向新技术和引擎的加入,让这一代“Ada”核心即使原始光追性能不足的情况下,仍能确保高帧率,高画质运行,更好的利用GPU资源,最终光追性能提升约2-3倍,整体游戏性能提升25%。此代显卡使用新的NVIDIA DLSS 3技术,在DLSS 3的加持下,游戏性能最高可提升4倍。光追性能方面比上代得到大幅提升,光追游戏最高可提升4倍,在相同功耗下,可以带来超两倍的性能提升。RTX 4070 16GB搭载AD104-250 GPU核心,具有5888个 CUDA核心流处理器,基础频率1920MHz,加速频率2535MHz,显存方面,它配备12GB GDDR6X显存,显存位宽为128位,额定功耗为220W。全新设计的散热模组专为ADA架构GPU研发,使用正逆向风道设计,超大风扇叶,纯铜底座,高规格8热管组合;侧面带有超大RGB灯箱;配送显卡支架;全尺寸金属背板。视频接口:DP 1.4a*3+HDMI 2.1。 值0 点评1 原创0 好价2去购买查看详情
百科XFX 讯景 RX 7900 XT 海外版 PRO 显卡 20GB 黑色“海外版”显卡是由XFX讯景海外设计团队精心开发的高端产品系列,以干练的设计语言、丰富的散热配置、稳定的供电等特点著称。这款显卡使用金属显卡外罩,与金属背板形成浑然一体的金属质感。使用13片扇叶风扇,3*100mm风扇,双滚珠轴承,支持智能温控。使用大面积镀镍真空均热板,6mm直径热管,高低组合鳍片。使用14层环保PCB上设计有全数字17相供电。使用波浪压铸背板,有效防止PCB弯曲,保护PCB背部元件,PCB与背板之间增加导热垫。吹透式设计。带有XFX logo LED灯效。次旗舰型号 RX 7900 XT 拥有 84CU,5376 流处理器,GPU 频率 1500-2400MHz,单精度性能可达 52TFLOPS。显存为 20GB 20Gbps GDDR6,带宽可达 800GB / s,加上 80MB 无限缓存,等效带宽可达 2.9TB / s。显卡的 TBP 功耗为 300W,电源要求为 750W 起。RX 7900 XT 公版长度为 276 mm,2.5 槽厚,接口包括 DP 2.1、HDMI 2.1 和 USB-C。 值0 点评1 原创3 好价8去购买查看详情百科intel 英特尔 Arc A770 独立显卡 16GB英特尔全新锐炫系列 A770独立显卡基于Xe HPG架构打造,采用台积电7nm先进制程工艺,搭载GDDR6规格显存。支持硬件级别的实时光线追踪,并且满足完整的 DirectX 12 Ultimate,并拥有类似 DLSS 的 XeSS 超级采样技术。同时,得益于集成了AV1编码器,拥有比H.264编码器更快的效率,对于加速视频渲染这种创意内容制作更有优势。规格方面,集成32个Xe核心和32个光追单元,拥有4096个FP32单元(也可以说是4096个流处理器),256个纹理单元、12 8个ROP单元,核心频率2.4GHz,搭配显存256-bit 16GHz GDDR6,容量为16GB,带宽为560GB/s,支持PCIe 4.0 x16,整卡功耗225W。从跑分数据来看Arc A770的性能约在RTX3060Ti和RTX3070之间。显示输出接口部分由DP2.0*3和HDMI 2.1。 值0 点评8 原创17 好价65去购买查看详情
作者声明本文无利益相关,欢迎值友理性交流,和谐讨论~
技术宅是我梦想
校验提示文案
技术宅是我梦想
校验提示文案