最强2K分辨率显卡来临 iGame GeForce RTX 4070 Ti Vulcan OC首发测评
大家好,我是黄昏百分百,英伟达 NVIDIA在CES 2023大会上正式发布了基于ADA架构的RTX 4070 Ti显卡,英伟达官方宣传其要比RTX 3090 Ti表现更好,且起售价格仅为799美元。
其将于2023年1月5日正式发售,我非常荣幸再次获得英伟达与七彩虹的联合邀请,参与到RTX 4070 Ti的首发测评中。
今天我们就一起来看一看,这款能够在CES大会上作为主角发布的显卡,性能表现到底如何。好了,废话不再多说,我们开车吧。
Ada Lovelace 架构优势分析
说到RTX 40系显卡,首先自然要为大家介绍一下其在制作工艺与架构上的升级,这里我先为大家介绍一下全新的Ada Lovelace架构。
新架构,新制程
▲NVIDIA Ada Lovelace 架构作为 GeForce RTX 40 系列显卡的核心,必须要放在最前面说。Ada 架构基于定制的 TSMC 4N 工艺,晶体管数量从上一代的 280 亿个激增至 760 亿个,是目前世界上工艺最精湛的 GPU 架构。
▲从图灵架构开始,英伟达开始采用 流式多处理器 (Streaming Multiprocessor,SM)架构以执行光线追踪等运算工作,上图左侧为全新Ada架构,右侧为30系所使用的安培架构,从图中可以看出,SM布局基本与上代保持一致,而最核心的变化便是其内Ada 4代 Tensor Core取代了安培架构中的3代的Tensor,用于光线追踪的RT CORE从安培架构的第二代RT CORE升级到了第三代RT CORE。不仅将光线与三角形求交性能提高了一倍,还将 RT-TFLOP 峰值性能提高了一倍之多。
▲而每两个SM组成一个纹理处理集群(Texture Processing Clusters,TPCs),再由多个TPC组成一个图形处理集群(Graphics Processing Clusters,GPCs)。
▲而Ada架构的GPU则是由多个GPC组成的,RTX 4070 Ti所搭载的AD 104芯片为例,其拥有5个GPC,30个TPC,60个SM,7680个 CUDA核心,并搭载了12GB 的192bit的GDDR6X显存。
▲技术方面,ADA架构的RTX显卡还带来了着色器执行重排序、微网格位移、不透明微遮蔽、FP8推理、光流加速器、DLSS 3。这几个技术,我会在后面详细介绍。
▲最后,在能效比方面,Ada 架构的效率也令人感到不可思议:在相同的功率下,其性能相较安培架构最高可达两倍以上;增大功率,性能还能持续提升。
第三代光线追踪 画面更加真实
这里先说一下着色器执行重排序 (SER) 技术吧。
▲高级光线追踪技术需要计算同一场景中数百万条光线照射在诸多不同类型材质上的效果,这就使得着色器只能低效地处理一系列截然不同的工作负载。(在渲染 3D 场景时,着色器用于计算恰当的亮度、暗度和颜色级别。每一款现代游戏都需要使用到着色器。)
着色器执行重排序 (SER) 技术能够动态调整这些工作负载的顺序,让原本低效的流程变得异常高效。SER 可将光线追踪操作的着色器性能最高提升 2 倍,或将游戏的帧率最高提升 25%。
▲通俗一点说,SER技术便是通过将排序,使显卡由逐个运算加法改为了运算乘法,自然效率能够得到大幅提升,同时不会增加显示延迟。
▲紧接着我们再说一下第三代RT CORE新搭载的两款引擎,除了在安培架构中已经使用的Box Intersection Engine与Triangle Intersection Engine两款引擎。Ada架构搭载的新款 RT CORE 还配备全新 Opacity Micromap (OMM) 引擎和 Displaced Micro-Mesh (DMM) 引擎。
▲OMM 引擎可大幅提升对 alpha 测试纹理进行光线追踪的速度,此类纹理通常应用于树叶、颗粒,围栏等。
▲以树叶为例,全新ADA架构RT Core搭载的OMM引擎可将树叶分为全透明部分,不透明部分与半透明部分,大幅减少着色器工作量,进而明显降低光线追踪对游戏性能的影响。
▲左侧为未开启OMM引擎时的着色器工作量,右侧为OMM引擎开启后的着色器工作量,可见OMM的性能立竿见影。
▲而面对珊瑚蟹这种极不规则,超多个平面(三角形)的物体,则需要DMM引擎来提升光追性能了。
▲相较于安培架构需要将多个三角形与复杂的BVH放入RT CORE中进行处理,ADA机构可以将图形转化为一个基础的三角形,一个Displace Map与一个简单的BVH,再放入RT CORE中进行处理。
▲因此,DMM 引擎能够以近乎 9 倍的速度构建光线追踪边界体积层次结构 (BVH),而所占用的显存只有之前的二十分之一。从而实现几何复杂场景的实时光线追踪。
DLSS 3 让帧数起飞
▲有一说一,光线追踪还是会对游戏帧数有一定的负面影响的,所以就需要DLSS来提升游戏帧数了,DLSS的全名是DEEP LEARNING SUPER SAMPLING(深度学习超级采样),是一种通过基于 AI 的超高分辨率重新定义实时渲染,即渲染更少的像素,然后使用 AI 构建更清晰、更高分辨率的图像的方法,可以有效的在不牺牲画质的情况下通过AI算法提升游戏的帧率表现。
▲从图灵架构的RTX 20系显卡开始,DLSS技术随着显卡架构一起进化,目前已经进化到了第三代DLSS,除了代表性的DLSS 超分辨率技术,还融合了DLSS帧生成技术与NVIDIA Reflex技术。
▲这里重点说一下DLSS 3中的潜在帧生成技术,其可通过对前后帧的分析,在两帧之间插入一帧,进而是游戏帧数有着近乎翻倍的提升。肯定有朋友会问,这个插帧技术与电视常用的MEMC插帧技术相比有什么区别。
▲这里便要说,电视因为其不参与画面渲染的过程,所以只能够通过算法与预测中间帧应该显示的画面,难免在阴影方面出现不准确的情况,导致插帧后画面不自然。而英伟达显卡的DLSS 潜在帧生成技术因为是在渲染过程中在光流加速器中发生的,所以可以获得准确的运动矢量(MOTION VECTORS),所以可以准确预测出中间画面所处的状态, 自然画面阴影效果就十分准确了。同时,生成的帧不需要CPU提供数据,因此整体帧率可以超过CPU渲染的帧率限制,大幅降低了对CPU性能的要求。
▲同时,DLSS 3 潜在帧生成技术与超分辨率技术结合,渲染1080P分辨率的原始画面,再超分辨率到4K画面,同时,2个4K分辨率的帧之间再生成一帧。所以,平均两个4K帧中,只有一张1080P的帧是CPU与显卡实际渲染的,占总生成画面的八分之一,可见DLSS技术对帧数提升之大。
我们来比较一下DLSS开启后对画面效果的影响,左侧为DLSS性能模式下的4K分辨率,右侧为原生4K画质:
▲首先看一看《赛博朋克2077》BenchMark中的截图,整体画面一眼看上去基本无差异,DLSS似乎能够无比接近原生分辨率了。
▲背景中的这个栏杆,DLSS画面还要比原生4K画质更加锐利清晰。
▲不过,背景的瓷砖上,开启DLSS后还是稍微有一点糊的,不过如果不像我这样放大多倍去找茬,是根本发现不了的。
▲在同BenchMark的酒吧场景中,DLSS开启后,画面效果则要明显比未开启DLSS时更加的透彻,顶部招牌也更加的锐利清晰,个人觉得本场景下DLSS的画质要明显优于原生4K分辨率。
▲同样,在网易大作逆水寒的测试中,DLSS开启后的地砖,相较原生4K分辨率的地砖,纹理上也更加清晰,可见在有光照充足的画面中,开启DLSS后的画面甚至可能超过原生4K分辨率的画质,且其能偶带来大幅度的帧数上升,还是很值得开启的。
NVIDIA REFLEX 低延迟技术
NVIDIA REFLEX 低延迟技术主要分为NVIDIA REFLEX SDK与NVIDIA Reflex延迟分析器,其中NVIDIA Reflex延迟分析器涉及到了外设、显示器等其它硬件,本文不做涉及,近介绍一下NVIDIA REFLEX SDK。
▲在传统的图像处理流程中,如果CPU 处理帧的速度快于 GPU 渲染帧的速度(高U低显),则会在CPU到GPU之间有一个等待渲染帧的队列,进而导致渲染延迟的增加。
▲而通过将NVIDIA REFLEX SDK直接集成到游戏中,就可以使CPU的帧处理速度与GPU的渲染速度保持同步,大幅降低渲染队列,并降低CPU背压,进而使游戏能够采样键鼠等外设最新的输入。最终降低画面与输入延迟,提高游戏体验。目前,NVIDIA REFLEX技术已经被集成在了DLSS 3中。
▲目前已经有超过35款游戏与软件支持DLSS 3,包括国产游戏《黑神话:悟空》、《光明记忆:无限》、《生死轮回》、《仙剑奇侠传 7》等。
NVIDIA RTX REMIX 让老游戏重获新生
▲有非常多的经典游戏,无论在剧情上还是游戏性上,都堪称经典,唯独游戏画面上受开发时间限制,已经跟不上现在的潮流。因此,英伟达开发了RTX REMIX软件,可以帮助MOD爱好者在AI的帮助下,对游戏画面进行光追化重构,让游戏重获新生。
▲NVIDIA RTX REMIX可以将素材资源整合给多个软件使用,进而大幅降低MOD制作难度,提高制作效率。
▲V社经典游戏《传送门》的RTX版DLC也已经上线,之前在Steam上拥有《传送门》原作的同学可以免费获得光追升级哦,游戏的画面效果可以说是立竿见影,算是老游戏重获新生的优秀例子了。各位MOD爱好者们也可以根据自己的喜好对旧游戏进行画质升级,我很好奇各位会拿NVIDIA RTX REMIX去升级哪些游戏的画质。
七彩虹 iGame GeForce RTX 4070 Ti Vulcan OC简介
▲本次使用的依旧是七彩虹的旗舰显卡iGame GeForce RTX 4070 Ti Vulcan OC, iGame是七彩虹的旗舰子品牌,而Vulcan则是iGame品牌中的扛鼎之作,可以说是旗舰中的旗舰,RTX 40系火神显卡相较于上代火神显卡拥有更为凌厉的造型,独特的锖铁色金属外骨骼更显凶悍,为其强劲的性能做出警告。作为后赛博时代的高端硬件,系列经典的锐利三角元素也将完美传承。漆黑的底色体现了它低调的个性,打造锋锐冷酷的高端硬件。9翼扇叶如镰刀般锋利厚实,散热性能甚至比前代13翼扇叶的风扇更加强劲,而且整体也显得更加简洁。
▲核心频率方面,iGame GeForce RTX 4070 Ti Vulcan OC基础核心频率未2310MHz~2610MHz,而按下七彩虹iGame系列显卡经典的一键超频按键后,其核心频率可以提升到2775MHz。
▲背板也经过了优化,部分铝制散热鳞片直接露出,大幅加大了与空气的接触面积,同时方面热空气向上流动,通过CPU水冷的灯牌排出机箱,避免造成闷罐。
▲而iGame 火神显卡最具识别度的LCD显示屏在本世代得到了巨大升级,不仅屏幕分辨率提升到了800*216px,画面更加清晰,而且采用磁吸式分体设计,无论显卡横装、竖装,屏幕内容总在你面前。
▲磁吸式分体设计的另一个好处便是其可以配合着底座独立显示内容,成为可爱的桌面摆件,也可以更好的帮助玩家实时监控游戏帧数与电脑性能。
▲将LCD屏幕取下时,也不用担心显卡没有灯效而难看,iGame专门提供了灯光配件,同样采用磁吸设计,贴上之后,炫酷的RGB立刻就回来啦!
▲通过全新的iGame Center软件,不仅可以调整硬件灯效,快捷的进行硬件超频,还可以为Vulcan系列显卡(包括之前几代Vulcan火神显卡)的LCD屏定制输出图案,且不只是静态图片,gif动图同样可以完美显示。
▲接口方面,依旧是3DP1.4a+1HDMI2.1的配置,另外,一键超频按钮也得到了工艺升级,目前不仅手感更好,而且更不易损坏。而在尺寸方面,iGame GeForce RTX 4070 Ti Vulcan OC为348.5*159.5*60.5mm(含挡片),要比iGame GeForce RTX 4080 16GB Vulcan OC的尺寸为348.5*159.5*70.4mm(含挡片)薄约10mm,因此更加适合相对小尺寸的机箱。
RTX 4070 Ti 是全新2K分辨率高刷游戏显卡
▲英伟达官方对RTX 4070 Ti的定位为能在2K分辨率(1440P)下,提供超高帧数的游戏显卡,得益于带有插帧功能的DLSS3技术,英伟达宣称RTX 4070 Ti的游戏性能要比上一代安培架构的卡皇RTX 3090 Ti表现还要好,因此我们今天的测评将会集中在2K分辨率。
RTX 4070 Ti 与RTX 3090 Ti 显卡性能快速比较
因为测评的显卡我只有使用权,没有所有权,RTX 3090 Ti已经还回去了,无法做详细的性能比较,所以这里简单拿当时测试留下来的RTX 3090 Ti的3D Mark 分数与RTX 4070 Ti的3D Mark分数进行一下比较。
▲3D MARK专为DirectX 12设计的Time Spy Extreme, Time Spy是一个DirectX 12 基准测试,支持原生新的API 功能,如异步计算,显式多显卡适配器技术和多线程,而其Extreme版本则是将分辨率提升至4K。
▲RTX 3090 Ti的Time Spy Extreme显卡得分为11228分。
▲RTX 4070 Ti的Time Spy Extreme显卡得分为11075分,基本与RTX 3090 Ti持平。
▲Fire Strike 是一项适用于高性能游戏电脑和超频系统的 DirectX 11 基准测试。即使对于最新的显卡而言,Fire Strike 测试也非常严苛。而Fire Strike Ultra是其4K版本。
▲RTX 3090 Ti的Fire Strike Ultra显卡得分为13516分。
▲RTX 4070 Ti的Fire Strike Ultra显卡得分为13354分。
经过以上两个测试,我们得知在不开启光线追踪与DLSS时,RTX 4070 Ti的性能基本上与RTX 3090 Ti持平,而因为ADA架构的RTX 4070 Ti能够使用支持插帧技术的DLSS 3,所以实际的游戏性能肯定是要比RTX 3090 Ti更强的。紧接着我们进行一下RTX 4070 Ti的单品游戏性能测试。
《3D MARK Time Spy》
▲在2K分辨率的3D Mark Time Spy中,RTX 4070 Ti的总分为21961分,显卡得分为22613分。
▲其中显卡测试1的帧率为147.76 FPS,显卡测试2的帧率为129.35 FPS,均很接近主流2K电竞显示器144Hz的刷新率。
▲而在2K 分辨率,使用DX 11的3D Mark Fire Strike中,RTX 4070 Ti的总分为25604分,显卡得分为26520分。
▲其中显卡测试1的帧率为141.73 FPS,显卡测试2的帧率为97.19 FPS,物理测试为125.66 FPS,同样很接近144Hz的主流2K电竞显示器的刷新率。
《3D Mark DLSS test》 游戏性能测试
▲3D Mark DLSS test是专门测试显卡DLSS性能的基准测试,其测试原理为连续进行两次的3D Mark Port Royal 光线追踪 基准测试,第一次为关闭DLSS功能,第二次为开启DLSS功能,通过游戏帧数变化来测试DLSS功能对游戏性能的提升,目前3D Mark DLSS test 1.3版本已经支持DLSS 3的潜在帧生成技术。
▲在DLSS功能关闭时,RTX 4070 Ti能够提供64FPS左右的帧率,刚好能满足2K 60Hz显示器的刷新率,开启DLSS 2质量模式时,帧数可以上升至105FPS左右。
而DLSS 3开启后,帧数可以暴增至127.22 FPS,以满足2K高刷显示器的需求。
《赛博朋克 2077》 BenchMark
▲紧接着我们测试《赛博朋克2077》,这款大作的正式版也已经支持DLSS 3了,我们一起去体验光追效果出众的夜之城魅力吧。
▲画质设置上依旧为2K分辨率,预设光线追踪超级,同时分别开启与关闭DLSS 3质量模式。
▲在测试的过程中,我们将使用NVIDIA最新推出的游戏性能监测软件FrameView来进行测试,其可以实时记录游戏中的帧率、1% Low帧率与延迟等参数,并汇总生成CSV数据库,简单来说,FrameView可以使没有内置Benchmark的游戏也能有拥有更客观准确的性能测试方法。
这里我再补充一下为什么1% Low帧率十分重要,试想一下:
在玩PUBG的时候,你通过十几分钟的搜刮,神装全部到手,但是与人对枪的时候卡了一下,直接被爆头成盒了,这种搜刮十分钟,成盒一秒钟的经历是什么感受。游戏中往往最激烈对抗时的帧数,才是决定游戏成败的核心要素,因此,1% Low时的帧率可能要比那99%不激烈对抗时的帧率还要重要!
▲在实际测试中,iGame GeForce RTX 4070 Ti Vulcan OC在未开启DLSS时平均帧率为53 FPS,1% Low 帧率为36 FPS,延迟为40ms。
开启DLSS 3后,iGame GeForce RTX 4070 Ti Vulcan OC的平均帧率暴涨到了126 FPS,1% Low 帧率为89 FPS,延迟则降低到了39ms。
从53FPS到126FPS,DLSS 3使显卡的游戏帧数提升到了未开启时的2.37倍,也将游戏流畅度从普通办公用的60Hz显示器拉升到了电竞高刷显示器的级别。
《F1 22》 BenchMark
▲游戏测试中,F1Ⓡ 22为例,它支持NVIDIA DLSS和光线追踪不透明反射、光线追踪透明反射、光线追踪环境光遮蔽和光线追踪阴影几项技术,同时支持DLSS 3并内置了Benchmark。
▲测试分辨率为2K预设最高画质,iGame GeForce RTX 4070 Ti Vulcan OC在未开启DLSS时平均帧率为112 FPS,1% Low 帧率为97 FPS,延迟为44ms。
开启DLSS 3后,iGame GeForce RTX 4070 Ti Vulcan OC的平均帧率暴涨到了203 FPS,1% Low 帧率为180 FPS,延迟则降低到了36ms。
即使不开启DLSS功能,iGame GeForce RTX 4070 Ti Vulcan OC也能轻松应对2K分辨率下的《F1 22》,可见其优化之好,而开启DLSS 3之后,200+的FPS更是能让玩家有着飞一般的感觉,驾驶感受越加真实了。
《瘟疫传说:安魂曲》
▲《瘟疫传说:安魂曲》也是首批支持DLSS 3的游戏之一,其正式版已经发布,目前其已经支持DLSS3,且将很快更新对光线追踪的支持,是很值得玩的全新3A大作。
▲经实测,iGame GeForce RTX 4070 Ti Vulcan OC在未开启DLSS时平均帧率为118 FPS,1% Low 帧率为63 FPS,延迟为47ms。
开启DLSS 3后,iGame GeForce RTX 4070 Ti Vulcan OC的平均帧率上升到了155 FPS,1% Low 帧率为90 FPS,延迟则降低到了40ms。
目前这款游戏还不支持光线追踪,不过很快就要更新支持光线追踪了,目前DLSS 3对帧数的提升主要还是在1% Low上更加明显,而相信未来支持光线追踪后,DLSS 3的优势会体现的更加明显。
《光明记忆:无限》
▲《光明记忆:无限》是一款国内飞燕群岛工作室的作品,此工作室在英伟达新技术的应用上可以说处于世界领先水准,首代游戏《光明记忆》便同时支持光线追踪技术与DLSS技术,我当时还专门做过光线追踪的效果测试,而续作《光明记忆:无限》更是直接赠送给了首代游戏的玩家,目前已支持DLSS 3。
▲经实测,iGame GeForce RTX 4070 Ti Vulcan OC在未开启DLSS时平均帧率为120 FPS,1% Low 帧率为91 FPS,延迟为21ms。
开启DLSS 3后,iGame GeForce RTX 4070 Ti Vulcan OC的平均帧率上升到了170 FPS,1% Low 帧率为210 FPS,延迟未26ms。
简单来说,不开启DLSS时,刚好可以跑满2K 120Hz-144Hz的主流2K电竞显示器的刷新率,而开启DLSS 3之后,则进入了高端2K 电竞显示器(2K 240Hz)的行列。
这里必须赞叹一句,飞燕群岛工作室对于光线追踪技术与DLSS技术的掌控是真的纯熟,即使游戏中光线追踪拉满,关闭与开启DLSS时分别能够有着120FPS与210FPS的高帧率,实在是优化的太好了,国产游戏制作者如果都能有这个水平,还愁缺少国产3A大作吗?
《生死轮回》
▲《生死轮回》(Loopmancer)是一款国产赛博风横板动作游戏,目前正式版已更新,支持DLSS 3和光线追踪反射。
▲经实测,iGame GeForce RTX 4070 Ti Vulcan OC在未开启DLSS时平均帧率为81 FPS,1% Low 帧率为59 FPS,延迟为26ms。
开启DLSS 3后,iGame GeForce RTX 4070 Ti Vulcan OC的平均帧率上升到了173 FPS,1% Low 帧率为132 FPS,延迟则降低到了的26ms。
开启DLSS 3后,RTX 4080 16GB的帧率是开启DLSS前的238%。
简单来说,DLSS 3让游戏的帧数直接翻倍了!
《暗影火炬城》
▲前几天EPIC刚送的《暗影火炬城》,是由上海钛核网络负责开发的柴油朋克风类恶魔城游戏,支持光线追踪与DLSS 3,另外,过场的3D演出有全中文配音,国味十足,各种动物都萌坏了,强烈建议大家体验一下。
▲经实测,iGame GeForce RTX 4070 Ti Vulcan OC在未开启DLSS时平均帧率为128 FPS,1% Low 帧率为66 FPS,延迟为34ms。
开启DLSS 3后,iGame GeForce RTX 4070 Ti Vulcan OC的平均帧率上升到了199 FPS,1% Low 帧率为147 FPS,延迟则降低到了惊人的22ms。
开启DLSS 3后,iGame GeForce RTX 4070 Ti Vulcan OC的帧率提升到未开启DLSS时的1.55倍。
《毁灭全人类 2:重新探测》
《毁灭全人类 2:重新探测》是一款讲述外星人狂轰滥炸地球的邪典故事。玩惯了正派英雄为主角的游戏,玩玩反派主角做调剂也很不错,最新更新后的游戏支持DLSS 3。
▲经实测,iGame GeForce RTX 4070 Ti Vulcan OC在未开启DLSS时平均帧率为91FPS,1% Low 帧率为47 FPS。
开启DLSS 3后,iGame GeForce RTX 4070 Ti Vulcan OC的平均帧率上升到了237 FPS,为105 FPS。
开启DLSS 3后,iGame GeForce RTX 4070 Ti Vulcan OC的帧率是开启DLSS前的260%!提升幅度非常巨大。
《地铁:离去 加强版》 Benchmark
▲《地铁:离去》是全球首款支持RTX光线追踪的游戏,由4A Games开发,因为其自带功能选项非常齐全的BenchMark,成为了众多装机爱好者们必备的跑分神器。其更新后的加强版支持全新光线追踪技术与DLSS 2.0,是一个很不错的跑分游戏,这里用它便是为了测试RTX 4070 Ti在DLSS 2下的表现。
▲画质为预设最高(Extreme),在关闭DLSS功能时,99%高的平均帧率可达58.64 FPS,刚好跑满2K 60Hz的显示器。
▲而开启DLSS功能后,99%高的平均帧率增至 93.42FPS,游戏流畅度上升到了未开启DLSS时的1.5倍,配得上2K的高刷新率显示器了。
ADA架构显卡优秀的每瓦功率
▲TGP是GPU运行时的能耗上限,在运行诸如大型游戏等高功耗应用是,GPU功耗可能会达到TGP,而RTX 4070 Ti的TGB为285W,在刚才我所进行的测试中,NVIDIA游戏性能监测软件FrameView所记录下的平均功耗最高为247w,最低为179w,可见在2K最高画质下进行游戏时,RTX 4070 Ti的供电与散热仍有很大冗余空间,足以应对更严苛的任务,这些都是得益于NVIDIA全新的ADA架构以及TSMC 4N所带来的每瓦性能提升。
RTX 4070 Ti亦可当作生产力工具使用
英伟达 NVIDIA的显卡在生产力方面一直表现极为优秀,无论是CUDA运算还是渲染能力,都具有着十分明显的领先地位,而RTX 4070 Ti搭载了12GB的GDDR6X显存,只要不是处理极为占用显存的大型渲染工作,还是可以很轻松的应付的,这里便为大家呈现RTX 4070 Ti的生产力测试环节。
RTX 40系显卡支持AV1编解码硬件加速
▲AV1是由intel、微软、亚马逊、网飞等公司共同推出的免版权费编码格式,在同等体积下相较其它格式要有更优质的画面,而在压缩同样码率的视频的时候,则可以拥有更小的体积。
▲在iGame GeForce RTX 4080 16GB Vulcan OC的测试中,我使用了达芬奇 DaVinci Resolve进行AV1编解码硬件加速的测试,不过毕竟达芬奇是收费软件,使用门槛还是比较高的,所以今天我们测试一下国产的免费剪辑软件剪映专业版,同样支持英伟达RTX 40系显卡的AV1AV1编解码硬件加速。
▲英伟达提供了4K、8K的RAW格式视频各一个,之前我通过达芬奇 DaVinci Resolve均进行的编解码测试,有兴趣的大家可以去看我的iGame GeForce RTX 4080 16GB Vulcan OC测评,而剪映专业版目前最高支持4K 60Hz的视频剪辑,所以这里仅测试4K的素材,仅2分多钟的视频,居然有12.2GB的超大体积。
▲视频导出参数为4K 30FPS,更高码率,分别以AV1编码与H265编码进行导出。
▲iGame GeForce RTX 4070 Ti Vulcan OC在开启硬件加速时以AV1格式导出本视频仅用时约16秒。
▲而以同样的参数开启硬件加速,导出 4K H265格式的视频时,则同样用时约26秒,比开启硬件加速时导出AV1格式的视频慢了62.5%,可见视频的时长越长,通过硬件加速导出AV1格式的视频对时间的节约也越加明显。
▲实际播放中,同分辨率下,AV1格式的视频要比H.265格式的视频更清晰一些,不过图传上传到网上后压缩会比较严重,所以大家可能看的不是很清楚,建议大家有机会也可以自己下载一组AV1视频与H.265进行比较。
▲这时我们再来比较体积,AV1编码的视频仅占595MB,相较于782MB的H265编码视频,瘦身了约31.4%。
因此,开启硬件加速后,AV1编码格式视频的导出速度比H265视频导出速度更快,体积还更小,储存、上传更加方面,可以大幅提升内容创作者的生产速度。
V-Ray 5 Benchmark 测试
▲首先我们使用V-Ray 5 Benchmark进行测试,这款软件内置了3个测评项目,分别为用于测试CPU的V-Ray测试,可以同时测试CPU与GPU的V-Ray GPU CUDA,以及考验显卡RTX渲染功能的V-Ray GPU RTX测试。本次测试中我们只测试V-Ray GPU CUDA测试的单GPU模式与V-Ray GPU RTX测试。
▲RTX 3080 10GB的V-Ray GPU CUDA得分为1754分,而iGame GeForce RTX 4070 Ti Vulcan OC的得分为2313分,是RTX 3080 10GB得分的1.32倍。
▲RTX 3080 10GB的V-Ray GPU RTX得分为2362分,而iGame GeForce RTX 4070 Ti Vulcan OC的得分为3072分,是RTX 3080 10GB得分的1.3倍。
OctaneBench benchmark 测试
▲OctaneBench是目前最流行的GPU渲染基准测试之一,其内置了一系列渲染测试,这里我同样分别进行了RTX 4070 Ti与RTX 3080 10GB 的渲染性能测试。
▲RTX 4070Ti 的OctaneBench得分为723.41分。
▲RTX 3080 10GB的OctaneBench得分为553分。
通过OctaneBench测试,RTX 4070Ti的渲染能力大约是RTX 3080 10GB的1.3倍。
Blender Open Data benchmark 测试
▲Blender是一款开源 3D 创建套件。它支持3D 建模、动画、视频编辑等诸多功能,同时支持NVIDIA RTX 渲染OptiX AI 降噪。在RTX 3090 Ti的测试中,我便使用了junk shop进行了光追渲染测试。
而Blender Open Data Benchmark将进行monster、junkshop、classroom三个场景的渲染测试,本次将同样比较RTX 4070 Ti与RTX 3080 10GB。
▲在iGame GeForce RTX 4070 Ti Vulcan OC的测试中,monster、junkshop、classroom三个场景的得分分别为3666,1519,1613分。
▲而RTX 3080 10GB的测试中,monster、junkshop、classroom三个场景得分分别为2477,1304,1061分。
在三组测试中,RTX 4070 Ti的得分分别是RTX 3080 10GB的1.48倍、1.17倍、1.52倍。
经过以上几款软件的渲染测试,可知RTX 4070 Ti的渲染能力大约是RTX 3080 10GB的1.3到1.5倍,而且显存容量也增大了20%,对于生产力用户还是比较值得考虑升级的。
总结
首先,RTX 4070 Ti是非常优秀的2K游戏显卡,有了DLSS 3的加持,在绝大多数游戏中,即使画质最高,光追全开,依旧能够提供144 FPS甚至更高的帧率,满足目前主流电竞显示器的输入需求,
同时,12GB的GDDR6X显存,以及AV1格式的编码、解码能力,使其也可以在一定程度上作为生产力工具使用,进行4K、8K视频渲染、输出,以及建模等工作。
关于购买建议,个人建议使用RTX 3080及以下显卡的朋友,如果未来仍打算使用2K分辨率的高刷显示器进行游戏,亦或者进行轻、中度的生产力工作或视频内容创作工作,RTX 4070 Ti将是您不错的选择。
本次评测所使用的七彩虹iGame GeForce RTX 4070 Ti Vulcan OC显卡,在做工和用料上可以说是整个市面上RTX 4080显卡的金字塔尖了。七彩虹作为显卡销量第一的品牌,在性能,设计,做工上一直在精益求精,作为从RTX 20系便入坑的七彩虹老粉,七彩虹iGame显卡在设计与工艺上的不断进步一直被我看在眼里,这里必须点一个大大的赞!
以上便是本次七彩虹iGame GeForce RTX 4070 Ti Vulcan OC显卡测评正文部分的全部内容,希望对你有所帮助,别走开,后面还有本次测评的其他硬件介绍,想要直接装整机的朋友,不妨来抄一下我的作业。
本次测评硬件简介
CPU intel 酷睿i9-12900K
▲12代酷睿首发时我便拿到了i9-12900K,虽然现在13代酷睿测测评已经解禁,为了方便大家比较RTX 4080 16GB与RTX 4090的性能差异,我继续使用12代酷睿来进行测试。
▲Intel 在12代酷睿上首次使用了大小核心设计,i9-12900K/KF共有16个核心,其中分为8个性能核(P核)+与能效核(E核),其中性能核支持多线程技术,主要用于对核心性能要求高的游戏与生产力需求,而能效核不支持超线程技术,用于多任务处理。因此i9-12900K为一款16核24线程的处理器。
主板 七彩虹CVN Z790D5 Gaming FROZEN 巡洋舰
▲本次测试使用的是七彩虹CVN Z790D5 Gaming FROZEN 巡洋舰主板,CVN系列是七彩虹从航母外观中获得了设计灵感,以上层水准的用料与高端的散热装甲以主攻中高端消费级市场的次旗舰系列。本代CVN系列主板更是弄弄的硬核军事风,还以各种军舰作为中文名,比如我这款便叫作巡洋舰,反正用了七彩虹CVN的主板,大家就都是船长了。
▲看一个主板的做工和用料,首先肯定是要看它的供电部分,稳定的供电是所有的硬件稳定运行的保证。在CPU的供电上,CVN Z790D5 Gaming FROZEN 巡洋舰采用的是16+1+1相F.C.C铁素体电感供电,配备了55A大电流大的L.R.T 8脚MOS,可以在保证自身供电稳定性的同时降低电感线圈对其它元件的干扰。10K黑金固态电容提供稳定的滤波效果,又没有爆浆危险,用料上还是可以的,700系主板出场时便支持Intel 13代酷睿处理器,晚一点我也有可能用这款CPU测试13900K与12900K的性能差异。
内存 十铨(Team) DELTA DDR5 6400MHz
▲七彩虹CVN Z790D5 Gaming FROZEN 巡洋舰官方标称内存支持OC 6600MHz,不过目前市面上XMP 频率6600MHz的内存太少了,所以这里我专门选择了十铨(Team)的 DELTA DDR5 6400MHz,其支持intel XMP 3.0技术,可以一键超频至6400MHz,而且搭载了On-die ECC储存机制,可以使系统运行更稳定。
▲除了本次使用的黑色款,十铨(Team) DELTA DDR5还有白色可选,以适应不同的装机风格。
SSD 宏碁掠夺者 Predator GM7000 2TB
▲SSD固态硬盘采用的是宏碁掠夺者 Predator的GM7000 2TB, 此前PS5新手向科普文章中使用的就是Predator GM7000,完美支持PS5主机扩容。宏碁掠夺者GM7000官方标称的读写速度分别为7400MB/s与6700MB/s,其中7400MB/s的顺序读取速度在目前的PCIe 4.0固态硬盘中属于绝对的第一匹队,放在此次测试中绝对不会成为显卡读取游戏内容的瓶颈。另外,Predator GM7000采用12nm先进制程主控,PCB布局更紧凑,能够有效降低SSD功耗及发热量,长时间测试下来也不会掉速。
▲经实测,宏碁掠夺者 Predator的GM7000顺序读取速度为7477MB/s,顺序写入速度为6661MB/s,顺序读写速度都符合标称速度,绝对属于目前PCIe 4.0 SSD的第一梯队,可以保证两张显卡测试的稳定运行。
▲之所以选择使用2TB的系统盘,主要原因便是现在的游戏实在是太大了,动辄几十上百个GB,一部蓝光原盘电影也要40、50个GB,512GB乃至1TB的硬盘很容易就装满变红,影响性能表现,而2TB到4TB的则很少会遇到这种问题,当然,如果还是不能满足你的储存需求,那么你需要再补充机械硬盘或者NAS了。
水冷 超频三 PD360增压式水冷
散热器使用的是超频三最新发布的玩家系列PD360增压式水冷。
▲其采用了精雕铝制散热冷头,外观很是炫酷。
▲全紫铜底座有着超大的热交换面积,期内更是有着约为0.06mm的超微水道,可以快速带走CPU产生的热量。
▲模拟涡轮结构的高性能增压风扇,可以提供71.86CFM的风量与2.64mmH2O的风压。
▲官方标注其可以压住280W功耗的i9-12900K,在本次测试中,超频3 PD360水冷也很好的压制住了我的i9-12900K,表现很令我满意。
电源 安钛克 HCG 1000 金牌全模组电源
▲为了保证在测试中显卡与CPU时刻获得充足的供电,本次测试使用的是安钛克的HCG HIGH CURRENT GAMER 1000 金牌全模组电源,十年换新。以组一台电脑用5年这么算,HCG 1000也足够换到下一台电脑上继续使用,算是名副其实的传家宝系列。
▲HCG 1000是一款全模组电源,这款电源的接口中,M/B为主板接口,采用18+10PIN供电;PCI-E/CPU接口共有8组,可以满足多显卡交火或双CPU服务器主板用户的供电需求;SATA/Molex接口共有4组,能够满足挂载N块硬盘的个人数据中心的接口需求。1000W的供电可以保证绝大多数高端硬件的供电,以确保测试过程中不会有任何电力吃紧。
机箱 追风者(PHANTEKS) 518XTG 幻影白
▲这款机箱的模块化成都非常高,基本上每一块都可以拆卸或移动,走线时非常方便。
▲虽然这款机箱的两侧均为玻璃制成,但因为背面有着走线挡板的存在,哪怕不是理线高手,也可以把线藏得无影无形,做到眼不见则心不烦。
▲另外,同时支持双360冷排,显卡竖装等,也使得这款显卡成为了数一数二的水冷显卡、高端装机的优选机箱,我一开始是想换一个黑色机箱来测火神的,不过因为手头的机箱都不够长,所以本次便继续使用白色机箱装黑显卡啦。
作者声明本文存在利益相关性,请大家尊重作者及分享的内容,友善沟通,理性决策~
剑客000
校验提示文案
弗老大
校验提示文案
Lux-Tesla
校验提示文案
海绵宝宝
校验提示文案
leve-muma
校验提示文案
杀价党
iGame GeForce RTX 4070 Ti Neptune OC 零售价7699
iGame GeForce RTX 4070 Ti Advanced OC 零售价6999
iGame GeForce RTX 4070 Ti Ultra W OC 零售价6799
战斧 GeForce RTX 4070 Ti 豪华版 零售价6499
校验提示文案
钢琴谱
校验提示文案
值友storm63_vx_
校验提示文案
杀价党
校验提示文案
饕餮好难写
校验提示文案
_花舞清风_
校验提示文案
弗老大
校验提示文案
剑客000
校验提示文案
Lux-Tesla
校验提示文案
_花舞清风_
校验提示文案
饕餮好难写
校验提示文案
杀价党
校验提示文案
杀价党
iGame GeForce RTX 4070 Ti Neptune OC 零售价7699
iGame GeForce RTX 4070 Ti Advanced OC 零售价6999
iGame GeForce RTX 4070 Ti Ultra W OC 零售价6799
战斧 GeForce RTX 4070 Ti 豪华版 零售价6499
校验提示文案
值友storm63_vx_
校验提示文案
leve-muma
校验提示文案
海绵宝宝
校验提示文案
钢琴谱
校验提示文案