NVIDIA、AMD主流显卡视频生产力测试:RTX Studio生态 VS 通用型OpenCL

2021-02-03 15:26:08 6点赞 13收藏 5评论

2020年注定是不平凡的一年,越来越多的人用视频记录下自己的生活,这也让原本就非常火爆的短视频的数量呈爆炸式的增长。视频剪辑不再成为一个小众需求,而是逐渐大众化了,每个人都想通过视频这种形式留下我们自己的回忆,我也不例外。但工欲善其事,必先利其器。为了提高视频的产出的效率,我必须尽可能的缩减与视频创作无关的时间成本,这里面最大的成本其实就是后期导出。

CPU渲染视频的时代已经过去了,我知道现在的显卡在视频剪辑中可以提供非常大的助力,这个时候一张好显卡的重要性就体现出来了。为了搞明白主流市场上到底哪张显卡更适合视频生产力的创作,我选择了NVIDIA家的主力显卡RTX 3080、RTX 3070以及AMD的RX 6800 XT、RX 6800共计四张显卡进行横向对比测试,看看单纯的从视频内容创作而言到底哪张显卡是最合适的、最值得购买的。

NVIDIA、AMD主流显卡视频生产力测试:RTX Studio生态 VS 通用型OpenCL

在本次的测试之前,可以先简单看一下N/A两家最新一代显卡架构针对视频渲染软件的优化。

Ampere架构下的RTX Studio

NVIDIA这次RTX 30系列GPU在生产力方面做出了非常多的优化,相比RTX 20系列显卡进步明显,这部分我已经讲解过多次,这里不再赘述。如果你想仔细了解这一步的内容,可以点击这个链接查看。

NVENC加入到Premiere Pro工作流

在Premiere Pro的视频制作工作流当中,主要分为了原始素材导入、剪辑与添加效果,以及最后的成片导出三个主要阶段,对于硬件来说,在第一阶段的素材导入时,目前主要是利用CPU来进行解码(decode)工作的,而到了第二阶段的视频剪辑过程,处理这些操作的仍然主要是CPU,但如今的视频制作不仅仅是对素材进行简单的修剪、拼接,还会有各种转场、字幕、调色、颗粒化等等进阶效果,如果这些全靠CPU来回放预览,处理起来会非常卡顿和缓慢,所以在过去有不少视频工作者,会对原始素材进行生成代理文件,以降低对CPU资源的占用。

为此Adobe与NVIDIA一起合作,在PR中加入了支持利用GPU来处理回放、效果、多轨道预览等操作,以提升处理效率。这便是Mercury Playback Engine,它可以利用GPU来显著加速视频剪辑阶段的工作效率。

NVIDIA、AMD主流显卡视频生产力测试:RTX Studio生态 VS 通用型OpenCL

在目前最新版本的Premiere Pro里面,NVIDIA GPU已经支持非常多的效果加速,包括大家常用的变形稳定器、模糊、裁剪,以及Lumetri调色等等,这些在过去都是需要CPU,耗费大量时间去做分析和运算,但现在有了GPU的帮助,可以更快完成这些效果的合成速度,让剪辑工作变得更顺畅。

最后当大家把素材剪好、加完效果后,就要到第三阶段的导出视频了,而这次Preimere Pro的大升级,便是针对这一部分引入了额外的硬件加速,因为过去这个环节,其实也是更多采用CPU来进行编码(encode),由此可见现阶段CPU性能提升已经不足以满足视频处理的需要了。而GPU则将很多工作一点一点的接了过来,在整个工作流中扮演着越来越重要的角色。

RDNA 2架构的生产力提升

NVIDIA、AMD主流显卡视频生产力测试:RTX Studio生态 VS 通用型OpenCL

从AMD官方给出的PPT来看,在视频渲染软件达芬奇、PR中,RDNA 2架构也是进步明显,在PR的一个项目中甚至性能甚至可以达到老GCN架构的3倍。此外,PR在今年的新版本也加入了A卡乃至APU的AFM硬件加速支持,因此RDNA 2架构现在的生产力性能也是得到了一个明显的进步。

创意应用测试

测试平台与说明

NVIDIA、AMD主流显卡视频生产力测试:RTX Studio生态 VS 通用型OpenCL

至于整个测试平台,我们搭建了一套AMD Ryzen 7 5800X平台,搭配的X570主板提供了PCI-E 4.0插槽,5800X可以说是目前在游戏性能以及创造性能上都兼具的性价比CPU,使用这颗CPU进行显卡的生产力测试不会产生瓶颈。

视频剪辑测试

Adobe Premiere Pro

NVIDIA、AMD主流显卡视频生产力测试:RTX Studio生态 VS 通用型OpenCL

作为视频后期工作中最流行的软件,Premiere Pro很早就支持了CUDA运算的水银加速,帮助加快视频剪辑操作,而且Adobe还利用上RTX GPU的AI运算能力,来解决一些重复繁琐的工作,比如AutoReframe,这大大提高了如今流行的竖屏视频制作效率,另外从2020版本开始,在视频最后的导出阶段,现在还支持利用NVENC来加速编码,相比传统的软件编码,大大缩短了导出时间。此外,AMD显卡也在这次更新中得到了基于OpenCL的AFM硬件加速支持,两家显卡终于可以在PR上进行同步PK了。

NVIDIA、AMD主流显卡视频生产力测试:RTX Studio生态 VS 通用型OpenCL


NVIDIA显卡开启渲染CUDA加速

NVIDIA、AMD主流显卡视频生产力测试:RTX Studio生态 VS 通用型OpenCL


AMD显卡开启渲染OpenCL加速

NVIDIA、AMD主流显卡视频生产力测试:RTX Studio生态 VS 通用型OpenCL


NVIDIA显卡开启NVEDC编码硬件加速

NVIDIA、AMD主流显卡视频生产力测试:RTX Studio生态 VS 通用型OpenCL


AMD显卡开启AFM编码硬件加速

NVIDIA、AMD主流显卡视频生产力测试:RTX Studio生态 VS 通用型OpenCL

在Premiere Pro中我们可以看到四张显卡的表现,总体上看RTX 3080与RTX 3070都比RX 6800 XT以及RX 6800要好。并且在PR这个软件中,同一系列的显卡差距并不大,可以说导出时间是几乎一致的。如果你的主力视频制作是软件是PR的话,其实买一个低端产品就足够了,这是因为同一系列的显卡中的编码单元是一样的,并不会因为SM/CU单元数量有所区别。

与此同时我还做了只用CPU渲染的情况作为对比测试,可以看到四张显卡的渲染时间都远远小于Ryzen 7 5800X,CPU渲染视频的效率现在被显卡拉的太远了,推荐大家一定要下载最新版本的PR并且开启硬件加速,从而提高自己的导出速度。

BMD DaVinci Resolve

在视频调色和剪辑工作中有着重要地位的DaVinci Resolve,向来都是个硬件优化良好的软件,可以在显卡的帮助下,进行高分辨率视频的剪辑工作,这款软件现在在也受到越来越受到欢迎。同时相比PR来说,这款软件对内存、显存的需求也更高。

NVIDIA、AMD主流显卡视频生产力测试:RTX Studio生态 VS 通用型OpenCL

而除了性能方面的加速,还在功能方面有利用到硬件的特性,DaVinci Resolve通过NVIDIA RTX系列GPU特有的Tensor Core,来做一些AI功能的加速运算,比如稳定器的补帧、Super Scale、自动适配调色等,不少高级剪辑工作中会用到的操作,提高视频后期用户的工作效率。

NVIDIA、AMD主流显卡视频生产力测试:RTX Studio生态 VS 通用型OpenCL


NVIDIA显卡开启CUDA硬件加速

NVIDIA、AMD主流显卡视频生产力测试:RTX Studio生态 VS 通用型OpenCL


AMD显卡开启OpenCL硬件加速

NVIDIA、AMD主流显卡视频生产力测试:RTX Studio生态 VS 通用型OpenCL

DaVinci Resolve相对来说更能体现显卡间的性能差别,但在5个DEMO测试中,A卡的渲染时间都是较长的,其中第三个和第五个DEMO中落后的尤为明显,我曾经怀疑是我自己测试出错,但经过多次的重启以及驱动检查,结果都是如此。这已经不是第一次出现这种问题了,之前的测试中就出现过这种情况。打开任务管理器果然还是老毛病。

NVIDIA、AMD主流显卡视频生产力测试:RTX Studio生态 VS 通用型OpenCL

在达芬奇渲染的时候,A卡负责硬件加速的Compute 1单元的占用率呈锯齿形,经过实际观察,每过一秒钟这个单元的占用率就会下降一下,再升上来,如此反复直至渲染完成,这个应该说是一个很奇怪的事情,很明显这个问题让A卡没能完全发挥出实力,最后的结果就是导出时间非常的长。

这种情况的发生跟目前A卡暂时未推出相应的Studio驱动不无关系,游戏的驱动跟生产力驱动本来就是针对性软件不同,一个侧重实际游戏,一个侧重生产力软件,如果一起用的话就可能会出现上面的问题。这方面NVIDIA确实做的不错,意识到了混用两个驱动可能会给生产力软件带来不便,因此特意推出了RTX Studio驱动以及GeForce Game Ready两个方向的驱动供玩家选择。

NVIDIA、AMD主流显卡视频生产力测试:RTX Studio生态 VS 通用型OpenCL

此外,使用达芬奇软件的时候A卡还有一个小问题,不知道为什么同样的素材,N卡从导入素材到可以编辑并导出的等待时间比A卡短了不少,理论上素材都放在同样的硬盘里,响应时间两者应该几乎没有差别才对。但事实上A卡在导入素材之后要耐心等待一段时间才能完成编辑并导出的操作,此时画面为黑屏状态,这个状态有时可能为15秒,有时则有可能一分钟,我不能确定这到底是什么原因,只能暂时猜测是A卡游戏驱动优化对生产力软件不完善以及OpenCL没有针对性优化产生的。

而N卡这边的综合表现就要好不少,这里面RTX 3080显卡的优势尤为突出,因为达芬奇对显存的占用量是庞大的,传统的8GB GDDR6显存已经不堪重负了,RTX 3070渲染速度相比自家大哥落后的重要原因就是显存容量不够。A卡这边虽然显存容量更大,可惜由于BUG问题,现阶段没办法充分利用自己的大显存优势。所以如果你是一个以达芬奇作为主力软件的内容创造者,这四张主流显卡之中最好的选择还是RTX 3080,在各个测试的情况下都很稳定。

3D渲染类

Blender

有时候我们在视频制作之余,也会去渲染一些模型,因此我这里顺手测试了一下3D渲染软件这四张显卡的情况。在众多3D动画制作软件中,Blender一直对GPU有着非常好的支持,其作为一个开源软件,它在近年也是获得越来越多个人和工作室用户的青睐,这得益于其自身灵活快速的软件发展,目前最新版Blender在其Cycles渲染器中,已经可以完好低依靠OptiX API,来调用到RTX GPU的硬件加速能力,包括支持光线追踪和AI降噪功能,并且在这次RTX 30系GPU,Blender Cycles也是最先支持了第二代RT core的动态模糊加速。

NVIDIA、AMD主流显卡视频生产力测试:RTX Studio生态 VS 通用型OpenCL


金毛狮吼

AMD自从拥有了RA单元之后,基于开源的OpenCL,也可以进行光线追踪渲染了,因此两者的渲染时间长短就成了目前光追单元渲染实力的体现。

NVIDIA、AMD主流显卡视频生产力测试:RTX Studio生态 VS 通用型OpenCL

在Blender这个项目测试中,N卡优势是非常明显的,在两个光追DEMO中领先幅度非常大。从结果来看,A卡目前的光追渲染时间与N卡相比还是有较大差距的。RTX 3070就可以跨级别打败RX 6800 XT,这一方面跟两者的硬件架构光追单元的设计有一定的关系,另一方面N卡采用的OptiX API是经过专属优化的,AMD采用的OpenCL是一个大众化的开放型API,在针对性的光追优化上不够完美,最终在渲染时间上遥遥落后于OptiX API。

总结:N卡视频生产力更有优势,RTX 3070视频创作性价比最高

通过上方生产力主流软件的对比测试,我们可以很明显的看到在视频生产力方面,N卡的实际效果优势明显。通过专门优化的RTX Studio驱动,让显卡在生产力软件中尽可能的减少不必要的麻烦,同时在硬件加速上CUDA的效果相比A卡的OpenCL来说也要更好。反观A卡这边虽然相比之前的老GCN架构显卡有所进步,但是由于开源OpenCL的优化效果不尽如人意,针对性优化也不强,在使用达芬奇时,会出现占用率吃不满以及加载时间过长的问题,亟待修复。

而3D渲染软件中,N卡依旧优势明显,在越来越注重光影真实度的今天,光线追踪渲染将成为常态。这里N卡凭借着独家的OpitX API占据了非常大的优势,A卡这边的光追渲染还要依赖于OpenCL,效率就低了很多。

总结一下,如果你是一个视频创作需求较大的视频博主,并且使用PR居多,你可以优先选择RTX 30系列显卡,一张RTX 3070就足以满足大多数人的需求了,这也是这四张显卡中视频创作性价比最高的。如果你喜欢使用达芬奇渲染视频,那你可能需要显存容量更大,实力更强的RTX 3080了,这款软件下的RTX 3070距离RTX 3080还是有着明显的差距的。而A卡这边如果硬要推荐一款,建议是RX 6800 XT。毕竟RX 6800 XT与RX 6800价格相近,游戏性能又有明显的差距,买一张RX 6800 XT回来用PR做视频效果也是不错的。但如果你是一个达芬奇或者3D渲染用户,那还是老老实实的用RTX 3080吧。

展开 收起

NVIDIA 英伟达 GeForce RTX 4060Ti 公版 显卡

NVIDIA 英伟达 GeForce RTX 4060Ti 公版 显卡

3183.01元起

NVIDIA 英伟达 GeForce RTX 4070 SUPER Founder Edition 显卡 12GB

NVIDIA 英伟达 GeForce RTX 4070 SUPER Founder Edition 显卡 12GB

暂无报价

AMD RADEON RX 7800 XT 显卡 16GB 黑色

AMD RADEON RX 7800 XT 显卡 16GB 黑色

3899元起

NVIDIA 英伟达 GeForce RTX 4080 SUPER 16GB 公版 显卡

NVIDIA 英伟达 GeForce RTX 4080 SUPER 16GB 公版 显卡

8998元起

AMD RADEON RX 6950 XT 显卡 16GB

AMD RADEON RX 6950 XT 显卡 16GB

4399元起

NVIDIA 英伟达 GeForce RTX 4090 公版显卡 24GB

NVIDIA 英伟达 GeForce RTX 4090 公版显卡 24GB

17959元起

NVIDIA 英伟达 GeForce RTX 4080 16G 公版 显卡

NVIDIA 英伟达 GeForce RTX 4080 16G 公版 显卡

9259元起

NVIDIA 英伟达 GeForce RTX 4070 Founder Edition公版显卡 全新架构 DLSS 3技术

NVIDIA 英伟达 GeForce RTX 4070 Founder Edition公版显卡 全新架构 DLSS 3技术

5379元起

AMD RADEON RX 6750 GRE 海外版 12GB 独立显卡

AMD RADEON RX 6750 GRE 海外版 12GB 独立显卡

2449元起

NVIDIA 英伟达 芯联能 GeForce RTX4060 双风扇万丽 8G独立显卡

NVIDIA 英伟达 芯联能 GeForce RTX4060 双风扇万丽 8G独立显卡

暂无报价

AMD RADEON RX 6400 /RX6500XT瀚铠探索版电竞游戏智能学习电脑独立显卡 瀚铠 RX6500XT 4G探索

AMD RADEON RX 6400 /RX6500XT瀚铠探索版电竞游戏智能学习电脑独立显卡 瀚铠 RX6500XT 4G探索

999元起

NVIDIA 英伟达 T1000 8GB GDDR6 专业显卡 工业包装

NVIDIA 英伟达 T1000 8GB GDDR6 专业显卡 工业包装

2799元起

NVIDIA 英伟达 Tesla系列 GPU深度计算加速显卡 Tesla P4 8G

NVIDIA 英伟达 Tesla系列 GPU深度计算加速显卡 Tesla P4 8G

暂无报价

NVIDIA 英伟达 T400 4GB GDDR6 专业显卡 工业包装

NVIDIA 英伟达 T400 4GB GDDR6 专业显卡 工业包装

1099元起

NVIDIA 英伟达 Quadro P1000 显卡 4GB

NVIDIA 英伟达 Quadro P1000 显卡 4GB

1558.95元起

英伟达(NVIDIA)A800 80G 专业运算卡

英伟达(NVIDIA)A800 80G 专业运算卡

暂无报价
5评论

  • 精彩
  • 最新
提示信息

取消
确认
评论举报

相关好价推荐
查看更多好价

相关文章推荐

更多精彩文章
更多精彩文章
最新文章 热门文章
13
扫一下,分享更方便,购买更轻松