波导的效率私房 篇七:显卡大战CPU!视频编码谁更强,超详细测试
如何才能快速换一种生活方式?参加#牛年Flag#征稿活动,征集你2021年的购物学习生活计划!>>点击查看活动详情<<本次征稿活动欢迎你的敢出敢买Flag、学习Flag以及各种生活Flag,优秀的投稿文章能获得优厚的大奖,让我们一起努力实现目标吧!
创作立场声明:全网独一份干货分享,多年经验汇总而成
文章内容有点硬核和专业,建议先关注和收藏再看。
大家好,我是波导终结者。
录游戏解说视频这么多年,又做了几年直播,对视频这一块一直在寻求更高效率的方法。当年显卡编码还刚露头的时候,我就做过尝试,不过那个时候软件硬件都不成熟,效果很差。
就跟大家说一个真事儿,当时我用的GTX750,想看看显卡编码能不能比CPU快一点,搜索CUDA,百度问我:你要搜的是不是“粗大”?这是真事儿,可惜硬盘坏过一次,截图没了。但是从侧面可见,当时搜这个的人,以及网上的相关资料确实是少。当年我也试过,那时候显卡编码质量较差,码率浪费严重,不是很实用。
过了这么多年,相关的软硬件已经更新了非常多,效果早已可以令人满意。我也是自己用了这么多年,积累了不少的经验,慢慢跟大家分享。这几年我一直用一块GTX1050Ti来进行显卡加速,这也是支持新架构的最低型号(确切的说应该是GTX1050)。丐虽然丐点,至少比i7-7700快不少。
最近,我也是更新了一下装备,i7-10700K+Z490+3070和i5-10400F+B460M+2060的阶梯都搭起来了。本来是想做一个从750-1050-2060-3070的阶梯测试,但是前段时间有恙,后来也想了想,生产力工具嘛,谁不是奔着中高端卡去用的,太丐也没啥意义,最后决定直接用10700K和3070来一篇详细测试了。
CPU是盒装的10700K,不过这次先不超频,贴近一下大部分人的使用场景。显卡是工作室楼上小伙伴抢到的影驰3070星曜,先找他借过来用一段时间。主板功耗已经手动开到200W,海盗船水冷,CPU睿频让它自动超。
32G内存,3G速度NVMe固态,基本是民用中端往上配置,整机性价比算是比较不错的,除了CPU和显卡以外的配置稍有区别,对实际表现影响也不大。
请注意,本文并非横评,也非极限性能测试,只是探讨一下,在纯编解码范畴内,显卡和CPU到底谁更强。
对于编码质量,我已经用OBS录了好几年的H265,经过充分验证,现在的NVENC质量直逼CPU软压,无须多虑,也不再进行这方面的测试。
另外,由于我懒,本次的视频源是H265格式,懒得再测一次H264,现在的电脑配置解码小菜一碟,大部分还是吃编码。
图源是4K截的,所以缩放之下文字会糊,懒得重截了。
说这么多也只是因为喷子和杠精太多,不管了,直接来看。
首先来看纯CPU干活的效率,当年H265刚出来的时候,算法不成熟加上CPU性能所限,甚至有人用0.1倍速在压东西……而现在纯用CPU也能达到3.2倍左右的速度。从资源占用里可以看到,CPU基本吃满,显卡基本快睡着了。
再来试试纯显卡压制。此时GPU占用基本飙满,速度飙至10.98倍,而CPU彻底成为瓶颈,一个线程都没吃满。现在知道我为什么CPU不超频了吧,要超也是超显卡~
接下来要进入稍微有点复杂的领域了,就是加速解码。显卡、核显除了编码加速外,也可以提供解码加速,理论上是可以进一步提高整个编码过程的速度的,不过也不是任意搭配都能用,这里也把各种方案都试试,看看哪一种最快。
这是使用Intel核显的QSV(Quick Sync Video)帮助解码的成绩,可以看到处理速度又有小提升,达到11.13倍。并且从资源管理器中可以明显看到CPU的使用率有所提升。
这里可能有的小伙伴会有和我一样的想法:如果能核显和独显同时编码,能不能把CPU和GPU全部跑满呢?理论很美好,现实你懂的。以前曾经有款软件叫VIRTU MVP,可以实现核显和独显的“交火”,后来被爆出作弊。再退一步,现有的软件没有任何一款针对这个可能性做过开发,所以我试过了,并不可行。
唯一有可能的是双开,一个用CPU满载的方案,一个用GPU满载的方案,但是实测并无法达到双满,其中一个会被抢光资源。所以还是暂时放弃吧,等以后看会不会有软件上的更新。
接下来我们再来看更复杂的一层。
同时有核显和独显时,如何使软件或游戏正常工作,这么多年来一直困扰着不少人,然后软件上也一直没有一个完全的解决方案,最终还是得切换主图形适配器。刚才说到的QSV,在独显设为主图形适配器时,只能用于解码,不能用于编码,我已经替你们试过了。
所以这里,如果要加上核显编码的比较,就必须先来主板这里设置一下主图形适配器,然后线最好接主板上,避免性能损耗。
核显作为主适配器时,独显NVENC不兼容,所以这里只能让CPU左右互搏。
默认设置下,CPU软解,核显QSV压,速度达到8.86倍,比纯CPU快很多,但是离显卡还是有一定差距。
接下来是QSV加速解码,QSV编码。可以看到,成绩进一步提升,到了9.46倍。
到这里先来小结一下。
首先是,目前并没有一种方案能确保把CPU、核显、独显都跑满,虽然这样理论上利用率最高。其实也很好理解,三种不同方案,它的编码库和指令集都是不一样的,自然不可能交火串用。理论上可以多线程,比如多开,或者多个任务同时进行,但是这样的话,线程之前互相抢占资源,如何调配使它们满速?目前没有解决方案,只会出现反效果,互相抢占导致有的线程停滞。
接下来我们再来看看压H264的成绩。虽然我自己已经全面H265化了,毕竟能省将近一半的码率,但是现在还是有很多地方停留在H264的。
其实现在CPU的性能已经很强,x264的优化基本也已经到达顶峰了,全软能达到10.21倍的速度。为什么说已经到顶了呢?
因为纯CPU工作已经比QSV要快了。这其中当然有利用率的问题,纯CPU的话,CPU是满的,而使用QSV之后,无法满载。但是刚才也谈到过了,目前并没有靠谱的方案,能稳定把CPU软和核显、独显同时吃满,所以也只能这样了。
当然,独显压制的速度仍然是最快的,CPU软解达到了15.91倍,QSV辅助解码则是最快的18.66倍。
用问答的方式总结一下:
Q1:什么方案最快?
A:独显编码,QSV解码。
Q2:H265目前实用吗?
A:我已经用H265实时录制了好几年的视频,目前无论是速度还是质量都完全没有问题。你唯一该担心的是兼容性,毕竟有的地方不支持H265。
Q3:我不玩游戏,还需要买独显吗?
A:我个人觉得,不管你玩不玩游戏,都值得买一张独显。要玩游戏自然不用说,如果不玩游戏,说明你是用作生产力工具。既然用作生产力工具,我怎么反而觉得更应该买了……
Q4:多买一块独显感觉性价比有些低?
A:就凭1.2-1.8倍的干活速度,我就觉得值。而且一台电脑的配置是一个整体,不能脱离其他硬件单独拿出来看。更何况,你还可以拿来玩游戏不是~
Q5:那我还可以让独显发挥其他作用吗?
A:现在很多软件都支持显卡加速,比如非线编软件,AE、PR、VEGAS、EDIUS、达芬奇等,还有我没咋用过的那些建模、渲染工具。就算是Photoshop,都支持显卡加速。这些加速在日常使用中,可能不会有像视频编码那么明显的体验上的区别,但它们确实在节省着你的时间。时间就是金钱呀。事实上,2020年传出了一个不怎么引人注目的消息:NVIDIA放弃了Quadro丽台这个品牌,最普遍的说法就是,现在图形卡和专业计算卡的界限已经逐渐模糊。
Q6:怎么没有汇总图表?
A:懒。
今天的分享就到这里,感谢大家观看,如果想了解其他内容的话,点赞关注留个言呗?我们下期再见。

Dota er
那是必须的
硬件,软件都在更新,要对比尽可能同平台,同版本,不然说的观点就不够严谨了
俩位坐下。喝口水。
我把升级换下来的1050Ti插到4430上了……但是需要WIN10系统,这阵子忙完弄个固态装个WIN10,试试显卡拉不拉得动4K
对,你要这么一说也有道理,侧重点不一样,字幕组的肯定不会用非线编压片,我用QSV纯粹就是交稿快,还有就是直播推流时给自己孱弱的6500cpu榨干最后一点油水
你根本就没有明白问题的核心在哪里。
本文讨论的是更纯粹的视频编解码能力,所以用的是纯编码软件,而不是非线编软件。
非线编软件有很多其他运算和开销,每款软件又有各自不同的优化,拿它来比较显卡编码本来就不合理,不准确,而且每款软件估计都会得出不同的结果。
就像前阵子国内奥运选拔靠体测来排名一样,你叫爆发为主的短跑运动员测耐力,叫下象棋的搞卧推,然后直接决定他们的名次,能准吗?
如果你连这个核心逻辑都还没有搞清楚,那你这几年只能算是勤勤恳恳在流水线上辛苦工作,而已。
本文并不是要给CPU和GPU评个谁“绝对强”,因为本来就各有所长。测试的本来就是某一特定用途,你非要拐到其他离题的领域去,正应了网上那句“他会把你拉到跟他一样的高度,用丰富的经验击败你”。如果你非要跑离题,那你不如看看,现在挖矿到底用的是啥?
嗯,目前多核心或者多线程还是很少软件能够真正吃满。前些年大部分游戏甚至都是单核~
应该是软件不能充分利用全部线程,而系统对16线程分配出问题,把超线程当成物理核心,结果反而负收益。每次打开超线程,我常用的转码压缩软件都是变慢,时间起码多10%,用格式工厂差距甚至差20%,所以直接关了,8个物理核心够用了
这。。。。值得买上也是从18年开始关注你的,说话没必要这么客气吧,你的原话送你,不能为了那几碗粉,我刨开自己的肚子写个视频输出的原创给你看看我吃几碗粉吧,你是原创大神,我只是一只这社区里的小小虾米。原创一是懒得写,二是真没功夫写,最多抽空来薅羊毛
等我搭了AMD平台之后也详细试试,看看是哪个因素造成的~
我用2700关闭了超线程后转码快了20%(掐秒表算的>直逼3700,不到1000块钱,直呼扭逼。8核心以上关闭超线程效率反而更高
你吃了几碗粉,为什么要我剖自己肚子去数
你下载个edius6.08以上的版本,同样10分钟素材输出h264,看下独显快还是核显快,这软件从2014年开始用到现在,每天需要剪辑输出大量视频,时代在进步,09年那会你上传优酷还没QSV这技术,我上传优酷是07年的,你走过的路我也走过,相信你自己试一下比我写出来更有说服力
期待,也很想知道
嗯,有台nas也很实用
刚瞄了眼,专业卡还是很贵,甚至还没跌回19年的价格,17年的东西等着传家吧,我关注他仅仅是因为低功耗(30W NAS实时转码用>
哈哈,我倒是真正双用。但比起矿老板还是差远了
也是为了卖卡,现在太多伪需求了,嘴上说学习 专业要用,实际就是打游戏 为了满足这类人群模糊的
哈哈,在专业领域肯定是的。只是说现在游戏卡也慢慢接近了,界限开始模糊
丽台的专业卡始终比游戏卡要强,实际用过就知道了
哈哈哈 会用这个的真不算业余,也要设置一些参数的
嗯我试过好多款,这款比较稳定
这个开源软件确实好用,我这种业余的也用
非线编这块确实PRAE更专业。我这就是用这么多年习惯了哈哈~
pr ae能独显核显一起加速
不同领域当然有不同需求,本文已经限定了视频编码。非要拉到其他领域来一波么~
生产力工具不一定非要独显啊,比如软件开发。大内存,顶级cpu,固态硬盘非常必要的
1.你可以自己压压看,没有调查就没有发言权
2.用什么压要看需求。一些压片组,压的量不大,自然会去牺牲速度,追求极限画质和压缩比,我文中提到的H265初期有人用0.1倍的速度压就是这种情况。但如果量大,码率也不低,现在显卡压的和软压肉眼已经分辨不出区别,只有用软件能测出那三两个像素的差别,那么追求好几倍的速度又有何不可呢?
你可以打听打听top组有没有用显卡压片的,如果只是压了传视频网站那当我没说。