波导的效率私房 篇七:显卡大战CPU!视频编码谁更强,超详细测试

2021-01-02 18:30:00 105点赞 210收藏 113评论

创作立场声明:全网独一份干货分享,多年经验汇总而成

文章内容有点硬核和专业,建议先关注和收藏再看。

大家好,我是波导终结者。

录游戏解说视频这么多年,又做了几年直播,对视频这一块一直在寻求更高效率的方法。当年显卡编码还刚露头的时候,我就做过尝试,不过那个时候软件硬件都不成熟,效果很差。

就跟大家说一个真事儿,当时我用的GTX750,想看看显卡编码能不能比CPU快一点,搜索CUDA,百度问我:你要搜的是不是“粗大”?这是真事儿,可惜硬盘坏过一次,截图没了。但是从侧面可见,当时搜这个的人,以及网上的相关资料确实是少。当年我也试过,那时候显卡编码质量较差,码率浪费严重,不是很实用。


显卡大战CPU!视频编码谁更强,超详细测试


过了这么多年,相关的软硬件已经更新了非常多,效果早已可以令人满意。我也是自己用了这么多年,积累了不少的经验,慢慢跟大家分享。这几年我一直用一块GTX1050Ti来进行显卡加速,这也是支持新架构的最低型号(确切的说应该是GTX1050)。丐虽然丐点,至少比i7-7700快不少。

最近,我也是更新了一下装备,i7-10700K+Z490+3070和i5-10400F+B460M+2060的阶梯都搭起来了。本来是想做一个从750-1050-2060-3070的阶梯测试,但是前段时间有恙,后来也想了想,生产力工具嘛,谁不是奔着中高端卡去用的,太丐也没啥意义,最后决定直接用10700K和3070来一篇详细测试了。


显卡大战CPU!视频编码谁更强,超详细测试



显卡大战CPU!视频编码谁更强,超详细测试


CPU是盒装的10700K,不过这次先不超频,贴近一下大部分人的使用场景。显卡是工作室楼上小伙伴抢到的影驰3070星曜,先找他借过来用一段时间。主板功耗已经手动开到200W,海盗船水冷,CPU睿频让它自动超。

32G内存,3G速度NVMe固态,基本是民用中端往上配置,整机性价比算是比较不错的,除了CPU和显卡以外的配置稍有区别,对实际表现影响也不大。

请注意,本文并非横评,也非极限性能测试,只是探讨一下,在纯编解码范畴内,显卡和CPU到底谁更强。


显卡大战CPU!视频编码谁更强,超详细测试


对于编码质量,我已经用OBS录了好几年的H265,经过充分验证,现在的NVENC质量直逼CPU软压,无须多虑,也不再进行这方面的测试。

另外,由于我懒,本次的视频源是H265格式,懒得再测一次H264,现在的电脑配置解码小菜一碟,大部分还是吃编码。

图源是4K截的,所以缩放之下文字会糊,懒得重截了。

说这么多也只是因为喷子和杠精太多,不管了,直接来看。


显卡大战CPU!视频编码谁更强,超详细测试


首先来看纯CPU干活的效率,当年H265刚出来的时候,算法不成熟加上CPU性能所限,甚至有人用0.1倍速在压东西……而现在纯用CPU也能达到3.2倍左右的速度。从资源占用里可以看到,CPU基本吃满,显卡基本快睡着了。


显卡大战CPU!视频编码谁更强,超详细测试


再来试试纯显卡压制。此时GPU占用基本飙满,速度飙至10.98倍,而CPU彻底成为瓶颈,一个线程都没吃满。现在知道我为什么CPU不超频了吧,要超也是超显卡~


显卡大战CPU!视频编码谁更强,超详细测试


接下来要进入稍微有点复杂的领域了,就是加速解码。显卡、核显除了编码加速外,也可以提供解码加速,理论上是可以进一步提高整个编码过程的速度的,不过也不是任意搭配都能用,这里也把各种方案都试试,看看哪一种最快。


显卡大战CPU!视频编码谁更强,超详细测试


这是使用Intel核显的QSV(Quick Sync Video)帮助解码的成绩,可以看到处理速度又有小提升,达到11.13倍。并且从资源管理器中可以明显看到CPU的使用率有所提升。

这里可能有的小伙伴会有和我一样的想法:如果能核显和独显同时编码,能不能把CPU和GPU全部跑满呢?理论很美好,现实你懂的。以前曾经有款软件叫VIRTU MVP,可以实现核显和独显的“交火”,后来被爆出作弊。再退一步,现有的软件没有任何一款针对这个可能性做过开发,所以我试过了,并不可行。

唯一有可能的是双开,一个用CPU满载的方案,一个用GPU满载的方案,但是实测并无法达到双满,其中一个会被抢光资源。所以还是暂时放弃吧,等以后看会不会有软件上的更新。


显卡大战CPU!视频编码谁更强,超详细测试


接下来我们再来看更复杂的一层。

同时有核显和独显时,如何使软件或游戏正常工作,这么多年来一直困扰着不少人,然后软件上也一直没有一个完全的解决方案,最终还是得切换主图形适配器。刚才说到的QSV,在独显设为主图形适配器时,只能用于解码,不能用于编码,我已经替你们试过了。

所以这里,如果要加上核显编码的比较,就必须先来主板这里设置一下主图形适配器,然后线最好接主板上,避免性能损耗。


显卡大战CPU!视频编码谁更强,超详细测试


核显作为主适配器时,独显NVENC不兼容,所以这里只能让CPU左右互搏。

默认设置下,CPU软解,核显QSV压,速度达到8.86倍,比纯CPU快很多,但是离显卡还是有一定差距。


显卡大战CPU!视频编码谁更强,超详细测试


接下来是QSV加速解码,QSV编码。可以看到,成绩进一步提升,到了9.46倍。

到这里先来小结一下。

首先是,目前并没有一种方案能确保把CPU、核显、独显都跑满,虽然这样理论上利用率最高。其实也很好理解,三种不同方案,它的编码库和指令集都是不一样的,自然不可能交火串用。理论上可以多线程,比如多开,或者多个任务同时进行,但是这样的话,线程之前互相抢占资源,如何调配使它们满速?目前没有解决方案,只会出现反效果,互相抢占导致有的线程停滞。


显卡大战CPU!视频编码谁更强,超详细测试


接下来我们再来看看压H264的成绩。虽然我自己已经全面H265化了,毕竟能省将近一半的码率,但是现在还是有很多地方停留在H264的。

其实现在CPU的性能已经很强,x264的优化基本也已经到达顶峰了,全软能达到10.21倍的速度。为什么说已经到顶了呢?


显卡大战CPU!视频编码谁更强,超详细测试

显卡大战CPU!视频编码谁更强,超详细测试


因为纯CPU工作已经比QSV要快了。这其中当然有利用率的问题,纯CPU的话,CPU是满的,而使用QSV之后,无法满载。但是刚才也谈到过了,目前并没有靠谱的方案,能稳定把CPU软和核显、独显同时吃满,所以也只能这样了。


显卡大战CPU!视频编码谁更强,超详细测试

显卡大战CPU!视频编码谁更强,超详细测试


当然,独显压制的速度仍然是最快的,CPU软解达到了15.91倍,QSV辅助解码则是最快的18.66倍。


显卡大战CPU!视频编码谁更强,超详细测试


用问答的方式总结一下:

Q1:什么方案最快?

A:独显编码,QSV解码。

Q2:H265目前实用吗?

A:我已经用H265实时录制了好几年的视频,目前无论是速度还是质量都完全没有问题。你唯一该担心的是兼容性,毕竟有的地方不支持H265。

Q3:我不玩游戏,还需要买独显吗?

A:我个人觉得,不管你玩不玩游戏,都值得买一张独显。要玩游戏自然不用说,如果不玩游戏,说明你是用作生产力工具。既然用作生产力工具,我怎么反而觉得更应该买了……

Q4:多买一块独显感觉性价比有些低?

A:就凭1.2-1.8倍的干活速度,我就觉得值。而且一台电脑的配置是一个整体,不能脱离其他硬件单独拿出来看。更何况,你还可以拿来玩游戏不是~

Q5:那我还可以让独显发挥其他作用吗?

A:现在很多软件都支持显卡加速,比如非线编软件,AE、PR、VEGAS、EDIUS、达芬奇等,还有我没咋用过的那些建模、渲染工具。就算是Photoshop,都支持显卡加速。这些加速在日常使用中,可能不会有像视频编码那么明显的体验上的区别,但它们确实在节省着你的时间。时间就是金钱呀。事实上,2020年传出了一个不怎么引人注目的消息:NVIDIA放弃了Quadro丽台这个品牌,最普遍的说法就是,现在图形卡和专业计算卡的界限已经逐渐模糊。

Q6:怎么没有汇总图表?

A:懒。


显卡大战CPU!视频编码谁更强,超详细测试


英特尔(Intel)i7-10700K复仇者联盟珍藏版8核16线程盒装CPU处理器2699元京东去购买影驰RTX3070金属大师/星曜OC/GAMER8G台式机独立游戏DIY电竞显卡RTX3070GamerOC5599元京东去购买

今天的分享就到这里,感谢大家观看,如果想了解其他内容的话,点赞关注留个言呗?我们下期再见。

展开 收起

GALAXY 影驰 GeForce RTX 4080 SUPER 星曜 OC 显卡 16GB

GALAXY 影驰 GeForce RTX 4080 SUPER 星曜 OC 显卡 16GB

8899元起

GALAXY 影驰 GeForce RTX 4070 20周年纪念版 显卡 12GB

GALAXY 影驰 GeForce RTX 4070 20周年纪念版 显卡 12GB

5999元起

GALAXY 影驰 GeForce RTX 4070 SUPER 星曜OC 显卡 12GB

GALAXY 影驰 GeForce RTX 4070 SUPER 星曜OC 显卡 12GB

4599元起

GALAXY 影驰 GEFORCE RTX 4080 16GB 星曜 OC 显卡 16GB 白色

GALAXY 影驰 GEFORCE RTX 4080 16GB 星曜 OC 显卡 16GB 白色

8399元起

GALAXY 影驰 GeForce RTX 4070TI SUPER 星曜 OC 显卡 16GB

GALAXY 影驰 GeForce RTX 4070TI SUPER 星曜 OC 显卡 16GB

4899元起

intel 英特尔 锐炫 Arc A750 独立显卡 8GB

intel 英特尔 锐炫 Arc A750 独立显卡 8GB

1599元起

GALAXY 影驰 RTX 4060 金属大师 OC 显卡 8GB

GALAXY 影驰 RTX 4060 金属大师 OC 显卡 8GB

2259元起

GALAXY 影驰 GeForce RTX4080 SUPER DLSS 3加速戏台式机电脑显卡 RTX4080 SUPER金属大师 OC

GALAXY 影驰 GeForce RTX4080 SUPER DLSS 3加速戏台式机电脑显卡 RTX4080 SUPER金属大师 OC

暂无报价

GALAXY 影驰 GeForce RTX 4070 Ti 金属大师 OC 显卡 12GB 银色

GALAXY 影驰 GeForce RTX 4070 Ti 金属大师 OC 显卡 12GB 银色

5949元起

GALAXY 影驰 GeForce RTX 4070 TI 星曜 OC 显卡 12GB 白色

GALAXY 影驰 GeForce RTX 4070 TI 星曜 OC 显卡 12GB 白色

暂无报价

GALAXY 影驰 GeForce RTX 4070 Ti 黑将 OC 显卡 12GB 黑色

GALAXY 影驰 GeForce RTX 4070 Ti 黑将 OC 显卡 12GB 黑色

4649元起

影驰 GeForce RTX4070S显卡 SUPER/RTX4070 GDDR6X DLSS3 视频直播台式机电脑电竞游戏显卡 RTX4070 SUPER 金属大师OC

影驰 GeForce RTX4070S显卡 SUPER/RTX4070 GDDR6X DLSS3 视频直播台式机电脑电竞游戏显卡 RTX4070 SUPER 金属大师OC

5399元起

GALAXY 影驰 GeForce RTX4060TI DLSS3光线追踪电竞游戏设计

GALAXY 影驰 GeForce RTX4060TI DLSS3光线追踪电竞游戏设计

暂无报价

intel 英特尔 Arc A770 独立显卡 16GB

intel 英特尔 Arc A770 独立显卡 16GB

1899元起

影驰 GeForce RTX4080 SUPER 电竞游戏设计图形渲染AI智能深度学习台式机电脑全新显卡 RTX4080 SUPER 金属大师OC

影驰 GeForce RTX4080 SUPER 电竞游戏设计图形渲染AI智能深度学习台式机电脑全新显卡 RTX4080 SUPER 金属大师OC

8499元起

GeForce GTX1650 APEX英雄吃鸡电脑游戏显卡

GeForce GTX1650 APEX英雄吃鸡电脑游戏显卡

1099元起
113评论

  • 精彩
  • 最新
  • 置顶 对瓶颈这个词有什么误解吧?CPU利用率低怎么说CPU是瓶颈呢?

    校验提示文案

    提交
    哈哈哈哈,仔细一想是的,抱歉我表述有误。我的意思是和上面一段"显卡睡着"一样,这次轮到cpu使不上力了。正文无法修改,把你置顶。

    校验提示文案

    提交
    收起所有回复
  • 置顶 弱弱说一下,丽台Leadtek只是NVIDIA授权Quadro合作伙伴其中之一 [锁眉]

    校验提示文案

    提交
    哈哈,感谢提醒。专业卡我从来没舍得下手,所以了解比较少。光拿来编码太奢侈了。

    校验提示文案

    提交
    美商威达这条“视觉可视化”产品线怎么说呢,有点小乱。先从产品线划分开始,这个子系列中除了Quadro,Titan也划分在此产品线中。然而,Titan又不如Quadro还是做了一些硬件及驱动/BIOS级优化,Titan可以,Geforce不行? 再然后,传统的工作站市场萎缩很厉害,谈RSA和Value Add之前,先谈价格或者一定程度只看价格;泛工作站市场和部分DC用Geforce的比例越来越高。威达内部几个Team也有意思,为了不让Intel Creator PC独善于前,Studio PC应运而生,Geforce搭Studio驱动;Quadro驱动则优化了游戏功能……早期Quadro,厂商可以打自己品牌的,时间长了就造成了丽台Quadro这种印象,威达后期做法就是包装上只允许出现NV和Quadro品牌,再后来,传统工作站衰落,对光追推广的战略高度,卡都叫RTX了 [喜极而泣]
    科技,以换壳细分割韭菜为主 [大囧]

    校验提示文案

    提交
    还有5条回复
    收起所有回复
  • H264的话还是intel的QSV最快

    校验提示文案

    提交
    我测试结果都摆出来了,非要唱反调 [傻笑]

    校验提示文案

    提交
    就拿你举例的Edius剪辑软件合成10分钟的h264,你看下插入显卡快还是用集显的QSV快吧!或是你用个新版的格式工厂使用qsv试试,从3代cpu开始,工作机只选intel

    校验提示文案

    提交
    还有12条回复
    收起所有回复
  • 那么问题来了,虚空在哪里大战?哦,虚空啊,那没事了🐶

    校验提示文案

    提交
    屠夫正面大虚空

    校验提示文案

    提交
    Dota er

    校验提示文案

    提交
    收起所有回复
  • 这个就真的看不懂了

    校验提示文案

    提交
    是有点硬核哈哈,看结论就行

    校验提示文案

    提交
    收起所有回复
  • 据说Intel的独显编解码很强

    校验提示文案

    提交
    我这里用的就是Intel的U~

    校验提示文案

    提交
    敲黑板,他说的是独显

    校验提示文案

    提交
    还有1条回复
    收起所有回复
  • 最近在琢磨推流机成本的问题,好多数据都得收集,很麻烦

    校验提示文案

    提交
    这几天太冷不想动,我在琢磨推流机最小配置,懒得扛工作室里去~

    校验提示文案

    提交
    同求推流机配置,考虑升级中

    校验提示文案

    提交
    还有4条回复
    收起所有回复
  • AMD呢?真的只能为挖矿而生?

    校验提示文案

    提交
    惭愧,个人能力所限,这次没有办法再组一台中高端的AMD进行三国混战。过完年我看看有没有条件吧~

    校验提示文案

    提交
    我用2700关闭了超线程后转码快了20%(掐秒表算的>直逼3700,不到1000块钱,直呼扭逼。8核心以上关闭超线程效率反而更高

    校验提示文案

    提交
    还有3条回复
    收起所有回复
  • 波导,当我想起之前的一部手机

    校验提示文案

    提交
    哈哈,只是巧合~

    校验提示文案

    提交
    收起所有回复
  • 根本不用比,看股价就知道了

    校验提示文案

    提交
    比特币表示很淦哈哈

    校验提示文案

    提交
    收起所有回复
  • 实测 ffmpeg 1080p 的h264zhuan

    校验提示文案

    提交
    我用的编码工具就是基于ffmpeg开发的,有个图形界面比较直观。ffmpeg我也分享过好几期,可以去我主页翻。

    校验提示文案

    提交
    收起所有回复
  • 很好奇把苹果m1加进来会是什么结果,吹的那么大,毕竟整机也就值个显卡钱。

    校验提示文案

    提交
    m1现在没有成熟的体系吧……如果你寄一台过来我倒可以研究研究 [傻笑]

    校验提示文案

    提交
    收起所有回复
  • 用显卡压的不如用cpu压的吧,一直以来都是这样,要速度就用显卡要质量还是得cpu

    校验提示文案

    提交
    你这就是当年我搜CUDA时代的旧观念。这么多年过去了,软件硬件架构更新了多少代了,还道听途说。

    校验提示文案

    提交
    当年gtx600系列cuda很厉害的样子,但是硬压出来的真的就是***质量,大家确实都在用cpu软压。如今真的是看不出区别了么?

    校验提示文案

    提交
    还有3条回复
    收起所有回复
  • shanaencoder我也用过,不过主力还是用mediacoder,速度快多了,gpu利用率也更高,我现在是3080。基本同意楼主的观点

    校验提示文案

    提交
    mc有暗桩,唉

    校验提示文案

    提交
    收起所有回复
  • Xe显卡会好点么

    校验提示文案

    提交
    有谁寄我一块我就试试 [口水]

    校验提示文案

    提交
    收起所有回复
  • [狂汗] 很久以前用QSV压x264,部分场景会出现色块失真,调高码率也没有明显改善,不知道是不是驱动Bug

    校验提示文案

    提交
    各方面原因都有。现在驱动,sdk,编码库更新好几轮了,放心用

    校验提示文案

    提交
    收起所有回复
  • 播放软件怎么设置用cpu还是n卡我都搞不清楚 [皱眉]

    校验提示文案

    提交
    哈哈,要不要我出一篇 [傻笑]

    校验提示文案

    提交
    来嘛 来嘛 再水一篇

    校验提示文案

    提交
    还有2条回复
    收起所有回复
  • 蹲一个推流机配置,之前用笔记本的核显充当,感觉还够给力 [观察]

    校验提示文案

    提交
    先看我前一篇,双机推流的视频。后面我再单独整。

    校验提示文案

    提交
    收起所有回复
  • 我试了我的AMD 4750G的APU在最新版PR编码里纯CPU编码(论是h264还是265>比带核显加速的甚至还快一点点。 [大囧]

    校验提示文案

    提交
    编码不要用非线编软件,不准。它有很多其他开销。核显比软压慢不奇怪,我之前gtx750配的是i5-4430,那核显就是比显卡和软压都慢 [傻笑]

    校验提示文案

    提交
    收起所有回复
  • 果然懂行的的都用shanaencoder

    校验提示文案

    提交
    挺好用的哈哈

    校验提示文案

    提交
    这个开源软件确实好用,我这种业余的也用

    校验提示文案

    提交
    还有2条回复
    收起所有回复
提示信息

取消
确认
评论举报

相关好价推荐
查看更多好价

相关文章推荐

更多精彩文章
更多精彩文章
最新文章 热门文章
210
扫一下,分享更方便,购买更轻松