图吧小白教程 篇一百三十九:为何评判现代CPU的水平不能只看IPC?论能效比在多核时代的重要性
额……老铁们,虽然不是同一时间但是在同一个撤……额不好意思拿错剧本了。
额……朋友们好啊,我图吧老捡垃圾的了,最近咱在网上冲浪的时候看见了一些挺有意思的观点,简单拿出来给各位品鉴一下。
这个观点说起来也比较好笑,就是一群国产芯片的粉丝搞了个什么性能对比测试,用国产X86低功耗芯片去对比英特尔从65nm的CORE2到14nm的6代I系U的提升跑了个视频,然后对比了单核同频性能说国产x86CPU在用了16nm的情况下依然锤不过英特尔65nm的产品,还说什么十年IPC也就是单核同频提升远远不如英特尔,挤牙膏还得看国产之类的……当然在咱知道英特尔从CORE2到I系2代单看CPUz官方给的跑分就能算出来单核同频性能提升了50%不止的事实下咱就当看单口相声表演了,这点疫情封家去不了动物园看看赛博猴山挺好的。
先不说视频里很多明显图吧都不用资深垃圾佬,但凡有点常识的小白都能义眼顶针(划掉)一望而知的娱乐槽点,以及利用信息差以及各种技巧就可以操作跑分结果或者对照结论得出爆笑的节目效果,咱就简单说说里面重点强调的IPC也就是单核同频性能到底有什么用,它重要吗,到今天还有什么意义。
只会看IPC这个观点很经典,达到了图拉丁吧20年前意识到奔腾4为何主频高但是水平却不行的水平,是单核时代的经典思潮,这个视频已经逃离了唯主频论,但是还是陷入了唯性能论尤其是同频性能的桎梏,这种思想在单核时代也不能算错,但是如今核战早已开了不知道多少论,这种古典的论调多少有点大可不必了。
现代CPU以及芯片产品的水平判定主要还是应该看整体性能和功耗表现,如果整体性能不足就会直接影响使用体验,这个没什么可说的,对于固定的需求够用就是够用不够就是不够,比如打GTA5或者在没有显卡硬件解码的情况下软解1080P或者4K的H265视频,这些需求对CPU性能的需求是固定的,够用就是能玩能看不够用就是卡,没啥可说的,哪怕刚好够用的CPU也能用,并不是压制视频或者模型渲染之类的多多益善没有上限的性能需求。而功耗翻车则会直接表现在过热缩肛降频以及续航上,能耗比过低就会导致在有限的电源和散热条件下无法通过提升芯片规模提升整体性能,这是比同频性能低这种徒有其表的参数严重得多的情况,直接决定了芯片规格的上限,用IPC来解释芯片的性能以及提升是偷换概念而且在内行看来不知所云毫无意义。
ipc仅仅是在架构不同的情况下衡量频率对应性能指标的一个标准,这个图吧群随便找出来一个刚入门的小白或者哪怕上隔壁卡吧群他们都知道。这东西的优劣相比前面说的两个参数现在已经是相当次要的了。包括说什么看IPC的性能提升就代表芯片整体的性能提升这都是贻笑大方的观点,英特尔自己这么多年也就CORE2到I系的时代高光时刻过一次同频性能提升达到了50%左右,后来就再也做不到了。
从IPC来看,即使是I5 4代也很容易通过它22倍多的象棋跑分算出来IPC也就是同频性能只是图拉丁奔腾3的1.55倍(22.43÷4核÷3.6Ghz),那能说明英特尔这些年只提升了1.55倍的性能吗?用IPC来宣称提升本来就是一种可笑的数字游戏。
英特尔自己都没法按照摩尔定律规定的方向发展,TIK-TOK已经跳票多少年了,架构-制程每年至少提升一个的计划早就从4代酷睿I系以后就执行不能了。所以现实中面对这种情况怎么办呢?历史又一次给我们答案了,AMD在放弃了APU HSA架构以及推土机核心之后在JIM KELLER的带领下走进了RYZEN时代,同时留下了大量的实践经验以及专利送给了移动端,现在ARM架构很多时候更能体现出APU的设计理念:用GPU负责一定的CPU运算,利用庞大的浮点性能辅助CPU。遗憾的是AMD自己目前来看却已经放弃了这种超前的设计理念改为和英特尔一样的CPU+GPU模式,现在的所谓APU已经和英特尔一样是带集成显卡的CPU了。总之在AMD掏出RYZEN之后英特尔的应对是什么?英特尔并没有如想象中一样拿出秘密武器新架构新制程干AMD,而是直接掏出了6核心的8代U,甚至在9代直接给了8核,而且这些不仅是在台式机上存在,笔记本上也丧心病狂的同样堆了6核甚至8核。
英特尔在8代I5的时代掏出了6核的CPU,它的IPC也很容易算,象棋跑分在全核3.8G单核4G的前提下达到了33.96倍,同频性能也就是IPC=33.96÷6核÷3.8G=1.48倍图拉丁奔腾3,好家伙这么看起来英特尔用了18年时间迭代了多少架构换了多少制程结果IPC相比图拉丁奔腾3也就提了不到1.5倍?这单核同频性能相比4代U不升反降,牙膏怎么还倒吸回去了?
I5 7500全核3.6G看跑分真就和4代U基本一模一样,单核同频性能高于8代的六核U
按这么说4核4线的4代I5好像比8代I5更先进一些吧,但是在图吧当你有1151主板的时候却不会有人选择去上4核的6代或者7代U除非主板不支持,即使它们的跑分单核同频性能也可以打8代甚至9代的六核甚至八核U,这是因为无论单核性能多强同频性能多高多核心CPU最终直接影响使用体验的还是整体性能,而堆核的时候牺牲一定的单核性能是允许的,毕竟英特尔还要同时保证6核心的8代I5带集显还能运行在65W的功耗,而4代I5可是四核就达到了84W的水平:
这个功耗可是相当于当时十年前的E8400了,而E8400在仅仅双核3.0G的规模下就达到了65W的水平,当年来看可能很不错(毕竟还给了6M的二级缓存),但是在今天就是10块钱包邮的钥匙扣,因为全核的性能连打原神都费劲了,而775的四核都是胶水核心,所以即使有771硬改775的buff今天看来也是没法和AMD的K10.5原生六核抗衡的,对面AMD也能开核。
总之历史证明在AMD的攻势面前最直接有效的方法往往是最朴素的,还是那句话:
用最小的成本制造出性能相当够用的产品永远是最有性价比的方案,如果性能略差一些那么去**的,用数量击败他们。提升主频远远没有提升核心数量来得快,这个道理AMD他们十多年前就证明过了。当年图吧最好玩的并不是771硬改775,而是开核。毕竟服务器的U再便宜胶水四核对北桥压力也太大,而且当年的胶水四核775的性能其实是打不过AMD的,何况AMD还有六核,图吧即使到2019甚至现在拿AMD的羿龙2做开核也比超频实用得多,毕竟四核就算超冒烟了也打不过六核,双核三核就更不用说,只要能开出来四核那性能的提升是立竿见影的,相比主频提升一倍性能未见得提升一倍来算核心数量提升是真的性能就跟着核心数量在提升的。
AMD当年就用的这种田忌赛马的方法用AM3六核就能硬抗英特尔到X58六核低频U甚至后面一众制程架构领先酷睿I系四核U都可以打一下,这个甚至连AMD自己后来的4M8T的推土机都能打个有来有回,说明在功耗控制没有太大问题的前提下堆核心提主频的思路是没毛病的。只不过现在轮到英特尔用这个方法对付AMD了,只能说令人感叹,风水轮流转。
堆核的这个思路其实相比提升IPC提升整体性能来看就有一点不是很好,那就是核心多可能一些老应用程序比较吃单核性能的会比较难顶,但是大多数现代应用其实对于多核心的优化其实还行,垃圾佬反正实测过即使是上双路X58的六核CPU,在不开超线程的情况下现在的软件和游戏都能完美的利用这12个物理核心,开了超线程的情况下超线程出来的逻辑核心在一些游戏里会没有负载,这个现象确实存在但是和双路CPU无关,单路CPU开超线程也是一样的结果。说明一些程序对于多路CPU的物理核心的优化甚至好于对超线程的多逻辑核心的优化。也就是说现代CPU其实别整出AMD APU的那种砍CPU核心浮点性能或者英特尔那种猛堆流水线长度搞超频破4G甚至5G的操作其实问题都不是很大。低功耗多核心的思路是没问题的,垃圾佬的双路X58含120W独显整机输入功耗才250W+,在今天来看依然是能用的水平,就是双路CPU的象棋跑分很大程度上没有单路CPU×2更高不知道为什么了,可能还是X58的双路比较原始吧。
还有一点关于为什么说用IPC来衡量提升是偷换概念的问题就是一般能效不行的CPU通常IPC也不高,但不代表所有IPC拉跨的CPU都是功耗爆炸的垃圾,也不是所有功耗爆炸为发烧而生的大火炉U的IPC都低,骁龙810和麒麟960的IPC在它们那个年头看来都很高啊,可惜最后还不是成了即使垃圾佬都得敬而远之的东西。推土机和奔腾4最大的问题还是追求长流水线和不考虑能耗的情况下拉高频结果导致功耗翻车,而AMD APU后期已经能把功耗控制住(2M4T APU可以做到45-65W,完全可以接着堆核)却因为制程受限没法提升核心规模导致整体性能不足,这才是它们失败的原因。
在架构无法快速提升的前提下AMD还搞出了MCM多芯片封装,3D封装,CCD IOD分别独立封装互不干扰等一系列让人看了直呼666的操作。但是还是改变不了IPC没法快速提升的现实,相比之下英特尔掏出ATOM小核玩大小核异构多核的确弥补了Intel核心数量的劣势,实现了多线程性能的反超,而且能在一定程度上实现多任务下优先保证大核性能被合理利用从而加大单核性能优势。单纯的追求同频性能的提升不考虑总体性能和芯片功耗是不现实的,AMD英特尔他们都非常清楚这一点。
这里还得补充一点冷知识就是大小核心不同架构的IPC本来就不一样,自然也没法用于比较
这里依然简单拿垃圾佬自己的机器进行对比,这里我们可以简单的看到垃圾佬的小米平板2的Z8500和B站那个耍猴视频里面提到的T7500的象棋跑分,可以很明显的看到在全核2.24G的水平下Z8500象棋跑分只有7.0倍,单核同频性能相当于IPC=7÷4核÷2.24G=0.78125倍图拉丁奔腾3,这玩意的单核同频性能甚至打不过图拉丁奔腾3,而T7500可以在双核双线2.2G的情况下跑出单核3.19多核6.12的成绩,单核同频性能相当于IPC=6.12÷2核÷2.2G=1.39倍图拉丁奔腾3,把9年后的Z5800吊着锤,那它一定很厉害吧,是这样吗?
答案是根本不是,引用一句经典广告词吧,叫谁用谁知道。IPC拳打ATOM脚踢兆芯吊锤国产芯片全家的T7500使用了65nm制程,为了达到这样的单核性能水平它需要35W的功率,这是英特尔官网上标称的TDP。而ATOM的Z8500的TDP只有4W,即使跑分的时候略超但是实测也不超过5W(未解锁功耗),所以说7块钱包邮的T7500买回来玩云原神都能不到15分钟就过热强制关机了("https://www.bilibili.com/video/BV1d8411K7W9/">IPC吊锤兆芯的T7500能流畅云原神吗?Y450大战云原神(CPU全程90度,过热+偷电强制休眠) BV1d8411K7W9),ATOM的后代即使挤牙膏到10nm之前连14nm+都舍不得上架构也没变(从22nm时代引入乱序执行之后ATOM的CPU就基本没动过了)却依然还能解锁15W功耗继续发光发热。而Z8500本身称得上是最后的4W低功耗X86 CPU或者说SOC,也是最后的能造8寸Windows平板的U,从此之后,再无分号。
事实就是只看IPC根本没用,T7500是高但是这个能耗比拉高负载没一会儿过热直接缩肛了,这还是咱的笔记本散热规格比较好,差一点的机器功耗拉太高容易炸机直接就黑了不是关机这么简单了。所以龙芯圈的一些人到处用IPC不行等于芯片不行IPC没提升就等于零提升之类的话术去攻击其他国产芯片就是光屁股拉磨转着圈的丢人,光着屁股荡秋千丢脸丢出地平线,真心希望支持国产的人能多用时间提升自己的知识水平,而不是跑出来哗众取宠甩一些神论吸引眼球或者在视频底下集体发电。现在看龙芯和兆芯的感觉就像看火绒和360,真正用心做好用的产品的反倒没时间去关注舆论,更没精力去请水军搞畜牧业,只会默默地听用户的诉求按照需求改进产品,而不会天天尬吹自己的产品搁那胡吹溜稍像酒桌上喝多了的社会大哥或者学校里只会表演PPT的讲师还看不得别的老师甚至同学比自己强。从兆芯成立那天起同行就带人开团了,具体是不是龙芯咱不说,反正就是显得很没格局,这种熟悉的感觉让人爷青回了属于是。
一荣俱荣一损俱损,国产芯片发展成这个样子主要还是要解决自主生产的问题,单从设计上即使再先进也容易被人卡脖子(华为海思在麒麟990的时代就靠提制程和堆缓存缓解了架构劣势,但是依旧解决不了国内没有先进光刻的问题),现在自主量产没解决靠设计领先恐怕不会长久,大部分普通人对国产芯片的期待就是在自主大批量生产前也是空谈,现在去谈什么芯片设计水平IPC多高其实都是镜花水月。此外,我还是想问一下各位,国产X86和ARM需要有强悍的设计能力吗? 你能设计出来个啥,AVX1024?我是能理解一些人看见国产MIPS改自主架构的U提升巨大想要扬眉吐气的心理,但是拿着最新产品和人18-19年的产品去比IPC找兆芯你就找错人了你应该找手上有RYZEN的海光啊,跟低功耗CPU搁这秀优越不如去找AMD 18年的老U去比划比划。
在我看来国产低功耗X86的使命就是堆缓存压功耗准备进一步堆核,优化内部总线和AMD当年搞EPYC的时候一样就行了(比如手搓芯片间互连技术ZPI 3.0什么的)。不要急于求成,稳扎稳打一步一个脚印慢慢来。其实AMD当年玩分支预测也是用了很长时间才玩明白,什么事情都有个过程需要慢慢积累,只要方向正确不怕进度慢,比如国产光刻等等……就像航母核潜艇还有两弹一星一样,就算一万年也要搞出来。 而且可以不用特别先进,够用能用就行。目前咱对国产芯片的期待其实是能用稳定就行,别整出骁龙810或者AIPC就行,功耗稍微高一些也没什么,别高的特别离谱就行了。咱们现在连挖矿的功耗都能扛得住CPU能耗比即使落后一点也是可以接受的。
一荣俱荣一损俱损,国产芯片发展成这个样子主要还是要解决自主生产的问题,单从设计上即使再先进也容易被人卡脖子,现在自主量产没解决靠设计领先恐怕不会长久,大部分普通人对国产芯片的期待在自主大批量生产前也是空谈,现在在国产芯片制造都受制于人的前提下指望设计能力能有什么突飞猛进就有点想多了。这就好比纸上谈兵建筑师(@梦想改造家)或者说PPT造车,你没有实际的生产经验很难能做出什么特别重大的改进,光理论上很行实际上不行的案例太多了我们举不过来。
国产芯片要务实一点,不要总整的曲高和寡的PPT造U,从AMD和英特尔多年的竞争来看就能明白,U比你便宜、核比你多、多核性能比你强、平台成本比你低这才是王道,用实际说话比开会讲PPT包括搞什么团建都有用。
这里重点表扬一下图吧的XX元大战XX软件游戏对于用户来说就很实在,无论怎么说这个格式它主谓宾俱全评价标准非常实际而且合理,用户其实想要的只是花多少钱能达到什么样的性能水平能解决多少需求完成什么样的任务,而不是看PPT胡吹溜稍吹的昏天黑地最后拿过来一看连原神都玩不了,然后还敢大放厥词谈什么理论性能,就非常豹笑了。
无论如何兆芯的KX6640MA在低功耗的这个定位下还是完成了使命的,根据反馈就算是买回来作为openwrt软路由+硬盘也能用起来很好,不比低功耗赛扬奔腾差(这个咱持保留态度,满载30w平时20w,这个真不能和解锁功耗才15W的N3450 N4100之类的ATOM架构的赛扬奔腾比,它的这个四核并不是KX6000G一样的原生四核,而是KX6000的八核砍下来的,这个功耗水平只能说是能用),兆芯的X86产权源自VIA,威盛的x86当年可是低功耗王者,逼得英特尔不得不推出ATOM之后才出售X86业务转型去做AI的,它从始至终就是对标英特尔的低功耗产品而且比英特尔的低功耗产品历史更长。如果需要高性能可以去找中科海光,他们手里有AMD的RYZEN可以实现X86高性能核心的自主可控。
和英特尔的晚期ATOM一样,兆芯的SOC化程度很高。它不需要HT总线,不需要有多高的IPC,只需要保持高能效就还能再战。据说KX6000G改善了功耗控制,加强了核显堆了4倍EU或者说CU规模,还支持了DX12,总之方向是正确的。
好用就往死里用,稳定才是王道,闷声大发财,少做事总比做错事要强。坚持不懈的努力只有在正确的方向才会成功,在错误的方向那叫偏执。AMD在异构计算HSA上努力了8年,鸡毛没挣着,推土机成了经典的失败产品,APU到最后也因为当时的工艺还有带宽限制根本没法实用,最后只能给HSA专利卖给移动端为他人做嫁衣,当年就连玩纯CPU的服务器市场都丢了,直到后来RYZEN时代才缓过来,GPU也没资源开发被英伟达压着打(一个GCN用了多少年,现在都没缓过来。不过遗产就是为了适配APU的HSA所以老A卡一般双精度浮点性能很高所以矿卡也多),一言以蔽之,但凡当年从K10.5的老速龙II羿龙II改进一下做常规例行升级(比如第一代APU用的K10.5小改版就相当不错,完全没必要用砍了浮点的推土机压路机打桩机挖掘机)也不至于被打的这么惨。
虽然咱对知乎现在已经没啥期望,但是前不久首页刷出来的一个回答还是很令人印象深刻:坚持努力到底有没有用?有用,但是仅仅在知道自己在干什么方向正确的时候有用,比如说《西游记》里面最常见的一句话:贫僧从东土大唐而来,前往西天取经。我从哪里来,要到哪里去做什么,先把这个理念先搞懂,然后再谈别的。
当然,这些只是说明一个事实,并没有说AMD勇于创新是不好的意思,但是AMD这种孤注一掷的玩法代价有点大,最好还是两条腿走路稳健与激进并行,比如整两套方案互为备份之类的,也搞个什么备胎计划,万一推土机不行了,至少还有K10.5改还能接着用别一点招都没了那就行。某种程度来说AMD确实比另外两家进步得多,很多东西都是开源的,比如显卡驱动,就能让很多国产冷门架构芯片也能玩上AMD的独显,确实是AMD的功劳。最近还开源了FSR,所以原神之类的国产游戏也很快就能支持了FSR,这都是有因有果种瓜得瓜种豆得豆的事。
最后简单给各位分享一个英特尔的动向吧,也不能说叫爆料了这东西早就人尽皆知了
在经过了多年的打磨之后,英特尔终于给ATOM架构转正了,继成为奔腾赛扬之后,英特尔给ATOM上酷睿的称号了:N305 采用了8小核设计,32EU核心显卡,相比前代产品提升打42%
采用的也是双四核心集群的方案,这个操作似曾相识好像兆芯18-19年也干过,国产领先了好几个版本了属于是。英特尔得从国产X86抄作业,这种感觉似曾相识怎么好像在其他领域也见过?
英特尔的ATOM虽然单核性能不高,但是堆8核拉全核3.3G应该也相当不差了,这个水平我估计至少象棋跑分是个KX-U6780A的水平,后者全核2.7G 16nm八核八线不带三级缓存,考虑到KX6640MA在散热不佳的情况下和解锁15W的N4100跑分对比情况来看应该是这样。
N4100全核2.4G解锁15W功耗跑象棋可以达到10.57倍的水平,6640MA全核2.2G是10.07倍,考虑到制程升级和多核的散热限制应该水平差不太多,八核应该不是英特尔小核的极限,如果市场反响良好未来英特尔应该也会堆12/16核的纯小核产品,这个对于制程受限于TSMC 16nm的国产来说也是已经实现过了。整体来说国产19年的水平放到今天依然是能用的水平,并没有什么瓶颈或者难以逾越的技术鸿沟,只要肯听取用户意见考虑实际需求用心做还是能做好的。
就这样,谢谢朋友们!
PS: 我们从目前投稿的反馈结果来看可以把张大妈的定义评价为被JS水军枪文占领,现在很难得到什么有意义的回复,图吧群内部再次下调张大妈的评级,本人虽然会继续投稿但还是希望张大妈不要接着卖屁股放任水军和枪文长驱直入让自己的评价继续下降。
作者声明本文无利益相关,欢迎值友理性交流,和谐讨论~
值友7488080812
校验提示文案
霜月霗
校验提示文案
yihonggz
校验提示文案
bbddoop
校验提示文案
翼之飞行
校验提示文案
neow喵呜
校验提示文案
Jsung
IPC只能从架构上获得提升很困难。频率可以用更先进制程。
你奔3是几核多少频率?比不了。
校验提示文案
宫保鸡丁盖浇饭
校验提示文案
induetime9
校验提示文案
西门老爷子
校验提示文案
wangmillion2009
校验提示文案
keresladon
校验提示文案
luluq7
校验提示文案
等死二代
校验提示文案
Jsung
校验提示文案
-想个名字-
校验提示文案
余生浅末
校验提示文案
sonypsx
校验提示文案
高玩机霸
校验提示文案
值友8147405043
校验提示文案
灵KOYB
校验提示文案
bbddoop
校验提示文案
jiu2018
校验提示文案
yihonggz
校验提示文案
值友8852480850
校验提示文案
FX-9590
校验提示文案
wuhaoquan
校验提示文案
霜月霗
校验提示文案
值友8147405043
校验提示文案
高玩机霸
校验提示文案
induetime9
校验提示文案
sonypsx
校验提示文案
余生浅末
校验提示文案
值友7488080812
校验提示文案
Jsung
IPC只能从架构上获得提升很困难。频率可以用更先进制程。
你奔3是几核多少频率?比不了。
校验提示文案
-想个名字-
校验提示文案
Jsung
校验提示文案
等死二代
校验提示文案
宫保鸡丁盖浇饭
校验提示文案
luluq7
校验提示文案