没有先进制程能造出好芯片吗?

2022-06-10 22:48:54 53点赞 32收藏 8评论

额……老铁们,我图吧老捡垃圾的。今天咱简单给各位讲下这个在CPU制程受限的情况下如何最大化提升CPU的性能的方案。作为资深图吧捡垃圾的垃圾佬,从130nm到90nm到65nm45nm32nm22nm一路捡垃圾过来的咱一直到现在用上了14nm没+的电脑以及7nm没EUV的手机,见过了无数的历史,也见证了大量的科学奇迹,所以今天咱就想简单给各位说下如何在不提高CPU的制程的前提下提升CPU性能的方法。

下面开始讲故事,如果需要省流直接跳到最后就可以了

首先其实作为图吧垃圾佬,最应该给各位科普的就应该是图拉丁奔腾3吊锤奔腾4的故事。图拉丁的奔腾3我们知道,其实就是晚期P6架构的奔腾3相比奔腾4有高性能、低功耗、低发热量的优势,到了面向双路服务器市场的图拉丁奔腾III-S性能极为强悍,133MHz FSB,512KB全速二级缓存,二级缓存延迟时间为0(桌面版图拉丁奔腾家用版和赛扬都只有延迟时间为1的256KB全速L2),支持增强型数据预读取技术(这个在奔腾和赛扬或多或少都砍过)。

没有先进制程能造出好芯片吗?

没有先进制程能造出好芯片吗?

就这么一款相对来说古老的CPU,却能吊锤后来使用RAMBUS内存和超长流水线超高频率NetBurst架构的奔腾4,甚至直到今天图吧垃圾佬都以拥有一块图拉丁羊(赛扬)为精神支柱(我还真有一块图拉丁羊)。

没有先进制程能造出好芯片吗?

垃圾佬的图拉丁PIII-M 1.13G是真的对比图拉丁P3 1.0G跑出了完美的1.13倍性能的,所以一般来说相同架构的CPU频率越高性能越强是没问题的,但是垃圾佬没有1.33G的PIII-M或者1.4G的赛扬M,非常遗憾。

但是当时对于图拉丁奔腾3来说赢并不是英特尔想要看到的结果,看到自己家老架构的CPU吊锤新架构的电子垃圾之后,英特尔是真的急了急了,因为图拉丁奔腾3采用的是130nm架构所以能在低频吊锤高频的NetBurst P4,在给180nm的P4升级成130nm的Northwood之后依然只能和图拉丁奔腾3相比略有优势,同频性能依然还是不行,后期逐渐升级外频和主频之后才拉开档次,大概得达到图拉丁奔腾3的1.5-2倍主频才能打赢,结果到了90nm的Prescott之后英特尔又翻车了,反正就是工艺虽然新了但是加长流水线频率拉得高的直接后果就是你散热压不住

没有先进制程能造出好芯片吗?

我们知道,英特尔在PIII时代上1.0G的努力失败了之后就开始玩上了邪魔外道,理论上CPU流水线越长频率越容易提高但是执行指令时越容易出错理论效率越低,所以本质上来说加长流水线提升纸面频率的操作是有问题的,IPC(instruction per clock,每时钟指令数)并没有提升反倒下降了,这就导致了市场上出现了大量高频低能的怪物,而这种低执行效率的架构的产品自然是被隔壁AMD各种凌辱PLAY了,比如早期的AMD闪龙2800+,它的命名非常有意思,虽然只有单核90nm,但是它可以在1.6G的主频下吊打英特尔的P4 2.8G,所以命名为2800+,同理同时期的速龙也是差不多的命名方式,当然后来非常经典的速龙5000系列和FX5000我就不太清楚是不是这么命名的了,但是事实证明AMD直到K10.5的时代这种高执行效率短流水线的设计思路都是没问题的。虽然后期一起转堆核之后英特尔也反应过来还是得拿起来老P6架构继续改而不是再坚持长流水线+超线程了,毕竟笔记本奔腾M干翻台式奔4全家实在是太丢人了,但是人类从历史中吸取的唯一教训,就是人类不会从历史中吸取教训。

没有先进制程能造出好芯片吗?

到了K10.5之后的时代(大概是AMD AM3+)AMD Bulldozer 推土机在追求纸面频率上也犯过一样的错误。这次轮到AMD从超长流水线走火入魔了,从压路机打桩机挖掘机之后AMD直到2018年RYZEN上市前一直是处于低谷的状态。各位可能记得当时AMD玩的比较顺手的APU,但是实际上从今天看来就是集成了一个还算可以的集显的CPU而已,FM2+的话可能集成的还是GCN架构的集显而且理论上可以和AMD的独显交火同时使用,但是也仅此而已。这种APU的问题在于CPU流水线过长效率过低虽然频率高但是散热一旦压不住CPU性能和发热就会雪崩,所以当时的AMD的7860K和860K虽然看上去是四核APU/CPU,但是性能也就是同时期普通双核的水平。这里还有一个比较可悲的概念就是AMD的推土机打不过K10.5羿龙主要并不是因为CPU高频低能,而是AMD玩起了物理超线程的把戏给各位整了个假核心数的操作,AMD的推土机是4M8T的,也就是说实际上只有物理四核心,八核实际上是物理超线程。当然对于长流水线的CPU来说超线程不要太容易,32nm的时代英特尔在SNB和X58上也在做超线程,但是AMD显然有点用力过猛了,同样的工艺居然能达到4.0G起步的可怕频率,可想而知这个流水线有多长。

所以无论是图拉丁PIII也好还是AMD从K7开始一直在秀直到K10.5的过去也罢其实我们是能看得出来一款好的CPU它的必要条件是什么的。高IPC高运行效率,主频未必要高但是工艺成熟、架构设计合理,缓存大、分支预测算法先进这些是关键的。PIII-M之所以比台式机的图拉丁羊更成熟更好用并不是因为多了多少功耗提升多少主频或者有什么先进的工艺,只是有更大更快的缓存和更适合笔记本的智能供电功率调度,而AMD的羿龙2 K10.5的一代神U 640T则是因为有不高不低的主频和成熟工艺以及开核后有很大的L3(记得是6M吧)还有就是它本身确实发热不高,和标称的144W TDP不搭,这也是基于45nm的老AMD直到现在也能被认为是一代神U还有很多人用的主要原因。

没有先进制程能造出好芯片吗?

这里我们简单给各位看下垃圾佬目前使用至今的一代神U,当年45nm的低功耗笔记本上面用的主力L9400,顺带说下,MacBook Air2,1也用的是频率略高的L9600,能达到2.13G。

这个U就符合高运行效率的必要条件,首先它双核双线1.84G主频不高,理论上来说这个玩意的性能并没有比后来的I5 520UM强,但是受惠于6M的超大L2,这玩意的实际体验完全吊锤了后来有超线程加持的520UM,当然了它本身的功耗也略高,单CPU 17W,相比10W的520UM确实高了一些,但是其实垃圾佬最喜欢的TDP功耗范围并不是17W,而是P8600/8800的25W,遗憾的是P8800也好8600也好8400也好只有3M的L2,所以实际上虽然频率很高但是在某些方面就比较差了。

没有先进制程能造出好芯片吗?

L9400虽然主频不高但是它搭配64位解码器可以实现软解1080P H265 10BIT的视频,4K确实不行。

没有先进制程能造出好芯片吗?

这主要还是因为它的L2每核3M大缓存以及双通道DDR3 1066内存的带宽更高

没有先进制程能造出好芯片吗?

相对来说同样是45nm的T8300就没法流畅的把1080P H265的视频解码,即使有2.4G的主频,这里主要就是卡在缓存和内存上了,T8300通常搭配的是DDR2 800,而P8600同样的2.4G主频则通常搭配了DDR3 1066,所以说差就差在这里。

没有先进制程能造出好芯片吗?

还有需要各位注意的点就是在IBM的机器上,无论是X200还是X200s X200T,都集成了原始睿频,比如说P8600可以跑全核2.53G约等于P8700的水平,还有L9400也可以单核拉2.13G约等于单核有L9600的水平,这是很难得的。虽然只是昙花一现的频率调动,但是在需要加性能的时候也非常有用。

没有先进制程能造出好芯片吗?

主频还是比较重要的,比如说英特尔后来2W SDP 4W TDP的8寸Windows平板用U,虽然当年满街都是1.84G到顶的Z8300,但是最后能玩到现在还能当东西用的还是得双核2.24G的Z8500,而且必须得是双通道内存。Z8300被人为限制到了单通道DDR3 1600的水平,最大内存带宽也就那样了,所以性能上肯定还是相当受影响的。有些时候频率差一点不代表只差一点点,比如今天看来L9300虽然也有6M大缓存,但是相比L9400就是不能用和能用的区别,P8400和P8600也同理,P8700/8800相比P8600是锦上添花频率更高更好用的产品,但是P8400就是基本没法用看视频都卡的水平了。

没有先进制程能造出好芯片吗?

英特尔在后期从ATOM升级来的APOLLOLAKE也好GEMINILAKE也好都是用的一样的套路,只不过对于CPU的功耗放得更开(N系列TDP给到了6W,J系列直接上了10W,这俩都能解锁到15W),缓存给的更大(N3450还看不出来,到了N4100直接给L2翻倍了,这样有了4M的L2也算是勉强可以一战),然后就基本没啥别的提升了。从CPU跑分也能看得出来,同样的运行频率下跑分基本没啥提升(N4100最高频率2.4G,跑分的时候达不到),而且一直使用的是祖传的14nm没+工艺,控制成本的考虑下提升性能基本只靠对集显的小改(HD500→UHD600)以及给CPU稍微提升下频率(N3450 2.2G到顶)就没有了,相比22nm的Z3735到Z8500的CPU能耗比的提升带来的更大规模的集显,14nm的产品可以认为是到了N3450这代基本就定型了,N4100提升有限。提升主要还是体现在CPU的缓存和集显以及接口方面(一些魔改过的N4100可以用PCIE2.0×2带NVME固态,N3450普遍只有自带的SATA)。

缓存的提升有什么用?

曾有内部消息指出,英特尔工程师建议给Willamette搭配512MB缓存甚至三级缓存,以求提升Willamette的性能,但是以当时的工艺根本做不到,现在来看AMD确实在做大缓存的产品,堆上了3D V-Cache,在5800X3D上堆出了96M的L3,这个在CPU里面确实是绝无仅有的,毕竟我们要考虑的是实际体验,当年也不是没有人做过CPU PCB上带DRAM的L4,但是从速度来看还是不如L3 L2的,所以从5800X3D上来讲虽然为了安全稳定考虑主频更低且不支持加压超频,但是大缓存用起来确实爽,在更低的主频下游戏性能却足足提高了10%。

想当年的771胶水四核给了两个45nm的6M L2核心堆出来了X5430 L5420这样12M L2的怪物就震撼垃圾佬很多年了,后来X58的12M L3六核十二线的L5640也就是12M的L3,相当于每核2M,而直到现在咱也没见过每核舍得给3M L2的CPU存在了。

所以我们知道,CPU发展的历史不考虑软件优化的情况下它总体来说是要遵循一个科学规律的,即CPU本身的性能并不是人为的主观想要它提升就一定能提升的,受限于实际条件我们发现越是急于求成、拔苗助长的CPU设计往往越容易遭受到失败,而好的CPU设计长盛不衰的则需要良好的架构、成熟稳定的工艺以及产品的配套,缺一不可。

产品的配套有什么用?同样是P8600的机器,我们知道这个CPU在搭配GM45芯片组的时候DP输出是哑巴,而苹果的MacBook因为搭配的是英伟达的定制集显芯片组GT320M,所以不仅能支持DP的音频输出,而且还有16G的最大内存(相比之下直到P8600向下两代的二代I3的时代英特尔自己的HM65才支持了16G的内存,之前从GM45开始一直是8G),此外,软件的用处可大了。很多时候我们认为一个机器有没有可用性不在于它性能多好,而是软件适配有多强。比如同样的作为手机平板,Windows平板绝大多数时间在生产力工具属性上吊锤其他阵营,而IOS又可以通过统一封闭的软硬件系统生态给自己整出一些别的平台没有的操作,比如IOS14就可以直接在手机平板上跑WAIFU2X,这个安卓阵营现在还没有能稳定在本机运行的实体。MacBook也是一样,P8600对于我们现在来说什么也不是就是个office办公机,但是Mac OS X下的P8600却能有更低的待机功耗以及祖传的自动适配打印机驱动,在配合打印机使用的时候不仅能自己找驱动下载安装甚至能解EPSON喷墨打印机的掉速问题。这些都是在硬件配置上看不出来的,所以我们说自有系统和软件生态的存在绝对是有意义的,即使硬件受限被卡脖子,软件方面我们也能找回来的,要有这个自信。

而当工艺受限的情况下,我们要造SOC,尤其是造CPU(麒麟直到最后依然没有像苹果一样有自研GPU的能力,这点我们要正视现实)这方面,要发挥优势,遵循客观科学规律,绝对不能在制程落后架构先进的情况下掉进唯性能论的陷阱,科学的提升性能,尤其是在移动端要吸取芯片行业过去的经验教训,绝不能学隔壁高通造电烙铁现大眼,科学的提升芯片性能在制程落后的情况下通过堆缓存提升IPC使用高效架构的方法进行合理芯片设计,记得17年那会儿的麒麟960 970吗,虽然和华为P9的麒麟955一样本质上都是4G芯片,而且直到960都是单4G芯片,但是由于CPU架构和GPU功耗控制的问题,导致960也出现了高通一样的问题,CPU高频低能IPC执行效率上不去发热自然就高的离谱,加上当年三星自爆之后闪存大幅涨价,一套组合拳直接给P10给送走了,后来到了麒麟970也没好。而低频高效的麒麟955垃圾佬则把P9作为主力一直用到了今年,备用机现在还在用P9 PLUS。因为稳定可靠好用就是真理,不要多高性能,手机能硬解H265 10BIT编码4K之类的都不重要,只要它续航可以运行稳定平时信号强不发热就完事了。很多时候作为一个图吧人我们得说经典的架构是永流传的,AMD过去的辉煌也好现在的RYZEN也好离不开优秀的设计师比如Jim Keller,甚至我们可以认为苹果也好INTEL也好之前的辉煌时刻都离不开这样优秀的设计师,而华为如果有足够多的人才储备的话相信即使在制程劣势的情况下也可以通过架构造出一样优秀的产品,个人认为要造高性能产品最佳的方案就是采用成熟工艺优秀架构降频堆核堆缓存,这个在实际使用中是能一眼看出区别的。

也就是说如果要在14nm下吊锤7nm需要的不是拉高频堆功耗,而是科学的芯片设计,有多大锅下多少米,14nm就要有14nm的设计,如果这个工艺没有坑的话其实用起来也是一样可以的,毕竟之前在iPhone6S那个时代也出过台积电16nm吊打三星14nm,骁龙800 801 810从28nm到20nm都是大火炉的历史,所以其实现在看来如果有一个稳定可靠的工艺就去好好用它,这并没有太大的问题(英特尔:这我熟啊,14nm没+又能怎么样,现在用着不也挺好的),如果要提升性能就优先考虑架构和芯片规格而不是规模的升级就可以了,简单来说就是堆缓存提升IPC以及堆核降频,说起来其实非常简单但是实际上很考验芯片设计功力,而且拉缓存其实是最简单的,堆核是最难的,因为芯片规模上限终究是受限于工艺的。听说这次的710A是采用了双芯片堆叠设计,个人认为还是很有意思值得一试的。

还有,其实万物互联也非常重要,这点垃圾佬也是玩了这么长时间的电脑或者说数码产品之后才明白的,这年头单打独斗是不行的,一个机器再强大终究有它的短板,比如手机,虽然现在的手机普遍很强悍,但是很多时候在需要一定特定用途的时候就不行,比如你需要大屏幕或者24×7挂机作为下载机或者电视盒的时候使用就不行,它不如一个500块钱的N4100 NUC,而且它本身的接口性能也受限,不适合作为大规模数据转移终端使用,虽然5G很快但是你没法用手机从移动硬盘往U盘里快速的倒文件。很多人觉得单个手机或者电脑性能好就可以了,这显然就是没考虑到使用环境,现实就是人不可能只抱着一台手机或者电脑使用,总是要组合使用的(比如最简单的,手机扫码登录一些网站网页端,你总不能为了脱离手机从电脑里开个模拟器自己扫自己,总归是需要用到多设备的)。而怎么能把不同的设备的组合使用做到极致这也是需要基于用户的各种使用环境来进行优化的。这其实更考验的是供应商的用户反馈和社区建设,说到底是一个互相帮助的关系,企业在乎用户的感受,用户也真正愿意帮助企业改进产品提升使用体验,是一个双向奔赴。……要做出失败的产品其实很简单,但是要做出经典的好产品很难。这个世界上从来不缺乏失败的产品,作为垃圾佬捡垃圾的目的就是透过时间长河大浪淘沙找出适合自己的优秀产品,而虽然现在面对着这个摆烂的世界,咱还是希望未来能有更多更好的产品出现的。

就这样,谢谢朋友们!

作者声明本文无利益相关,欢迎值友理性交流,和谐讨论~

展开 收起

intel 英特尔 酷睿 i5-12490F CPU 4.6GHz 6核12线程

intel 英特尔 酷睿 i5-12490F CPU 4.6GHz 6核12线程

939元起

intel 英特尔 酷睿i7-14700K CPU 3.4Ghz 20核28线程

intel 英特尔 酷睿i7-14700K CPU 3.4Ghz 20核28线程

2999元起

intel 英特尔 酷睿 i5-12600KF CPU 4.9Ghz 10核16线程

intel 英特尔 酷睿 i5-12600KF CPU 4.9Ghz 10核16线程

1193.01元起

intel 英特尔 酷睿 i7-13700K CPU 5.4GHz 16核24线程

intel 英特尔 酷睿 i7-13700K CPU 5.4GHz 16核24线程

2799元起

intel 英特尔 酷睿i9-14900K CPU 3.2GHz 24核32线程

intel 英特尔 酷睿i9-14900K CPU 3.2GHz 24核32线程

4131.55元起

intel 英特尔 酷睿i7-14700KF CPU 3.4Ghz 20核28线程

intel 英特尔 酷睿i7-14700KF CPU 3.4Ghz 20核28线程

2799元起

intel 英特尔 酷睿i5-14600KF CPU 3.5GHz 14核20线程

intel 英特尔 酷睿i5-14600KF CPU 3.5GHz 14核20线程

2199元起

AMD 锐龙R7 8700G CPU 4.2GHz 8核16线程

AMD 锐龙R7 8700G CPU 4.2GHz 8核16线程

2499元起

intel 英特尔 酷睿 i5-12400F CPU 2.5GHz 6核12线程

intel 英特尔 酷睿 i5-12400F CPU 2.5GHz 6核12线程

509元起

AMD 锐龙 R5 7500F CPU 3.7GHz 6核12线程

AMD 锐龙 R5 7500F CPU 3.7GHz 6核12线程

518.7元起

intel 英特尔 酷睿i5-14600K CPU 3.5GHz 14核20线程

intel 英特尔 酷睿i5-14600K CPU 3.5GHz 14核20线程

2299元起

AMD 锐龙R5 8600G CPU 4.3GHz 6核12线程

AMD 锐龙R5 8600G CPU 4.3GHz 6核12线程

1699元起

AMD 锐龙7 7800X3D 盒装CPU处理器(8核心16线程、5.0GHz)

AMD 锐龙7 7800X3D 盒装CPU处理器(8核心16线程、5.0GHz)

1150元起

intel 英特尔 i7-13700KF CPU

intel 英特尔 i7-13700KF CPU

944元起

intel 英特尔 酷睿 i5-13600K CPU 5.1GHz 14核20线程

intel 英特尔 酷睿 i5-13600K CPU 5.1GHz 14核20线程

2249元起

AMD 锐龙R7 5700X3D CPU 3.0GHz 8核16线程

AMD 锐龙R7 5700X3D CPU 3.0GHz 8核16线程

1517.02元起
8评论

  • 精彩
  • 最新
提示信息

取消
确认
评论举报

相关好价推荐
查看更多好价

相关文章推荐

更多精彩文章
更多精彩文章
最新文章 热门文章
32
扫一下,分享更方便,购买更轻松