十年磨一剑:初探 AMD 14nm FinFET新一代X86微架构Zen处理器支持SMT多线程、大幅提升单线程性能
很多DIY老玩家对AMD处理器是很有感情的,比如他们经典的K8架构及代表产品Athlon X2 3800+可以说是AMD历史上最成功的CPU,不论是功耗、性能和效率都全面领先同时期“胶水双核”Pentium D。不过短暂的优势从2006年Intel Core 2处理器登场时被追平反超,再经过2008年到2010年这段时间从初代酷睿i7、i5到i3的发布,AMD的K10架构根本无力反抗只有用AMD Phenom II勉强支撑。为对抗酷睿家族而推出的FX处理器事后证明是一代并不成功的产品,Bulldozer推土机根本无力对抗进步巨大的酷睿Sandy Bridge架构全面败下阵来。后续的Piledriver打桩机架构为了性能在增加频率和功率这条黑路上越走越远,甚至造就了5GHz频率220W功耗官方推荐水冷的奇葩处理器FX-9590。可以说AMD在推土机架构后期走了Intel奔腾4/D时代的老路,处理器总给人高频低能的感觉。
经过十年的卧薪尝胆,北京时间2016年8月18日AMD在美国旧金山首次官方发布了Zen架构特点和具体产品规格。桌面版会推出Summit Ridge处理器,基于14nm FinFET工艺,处理器采用AM4插槽,8核16线程设计,支持DDR4内存,标称的新一代I/O内含NVMe、10Gbps速率的USB 3.1等等扩展接口,支持PCI-E 3.0接口但暂时不知道具体通道数,服务器端则有32核64线程的Naples处理器。官方号称对比上代产品新处理器的IPC指令执行效率提升超过40%,家用版Summit Ridge处理器将在2017年第一季度批量上市。
针对从2006年以来桌面处理器全面被酷睿打压的问题,AMD在性能、吞吐力及能效三方面强化Zen架构处理器,针对的正是此前推土机架构处理器的三大问题:单核性能差、模块化物理多核效率不佳和高功耗。首先看性能,AMD增强了Zen预测分支单元选择正确指令的能力,增加了微操作缓存提高指令分发功能,指令调度窗口能力增加75%,指令分发带宽及执行单元资源提升50%。通过这一系列的改动,最终会大幅提升单线程性能,解决的正是FX处理器单核性能很差的问题,能大幅提高处理器游戏表现。
FX处理器采用模块化物理多核设计,最终性能对比Intel的HT超线程技术表现并不好。在Zen架构AMD回归了传统的SMT多线程架构,每个核心支持2个线程,类似Intel的HT超线程技术。处理器的缓存机制也进行了重制,L1指令缓存64KB(4-Way);L1数据缓存32KB(8-Way);每个核心享受L2缓存512KB(8-Way);共享的L3缓存8MB(16-Way),单个核心的缓存带宽是之前的5倍。
针对之前处理器的高功耗问题,AMD在Zen微架构直接升级使用GlobalFoundries的14nm FinFET工艺,工艺对处理器功耗的改进是最直接明显的。在架构设计方面Zen拥有全方位的时钟栅极以控制不同区域、L1缓存写回模式、更大容量微指令缓存和堆栈引擎,经过这一系列改动Zen架构处理器与推土机相关架构保持同样能耗频率时其IPC指令执行效率能提升40%。
在AMD的演示现场,全新Summit Ridge处理器对阵了同样8核心16线程的Core i7-6900K,测试环境双方频率都固定在3GHz以获得同频性能对比,最终多线程渲染测试中两者几乎不相上下Zen架构Summit Ridge处理器还略胜一筹。怎么样作为A饭的你有没有为之一振的感觉?Zen架构桌面版Summit Ridge处理器将于2017年第一季度批量上市,请期待我们的陆续报道。