移动处理器的崭新时代,英特尔Lunar Lake架构解析
伴随着 AI PC 概念的快速普及,今年的 PC 市场格外热闹,一面是蓄势待发的全新 Windows 操作系统,另一面是新加入战场的高通骁龙处理器,作为 AI PC 概念的提出者,英特尔也火速带来了全新的 Lunar Lake 架构,这是初代酷睿 Ultra 处理器 Meteor Lake 的接任者,也可能会成为英特尔处理器设计制造的一个新的转折点。
集成度更高的核芯设计

Lunar Lake 延续了上一代的模块化设计理念,大幅精简了 tile 单元,现在只保留了 Compute tile 计算单元和 Platform Controller tile 平台控制器两个大模块,核心上方则是集成在基板上的内存模块。相对于 Meteor Lake 的四大模块,Lunar Lake 的集成度有了明显的提升。

英特尔把 Lunar Lake 的内存叫做 MOP(Memory on Package),最高可以提供 32GB 双通道 LPDDR5x 的规格,速度可以达到 8.5GT/s,这超过了目前 MTL 平台普遍的水平。毫无疑问,这种集成式的内存有着更强大的性能和更高的稳定性,根据英特尔提供的数据,MOP 内存将内存的物理功耗降低了 40%,最多可以让主板面积减少 250平方毫米,在提升性能的同时,减小主板,从而腾出来更多的空间给到电池组件。
但是,MOP 内存提升了 CPU 本身的成本以及后期的升级维护成本,这一点见仁见智吧。我个人是对高度集成化的产品表示欢迎的,只有集成度越来越高,终端产品才会越来越小,符合笔记本和台式机发展的整体大趋势。
内存下面的第一个模块便是本次升级的重点模块Compute tile 计算单元。Lunar Lake 这一次同时升级了大核、小核以及 GPU 核心,每一个单元都是全新的产品,因此整体的性能、功耗都有了明显的改变。
取消超线程的 Lion Cove
Lunar Lake 采用 4P+4E 的核心结构,取消了 MTL 的 LP-E 核心,也放弃了一直以来对超线程的支持。

它的大核代号为 Lion Cove,一共有四个核心分布在芯片最右侧,它有 2.5MB 的 L2 缓存和 12MB 的共享 L3 缓存。超线程技术在过去一直是提升多任务性能的有效手段,但是在 Lion Cove 上,英特尔却并不想延续这种传统,背后的原因是超线程设计会增加功耗、降低硅片面积效率,这与 Lunar Lake 的目标不符。

英特尔展示了一组关于超线程的性能测试,不支持超线程的核心与关闭了超线程的进行对比,每瓦特性能提升 15%,每“坪效”性能提升了 10%,Perf/power/area(实在是不知道该如何翻译)综合提升了 30%,而打开超线程开关之后,这几个数字则变成了 5%,-15% 和 15%。综合看下来,失去了超线程的 Lion Cove 反而有着更好的性能、功耗表现。

除了超线程之外,Lion Cove 还引入了 AI Self-tuning controller,可以将它理解为 AI 频率控制,英特尔将此前以 100MHz 的频率调整单位,精细化到 16.67MHz,玩儿过超频的朋友应该知道,有时候 3.1GHz 太高不稳定,3.0GHz 性能没有完全发挥出来,这时候就可以把频率调整到 3.067GHz。这个动作对于 Lunar Lake来说是由 AI 根据温度、环境、工作负载等情况综合调整的,算是让处理器变得更加智能。

性能方面,与 MTL 相比,它有着 14% 的 IPC 性能提升,在任意同等功耗下,都比 MTL 的 Redwood Cove 有更好的性能发挥。
能效比大幅提升的 Skymont
新的能效核代号是 Skymont,它没有像 MTL 一样直接放在性能核旁边,而是用上一代“低功耗岛”的理念,与性能核相互独立,在进行显示、传输等低负载任务的时候,避免唤醒性能核,从而实现节能效果,不过这是线程调度阶段的话题。

Lunar Lake 配备了四个 Skymont 核心,共享 4MB L2 缓存,英特尔称 Skymont 微架构的目标是提高核内并行性的处理能力,然后去优化能耗表现,最终满足更多的日常算力要求。英特尔还透露,在桌面端平台上,会配备更多的 Skymont 核心。

各中细节不做赘述,最终的结果是很令人振奋的,Skymont 与 MTL 的 LP-E 核对比,有着 68% 的浮点性能提升,且用 1/3 的功耗就取得了同样的性能表现,最终实现了四倍的性能提升。

与 Raptor Lake 的 P 核相比,Skymont 在同频率下也有着 2% 的性能领先优势,用 60% 的功耗就可以取得同样的性能表现,能耗比的改善相当明显。不过这并不意味着 Skymont 的性能完全超越了 Raptor Lake,毕竟 Raptor Lake 有着更加宽广的功耗区间。
得益于这一次 E 核的出色表现,英特尔认为用 Skymont 去处理多线程任务会更具有性价比,这也是 Lion Cove 能大胆去掉超线程的原因之一,或许在未来的桌面级平台以及更注重多线程性能的移动平台上,会有更多的 Skymont 核心作为支持。
更自如的线程调度机制

自从英特尔引入大小核设计以来,线程调度就成为了每一代新处理器的关注重点。得益于更简单的处理器结构,Lunar Lake 的线程调度逻辑非常简单,程序优先运行在 E 核心上,当超出 E 核的承载能力后,转移到 P 核心,前面我们已经介绍过,Skymont 的目标是能够满足大部分任务的运行需求,因此 P 核心被激活的频率会远远小于 MTL。
Lunar Lake 带来了基于 AI 的动态预测,通过智能判断工作负载来动态调整任务的运行核心,让线程调度变得更加灵活智能。

Lunar Lake 这一次与 Windows 系统有了更为深入的结合,带来了名为 OS Containment Zones OS 控制领域的概念,它能够控制某个任务只运行在特定的核心当中,让一些不需要高性能的程序只在能效核里面运行。

第三点比较有意思,我们对 Windows 中的电源模式都很熟悉,对 Lunar Lake 来说,电源管理引擎会自动判断当前的任务属于哪一种模式,并针对性地进行调整。英特尔展示了 Teams 的运行数据,OS 控制领域和电源管理优化开启之后,程序的运行功耗降低了 35%,这对于笔记本来说意味着会有 35% 的续航时间加成。
最后,Lunar Lake 还将线程调度的模式开放给了 OEM,OEM 可以根据现有的功能完善属于自己的定制,让特定的任务可以有更好的性能、功耗表现,比如对于一款主打超出续航的笔记本来说,OEM 可以将默认选项标定为只使用 E 核,只有开启特定模式的时候才激活 P 核,当然这是个非常极端的特定情况,OEM 的标定会更加复杂。
功能灵活的内存测缓存区

两种核心之外,Lunar Lake 还引入了新的 Memory Side Cache 内存测缓存区,这里配备了 8MB 缓存空间,作为计算单元与内存模块的缓冲区域,以减少对DRAM的访问,使它的功耗降低、性能提高,从这个缓存区的位置也可以看出来,它的灵活性很高,可以服务不同的单元,从而提升处理器的功耗表现。这个理念和 AMD 的 大缓存策略有点像,但是它的机制更为复杂,服务的对象也更加全面,属于综合的缓存选手。
更高能效表现的 GPU 核心

Lunar Lake 搭载了全新升级的 Xe2 核心,与代号为 Battlemage 的独立显卡同宗同源,延续了英特尔这两年在核芯显卡上的策略。这块 GPU 中包含了 8 个 Xe2 核心,8 个光线追踪单元, 8MB L2 缓存,核心和光追单元都有架构上的升级,带来了更高的能效比表现。

具体的性能上,英特尔目前没有给到具体的游戏跑分数据,不过从和 MTL 的对比来看,无论是性能还是功耗都有着大幅提升,游戏性能值得期待。

Lunar Lake 实现了对 eDP 1.5 的支持,能够实现更智能的“Display Engine Content Matched Refresh Rate”功能,可以将其理解为“插帧”之类的概念,简单来说就是让屏幕的视频回放与视频本身的帧率相匹配,从而实现更加流畅的播放效果。

另外,Lunar Lake 还实现了 8K 60 10bit HDR 视频的编解码,增加了对 VVC H.266 的支持等,这方面英特尔一直是领先的。
显著提升的 AI 性能
作为 AI PC 概念的提出者,AI 自然是本次 Lunar Lake 的升级重点,NPU、GPU 和 CPU 一共提供了 120 TOPS 的算力,符合微软对 AI PC 的门槛定义。

英特尔将 Lunar Lake 的 NPU 命名为 NPU4,单独的算力达到了 48 TOPS,相比上代提升了四倍之多。在核心方面,Lunar Lake 带来了 6 个独立的神经运算引擎,每个引擎有 4096 个计算单元,在核心数量上就比 MTL 翻了 3 倍,结合缓存容量、带宽等方面的优化,最终实现了 48 TOPS 的性能。
同时,Lunar Lake 全新升级的 Xe2 GPU 也提供了 67 TOPS 的算力,能够支持包括int2、int4、int8、FP16、BF16 等在内的计算精度,因此可以适用于多种不同的 AI 模型运算。
Lunar Lake 原生支持 Excute Indirect,不知道这个是什么没关系,只需要知道它能够让 GPU 越过 CPU,直接理解并执行一些 3D 任务,降低 CPU 的负载,提升整体的运行效率。

另外,Lunar Lake 的 CPU 还有 5 TOPS 的算力,与 NPU 和 GPU 加到一起,总计达到了 120 TOPS 的算力标准。三个 AI 引擎的调动策略与之前没有变化,即 CPU 主要负责低延时任务,GPU 运行大吞吐量的 AI 任务,NPU 支持低功耗持续的 AI 计算,英特尔预计运行在 NPU 上的任务会越来越多,逐步解放 CPU 的一部分算力。
全面丰富的连接体系

最后快速过一下连接特性,Lunar Lake 支持蓝牙 5.4,WiFi 7 两大无线协议,40Gbps 的雷电 4 接口,另外内置了 4 个 PCIe 5.0 和 4 个 PCIe 4.0 通道。软件上支持 Intel Unison 多屏互联体系。与其他设备互联互通的基础建设是很全面的,具体还要看各大 OEM 的发挥。
能效比超高的超轻薄本处理器

作为定义为超轻薄笔记本处理器的 Lunar Lake,英特尔提供了前所未有的能效表现,性能核与能效核的全面更新,与全面升级的线程调度机制,使 Lunar Lake 在性能、功耗方面有着大幅度的跨越,全面升级的 AI 能力,更是带来了超越 MTL 多达 300% 的性能表现,这一切都让新一代的 AI PC 更加值得期待。
但肯定有小伙伴早就想问了,那么相比于更多核心的产品,它的多线程性能会不会更低?这个答案我们暂时还未可知,PC 处理器这些年虽然已经放缓了核心数量的战争,但是旗舰芯片一直保证了至少 10 个核心、20 个线程的基础配置,Lunar Lake 至高 4P4E 也不过只有 8 个核心,在核心数量上是没有优势的,具体的性能表现还是要等到终端产品推出后才能判断。不过对于超轻薄笔记本来说,单线程性能和更好的续航其实是更加重要的参数。
预计 Lunar Lake 处理器预计将于 2024 年第三季度出货,看起来最快我们就能够在双十一前后买到搭载这颗芯片的产品了。

yihonggz
校验提示文案
AI小值-电脑数码
校验提示文案
值友1480574742
校验提示文案
值友6800861627
校验提示文案
值友6800861627
校验提示文案
yihonggz
校验提示文案
AI小值-电脑数码
校验提示文案
值友1480574742
校验提示文案