⑴ E核IPC相当于13代P核! Lunar Lake处理器深度解析
英特尔在台北电脑展上公布了Lunar Lake处理器的架构与技术细节,这款产品针对轻薄笔记本设计,注重低功耗、高效能、高效率和AI性能。Lunar Lake处理器预计将在今年第三季度发布,届时将与计划在第四季度发布的Arrow Lake处理器一同组成酷睿Ultra 200系列处理器的产品线。
Lunar Lake是Meteor Lake架构的延续,Lion Cove架构P-Core与Skymont架构E-Core是Redwood Cove与Crestmont的后继者。在单线程性能上,Lunar Lake以原来一半的功耗达到上代相同的性能。
Lunar Lake的GPU采用了代号为Battlemage的Xe2架构,也是下一代ARC独立显卡的架构。相比上一代Xe-LPG,游戏性能提高了50%。NPU对于AI PC来说至关重要,搭载了最新的第四代NPU,可提供48 TOPS的算力,是上代的四倍多,平台整体算力高达120 TOPS。
Lunar Lake架构的核心模块数量从Meteor Lake的四个减少到两个,设计上与前代产品有很大不同。计算模块包含最多4个P-Core、4个E-Core、GPU、NPU、内存控制器、媒体引擎、显示引擎、IPU图像处理单元,并配有8MB内存侧缓存MSC。MSC独立于CPU和GPU的缓存系统,为计算模块内的其他IP单元提供支持,降低这些模块对系统内存的依赖,有效降低延迟并降低能耗。
模块内部采用第二代Scalable fabric(NOC)总线通信,两个模块之间通过D2D界面连接。Lunar Lake的P-Core和E-Core分别位于NOC总线的两侧,共享12MB L3缓存,这种设计在低功耗岛设计中延续了Meteor Lake架构的概念,将计算、SoC和图形模块整合到一个模块上,无需在SoC模块上设置额外的LP E-Core。Lunar Lake定位为低功耗轻薄本,节能非常重要。
平台控制模块包含PCIe、USB、Thunderbolt 4、WiFi、千兆有线网络MAC,以及安全模块。Lunar Lake提供三个Thunderbolt 4接口,两个USB 3.0与六个USB 2.0接口。集成英特尔Wi-Fi 7无线网卡,并支持蓝牙5.4。Lunar Lake支持M.2 SSD,配备四个PCIe 5.0和四个PCIe 4.0通道。
Lunar Lake的两个模块全部由台积电生产,计算模块使用N3B工艺,平台控制模块使用N6工艺。处理器和内存封装在同一块PCB上,节省了主板上250mm2的空间,使笔记本主板设计变得紧凑,同时缩短了内存走线,降低内存功耗,对性能改善也有一定的帮助。Lunar Lake最多可配备32GB 2 Ranks的LPDDR5x内存,支持16bit*4通道,最高内存频率达到8.5GT/s。
Lion Cove架构在缓存结构上有所变化,包括在L1数据缓存与L2缓存之间增加了一层缓存,L1数据缓存容量为48KB,加载延迟从5周期降低到4周期;新增的L1数据缓存容量为192KB,加载延迟为9周期。L2缓存容量为2.5MB,比上一代的2MB要大,加载延迟从16周期降低到17周期。四个P-Core共享12MB L3缓存。
Lion Cove架构的前段进行了重新设计,分支预测块增加了8倍,获取区块从以前的64字节增加到128字节,解码器由6个增至8个,微指令队数量144条目增加到192条目,微指令缓存从4K扩大到5.25K,并让缓存读取带宽增加了50%。Lion Cove的乱序引擎划分成整数和矢量区域,具有独立的确定和重命名功能,乱序引擎的分配/重命名从6个增加到8个,退出从8个增加到12个,深度指令窗口从512个增加到576个,执行端口从12个增加到18个。
整数执行引擎的ALU加法器从5个增加到6个,jump单元从2个增加到3个,shift单元从2个增加到3个,乘法器从单个64×64的单元变成了3个64位乘法器。矢量单元的SIMD ALU从3个增加到4个,拥有两个4周期延迟的256位FMA和两个256位除法器。Lion Cove与上一代Redwood Cove相比,平均IPC提升了14%,功耗越低提升幅度越大,在某些低功耗范围内性能增幅甚至超过了18%。
超线程在Lunar Lake上被移除,超线程不是简单关闭,而是直接移除。英特尔做了两个版本的Lion Cove,开启超线程能在相同芯片面积下增加30%的IPC,但代价是增加20%的功耗。在客户端处理器上,E-Core是比超线程更高效的多线程加速手段。频率控制也变得更精细,处理器核心的频率变化步进从100MHz大幅缩小到16.67MHz,提高了能效。
Skymont架构的E-Core IPC向Raptor Cove看齐,与上一代Crestmont相比,整数性能提升了38%,浮点性能提升了68%。在相同功耗下,单线程性能是原来的1.7倍,最大功率性能达到原来的两倍。与Raptor Cove相比,Skymont的单线程整数与浮点性能都高出2%,达到了让Lunar Lake的E-Core性能匹配Raptor Lake的P-Core的设计目标。
GPU采用全新Xe2 Battlemage架构,与上一代Xe-LPG相比,图形性能提升了约1.5倍,或在同性能情况下实现更低的功耗。新一代媒体引擎支持AV1的视频编解码能力,最高可支持8K60 10bit HDR视频编解码,并新增支持H.266(VVC)视频格式的解码能力。
在AI方面,Lunar Lake搭载了最新的第四代NPU,算力达到了48 TOPS,相比上一代有四倍的提升,同时在加强算力的同时也提升了能效,对笔记本的续航影响较小。NPU 4的神经网络运算引擎数量从2个增加到6个,一共有12K个MAC单元,性能提升明显。
在硬件线程调度器方面,Lunar Lake进行了多项升级,包括更智能的反馈机制、增加了OS隔离区、与SoC电源管理引擎结合以及对OEM厂商开放API,使其能够更智能、更灵活地进行线程调度,提升处理器性能和能效。
总结而言,Lunar Lake处理器在架构、封装、工艺等方面都进行了重大改进,针对低功耗平台和未来AI PC,其性能和能效表现值得期待。在台北电脑展上,英特尔并未透露Lunar Lake的具体性能表现,这些细节将在产品发布时揭晓。喜欢我们的内容,请继续关注我们赋创科技,如果您有服务器相关的技术问题,随时欢迎私信我们。