在英特尔Lunar Lake发布一个月后,面向台式机和高性能笔记本的Arrow Lake正式揭开面纱。同样,Arrow Lake在底层上相对14代酷睿Raptor Lake Refresh发生了巨大改变,以至于在命名规则上完全放弃第几代酷睿的命名规则,与移动端看齐,全面转向酷睿Ultra系列,桌面端首发产品即为眼前的酷睿Ultra 200S系列,并且在选择制造工艺也做了大转向,从原计划的Intel 20A,转向台积电N3B、N5P和N6工艺。
如果说Lunar Lake见证了英特尔的变革决心,那么Arrow Lake更像是一场对桌面端处理器重新定义的展现。现在就趁着消息解禁的机会,让我们近距离看看酷睿Ultra 200S有哪些值得注意的细节。
最高24线程,5.7GHz
首次发布的酷睿Ultra 200S均为不锁倍频的K系列产品,包括顶配的酷睿Ultra 9 285K,酷睿Ultra 7 265K/KF,酷睿Ultra 5 245K/KF,换而言之,顶配酷睿Ultra 9 285K目前没有不带核显的版本。由于不再使用超线程技术,能够看到酷睿Ultra 200S为一个核心对应一个线程。
其中,酷睿Ultra 9 285K拥有8个P-Core,16个E-Core,总共24线程,核显部分使用4个Xe-LPG,最高频率5.7GHz。电商定价4799元。
酷睿Ultra 7 265K/KF为8个P-Core,12个E-Core,总共20线程,4个Xe-LPG,最高频率5.5GHz。电商定价3149元起。
酷睿Ultra 5 245K/KF为6个P-Core,8个E-Core,总共14线程,4个Xe-LPG,最高频率5.2GHz。电商定价2399元起。
尽管从Raptor Lake Refresh上的32线程下降到现在Arrow Lake的24线程,但由于新架构设计下每周期指令数(Instructions Per Cycle,IPC)提升,以及多线程性能的表现,对于以来多核心数量的创作者、主播和高端用户而言,收益非常明显。包括整体功耗降低40%,多线程性能15%的提升,平台温度降低10℃,以及带来NPU的AI加速功能。
与Lunar Lake一样,酷睿Ultra 200S的P-Core来自于Lion Cove,E-Core来自于Skymont。不过核显为Xe-LPG,而非Lunar Lake上的Xe2-LPG,NPU则使用了NPU 3,并非Lunar Lake上的NPU 4。这样的设计一方面是顾及到桌面端通常会搭配更强劲的独立GPU作为支持,另一方面NPU 4和Xe2-LPG在设计上会对移动端有所偏倚,最终让Arrow Lake团队做出了这样的选择。
在制造工艺上,台积电N3B负责计算模块(Compute tile),台积电N6负责平台控制模块(Platform Controller tile),台积电N5P负责核显GPU。
Lion Cove与Skymont架构在前段时间我们已经进行了较深入的分析,有兴趣的同学可以去查阅《英特尔Lunar Lake浅析:架构推倒重来,AI性能猛增》作为参考。
简单的说,P-Core的Lion Cove架构使用了全新的多层数据缓存设计,包含1个具备4周期延迟的48KB L0D缓存,1个9周期延迟的192KB L1D缓存,以及1个17周期的3MB L2缓存。这意味着在9个时钟周期内,可以获得L0D+L1D的240KB缓存。相比上一代Meteor Lake P-Core的Redwood Cove架构,9个时钟周期内只能有48KB缓存。不仅如此,数据转换后备缓冲区(DTLB)也进行了修订,其深度从96页增加到128页,以提高其命中率。
与此同时,英特尔还增加了第三个地址生成单元(Address Generation Unit,AGU)以进一步提升存储性能。负载单元和存储单元管道数量均达到3个,在英特尔大部分架构中,负载单元通常多于存储单元。可以看到英特尔正在尝试在CPU设计中投入更多的缓存设计来解决性能问题,特别是随着CPU系统设计愈发复杂,缓存子系统有必要跟进增加,以保持其正常运行,从而成为提升性能与执行效率的关键。这让IPC(Instructions Per Cycle,每个时钟周期指令数)提升幅度达到了30%,动态电源效率提升了20%。
同样,Skymont也使用了全新的设计。包括在一个时钟周期内同时解码并执行9条指令,也就是9宽解码,比上一代E-Core的Crestmont架构增加了50%。通常而已,解码阶段的宽度越大,处理器的性能越高,可以更有效地利用其资源,加快指令的执行速度。并且功耗效率得到了明显提升,单线程性能提升1.7倍的情况下,功耗仅为Meteor Lake LP E-Core的三分之一。
另外Arrow Lake中,Skymont E-Core集群可以访问36MB的L3缓存,这个设计的作用相当于Lunar Lake的8MB内存侧缓存来保护Skymont没有命中的影响。与此同时,与Raptor Lake Refresh相比,Arrow Lake的P-Core L2缓存从2MB增加到了3MB,4个E-Core共享一套4MB L2缓存。
核显方面,Arrow Lake使用的4个Xe-LPG核心,但对最新编解码器提供了支持,包括索尼的8K XAVC编解码器,这套编解码器已经在Adobe视频制作软件中应用,如果搭配硬件层面编解码,也意味着Arrow Lake会拥有更高的效率。
人工智能无疑成为Arrow Lake的新卖点,NPU 3被首次加入到桌面端电脑中,与此同时,CPU和iGPU中还加入了AVX-VNNI和DP4A扩展,AI算力达到36 TOPS。其中AVX-VNNI是AVX指令集的进一步扩展,主要应用在矩阵运算和提升AI数据吞吐量表现上,DP4A针对卷积神经网络CNN以及大规模整数运算场景。这意味着Arrow Lake有大量的核心、指令集用于处理PC中的AI功能,包括摄像头、语音的AI加速,也为将来的AI应用扩展做好准备。
目标:降低功耗
功耗表现则是Arrow Lake的重头戏,得益于新工艺和性能优化,Arrow Lake整体能效得到显著提高,无论是网页浏览、文字处理、视频会议,实际功耗都会比以往降低一半。其中单线程与Raptor Lake Refresh相比,性能提升大约8%,与竞争对手AMD相比,也同样有不错的表现。
值得说明Arrow Lake在低功耗水平下的计算性能更为显著,如果使用Cinebench 2024作为参考,Arrow Lake在125W工号下的多线程性能与Raptor Lake的250W相当。而在更多的应用场景中,功耗普遍可以降低50%,游戏时候的系统功耗可以降低50W到80W,平均游戏温度降低13℃,这意味着Arrow Lake可以装进更小的机箱内,对散热器要求降低,亦或者有更好的超频潜力。
值得说明的是,虽然P-Core的峰值频率相比Raptor Lake Refresh最高6GHz有所降低,但英特尔强调针对游戏表现付出了很多努力,包括在游戏负载期间,动态功耗大幅减少,每瓦性能提升,利用NPU和GPU加速,还能够启用数字线性电压调节器,对每一个核心进行实时控制,并且对DDR5内存开启X.M.P后的支持来到8000MT/s以上。
英特尔表示,在实际游戏中,Arrow Lake与Raptor Lake的差距大约在3%左右,但Arrow Lake功耗处在更低水平。在现场演示的DEMO中,能够看到功耗大约降低了80W,而诸如《神话时代》和《战锤》这样的游戏中,系统层面的功耗降低超过125W。与此同时,Arrow Lake的峰值温度降低了15℃到17℃。Arrow Lake无疑会成为近几年来温度最低的游戏CPU之一。
如果与AMD Ryzen 9 9950X竞品做比较,酷睿Ultra 9 285K游戏性能想到相当。在一些注重缓存性能场景中,酷睿Ultra 9 285K可以做到5%到7%的提升,而如果是多线程性能表现,酷睿Ultra 9 285K更胜一筹。
有意思的是,如果将PL1的250W功耗降低,酷睿Ultra 9 285K仍可以做到游戏性能的一致性,这对追求机箱小型化的玩家而言是个好消息。当然酷睿Ultra 9 285K也并非唯一选择,酷睿Ultra 7和酷睿Ultra 5的表现也能更好的帮助创作者和游戏玩家从性价比和场景出发进行搭建。
让桌面电脑AI起来
AI厉害的地方在于通过专门的硬件降低多线程上的工作负载,从而用更少的力气做更高效的工作。比如光线追踪渲染器、视频编解码处理都将是Arrow Lake的强项。而在过去的一年中,诸如Adobe、Blackmagic Design以及Magics都开始在专业应用中加入AI功能,从2023年到2024年,启用AI功能数量增长10倍,AI应用无疑是未来的发展方向。
由于英特尔长期与专业软件供应商保持合作,对AI需求的支持也更为敏锐。比如仅依靠NPU无法成为AI应用中的主导者,GPU仍然占据AI应用算力的主流,明年大约有5%的功能迁移到NPU上实现。
这里英特尔引用Geekbench AI作为参考,相对14代酷睿i9-14900K,酷睿Ultra 9 285K无论CPU、iGPU在INT 8和FP16上都有更显著的提升,NPU则是做到了更好的补充。
在UL Procyon中,则可以看到NPU有更强的性能表现,Arrow Lake在AI性能上的表现已经比Raptor Lake Refresh有了更显著的提升,利用NPU加速游戏,在未来不失是一种理想的选择。例如利用Cephable实现更好的操作交互,将视觉和语音模型转换到CPU、GPU或者NPU上,不仅降低CPU和GPU的利用率,也可以为游戏控制提供了很好的思路。
因此英特尔认为Arrow Lake可以更好的给3D建模、高分辨率游戏和发烧友提供更好的选择。根据英特尔预判,在2025年底,Meteor Lake、Lunar Lake和Arrow Lake累计推出的AI处理器产品组合,将达到1亿片。
在扩展方面,Arrow Lake首次采用了LGA1851主板,搭配800系列芯片组,首发Z890主板,并首次集成了雷电4支持,以及提供独立雷电5选项,通过Thunderbolt Share实现两台PC之间高速连接。无线连接中,则提供了Wi-Fi 6E和蓝牙5.3的支持,并提供Wi-Fi 7和蓝牙5.4,2.5Gbps网口选项,同时Killer网络团队也会给游戏连接体验保驾护航。
超频性能上,Arrow Lake可以16.67MHz的频率更细微的调整CPU性能,双重基础的时钟
频率,能够对核心和核心的连接环以及内存、系统结构、系统 SoC 芯片进行更细致的频率调整,模块间和 SoC 模块能够超频,能够对SoC模块和各模块间的接口做调整,以增加系统到内存的吞吐量。同时每个P-Core核心都有自己的电压控制,每个E-Core集群也用享有一个独立的电压控制,在极限超频状态下,用户也可以绕过DLVR,实现极限超频。
在内存支持上,Arrow Lake最高支持到192GB DDR5-6400,如果采用新的CUDIMM技术,可以达到8000MT/S以上,原因在与内存控制器可以长时间保持在Gear 2,用户可以从IMC和内存中获得大量额外频率,从而也从侧面证明了Arrow Lake在超频方面的可玩性。
写在最后
从整体而言,Arrow Lake是一款全面改变的处理器,作为英特尔新一代旗舰级消费处理器,在拥有同样出色的游戏性能的同时,多线程、生产力负载以及AI方面拥有更好的表现。重点在于Arrow Lake的高效能表现,给这款产品后续提供了更多可玩性。
在交流会现场,英特尔也特别提到了七彩虹和铭瑄作为本土ODM对Arrow Lake主板开发的支持,这意味着围绕Arrow Lake搭配,超频玩法,AI应用将拥有更多可能。
而这也仅仅是新的开始,很快基于Arrow Lake的HX和H系列酷睿Ultra处理器也将会在明年第一季度发布,无论是轻薄笔记本、性能本、电竞台式机,AI功能都将成为标准配置,随着相应软件和游戏的支持,有理由相信AI PC会成为我们工作、生活和娱乐不可缺少的一部分。
顺带一提,在这个月底,Arrow Lake性能评测将正式解禁,届时不要走开,让我们一起探讨Arrow Lake,酷睿Ultra 9 285K和酷睿Ultra 5 245K的真实性能。