英特尔酷睿Ultra 200S系列解析：架构焕新，能效称王

三易生活

2024-10-10 23:02发布于广东三易生活官方账号

2024年10月10日晚间，英特尔方面正式解禁了全新的酷睿Ultra 200S系列桌面版处理器的架构、平台，以及价格信息。

虽然距离正式上市还有一段时间，但这也意味着在经过了此前12-14代酷睿的“混合架构”洗礼之后，英特尔的主流桌面CPU产品线时隔多年后迎来了大幅的变革。

既然如此，在正式对新平台进行性能测试前，我们三易生活会先用这篇内容来为大家介绍英特尔这一代从名称到内涵，一切都已经发生了巨大改变的桌面平台。

CPU架构袭承“月湖”，但模块设计大有不同

几个月前我们曾用《在酷睿Ultra 200V身上，我们看到的是“拨乱反正”》这篇文章，为大家介绍过英特尔的新一代低功耗移动平台“月湖（LunarLake)”酷睿Ultra 200V系列，并对它所使用的全新CPU核心架构LionCove和Skymont进行了详细解析。

与“月湖”相比，代号“箭湖（Arrow Lake）”的酷睿Ultra 200S家族这次并没有在CPU架构设计、或者CPU制程方面进行太大的改动。它的CPU模块采用台积电N3B工艺，同时P核和E核也依然沿用LionCove和Skymont这两款架构设计，并不像当年的11代酷睿那样，存在移动版和桌面版制程和架构都不一样的问题。

但即便如此，在深入探究“箭湖”的CPU核心设计时就会发现，它的P核与E核之间的排布方式以及缓存和总线的互联设计，实际上都与之前的低功耗移动版有着很大的差异。

具体来说，在此前移动版的酷睿Ultra 200V上，其E核与P核在片上位于完全不同的位置，E核不能访问P核的L3缓存。所以为了解决这个问题（以及缓解移动版LPDDR内存的延迟痼疾），英特尔还专门在内存控制器附近增加了系统级缓存（SLC），来在一定程度上给E核充当额外的缓存池。

但桌面版的酷睿Ultra 200S系列则不然，这次它的P核与E核采用了交叉排布的设计，即在CPU模块内部，每两个P核中间就“夹着”一个由四颗E核组成的集群，从而构成最大8P+16E的结构。与此同时，每个P核拥有独立的3MB L2缓存、每个P核集群共享2MB L2，而且所有的P核与E核也全部都连接到了一个36MB的全核心共享智能缓存（即L3）上。

这样的设计有什么好处呢？我们这里用一张英特尔12代酷睿时期的架构示意图作为对比就不难发现，新的设计一口气解决了两个问题，即P核与E核以往通向L3缓存的线路等长问题，以及不同核心之间发热量均衡的问题。换句话来说，新的桌面版酷睿Ultra 200S系列可能会有更好的（全核心）缓存一致性表现，以及更“均匀”的CPU核心温度分布。

GPU换代、桌面版首次新增NPU，不过规格有所差异

除了彻底进行CPU架构、制程、排布方式等方面的换代之外，酷睿Ultra 200S系列的在产品设计上的另一个亮点，是它终于在英特尔的桌面版处理器中实装了基于Xe-LPG架构的新一代GPU，同时首次在英特尔的桌面版处理器中新增了NPU模块。

不过需要注意的是，虽然名义上都属于酷睿Ultra 200家族，而且CPU的核心架构也相同，但酷睿Ultra 200S系列的GPU和NPU架构并不同于此前酷睿Ultra 200V所使用的设计。

具体来说，此次酷睿Ultra 200S系列集成的GPU是初代Xe-LPG架构，也就是和此前Metor Lake“流星湖”相同的GPU设计。也就是说它是基于英特尔初代ARC独显简化而来，带有硬件光追单元、完整支持DirectX 12.2，但去掉了（独显版的）XMX矩阵计算单元。

同时因为桌面版CPU不像移动版那样对集成的图形性能有那么高需求，所以酷睿Ultra 200S系列的核显最多具备4个Xe核心，也就是512ALUs、32TMUs、16ROPs和4RT Cores的配置。考虑到它最高2GHz的运行频率，其峰值性能大约是酷睿Ultra 100系移动版所集成ARC核显的50%略低一点。

此外由于没有XMX单元，所以酷睿Ultra 200S系列的核显是通过ALUs运行DP4a指令集来提供AI加速算力，其GPU单独的AI算力最高可达8TOPS。

与此同时，酷睿Ultra 200S系列的集成NPU也采用了移动版酷睿Ultra 100系列的同架构设计，即英特尔自研的第三代NPU加速器方案（英特尔方面将其简称为NPU3，顺带一提，NPU1和NPU2其实就是此前的两代Movidius计算棒）。它可以提供最高13TOPs的AI算力。再加上CPU这次P核和E核都支持AVX-VNNI指令，所以CPU本身也有最高15TOPs的AI算力。按照英特尔方面的说法，这就构成了酷睿Ultra 200S系列最高36TOPs的“平台算力”。

可能有的朋友看到这里会有些嗤之以鼻。没错，我们三易生活此前也曾提及，这种将CPU、GPU、NPU各自算力粗暴进行加总的算法，在实际应用场景中其实并不科学。但这个问题在英特尔身上却相对没那么难以接受，这是因为他们早在好几年前就推出了能同时调用CPU、NPU、GPU，甚至还有FPGA进行异构AI加速的One API。

比如在酷睿Ultra 200S系列上，如果为它再搭配一块ARC独显，那么其整机AI计算体系还会自动适配ARC独显的XMX单元，实现CPU（AVX-VNNI指令）、GPU（DP4a指令）、NPU（MAC阵列）、dGPU（XMX单元）的四架构AI任务自动分配。

没超线程但性能涨了，功耗还狠狠砍半

说了这么多，那么酷睿Ultra 200S系列的实际性能水准到底如何呢？

首先根据目前公布的官方资料可知，首批酷睿Ultra 200S系列桌面版处理器共包含五个SKU，即最高端、采用8P+16E CPU组合的Ultra9 285K，作为“次旗舰”、拥有8P+12E CPU的Ultra7 265K和265KF，以及明显“走量”、基于6P+8E CPU设计的Ultra5 245K/245KF。

需要注意的是，与此前的14代酷睿相比，新的酷睿Ultra 200S系列普遍没有进一步提高CPU的峰值主频，同时新的CPU架构也全面取消了超线程功能。也就是说，这次即便是目前定位最高的Ultra9，最多也只有24核心24线程了。

但是按照英特尔方面的说法，与14代酷睿相比，酷睿Ultra 200S系列的P核IPC提升了9%、E核的IPC更是暴涨32%。同时新款处理器的E核峰值主频比以前有了非常巨大的进步，再加上2倍的二级缓存带宽、更深的并行处理队列性能，以及大幅增强的指令预测和分配性能，这些架构和频率方面的改变，最终使得酷睿Ultra9 285K的单核性能比酷睿i9-14900K提升了8%、比竞争对手最新的旗舰快4%。同时更为重要的是，酷睿Ultra9 285K的多核性能在线程数不占优的情况下，依然比14900K提升了15%、同时比竞品也要快13%。

这还没完，英特尔方面公布的测试数据表明，在办公、视觉模型计算、视频渲染、电话会议等日常使用场景中，与14900K相比，酷睿Ultra9 285K的功耗甚至可以降低42%-58%之多。

而在更吃性能的3A游戏场景里，酷睿Ultra9 285K在相同条件下要比酷睿i9-14900K功耗爆降50W-165W，平均CPU封装温度更是可以降低10-17℃。

有意思的是，英特尔在测试中还玩了一个“花活”。他们将酷睿Ultra9 285K的PL1功耗刻意从默认的250W限制到了175W和125W，结果发现在刻意限制功耗的前提下，它在好些游戏里的实测性能甚至没有出现下降。

那么这意味着什么呢？一方面，这代表着部分用户和OEM厂商或许有望通过出厂限制功耗的方式，推出采用更紧凑体型、但性能完全不打折扣的“桌面版NUC”。另一方面这或许也是在暗示，目前的酷睿Ultra 200S系列的出厂频率，还有很大的超频可玩性空间。

结语：架构和平台同步大幅更新，英特尔步入新的时代

前段时间，当英特尔正式端出峰值功耗仅30多瓦，E核性能与整体能效比都大幅暴涨，甚至离电情况下完全不降性能的酷睿Ultra 200V系列后。它的表现确实让很多人惊呼，重新见识到了英特尔在CPU设计方面的巨大潜力。

不过酷睿Ultra 200V毕竟定位是超低电压、超轻薄形态的笔记本电脑，相比之下，如今的酷睿Ultra 200S系列作为更主流的桌面处理器，显然才足以让更多消费者重新认识到英特尔时隔多年推出的新架构的魅力。

在高调引入NPU、强调全平台AI加速能力，以及大幅降低功耗和发热之余，凭借着全新的Z890芯片组和LGA1851平台所赋予的IO体系，英特尔也正在将大量他们引以为傲的新技术带到桌面端。比如首次标配的雷电4，比如多达20条的PCIE 5.0通道，又比如可选的雷电5和WiFi7。

特别是雷电4这次在桌面平台上的大面积普及，再加上酷睿Ultra 200S系列本身的低功耗属性，更是为超小型桌面主机+外置显卡坞的产品形态彻底铺平了道路。

当然，除了以上这些之外，如果你是一位真正的发烧友，那么从酷睿Ultra 200S系列的设计上或许就能看出一些额外的“伏笔”。其中包括但不限于将于明年年初登场的酷睿Ultra 200HX标压移动平台，大概率会得到大幅改善的能效和发热表现，以及目前英特尔方面很明显在快速、且大幅强化E核架构背后所反映出，据称与传闻中“Royal Core”架构息息相关的一些产品设计思路。

当然，关于酷睿Ultra 200S系列的性能实际测试，目前我们三易生活正在准备中。至于新平台这一次究竟表现如何，又是否能够令市场刮目相看？大家稍安勿躁，耐心再等待一段时间即可。

查看原图 81K