英特尔新一代Soc“Core Ultra S2”性能揭秘
Arc B580 / B570使用的BGM-G21芯片
众望所归!全新Xe2 核心Xe2 Render Slice大幅增效
众望所归,从代号的命名来看,这次Xe2对游戏的优化是重中之重,GPU的构成规模还是以Render Slice为基本单位,全新的Xe2 Render Slice对所有图形加速功能进行深入的微观和宏观分析,并在减少延迟、消除停顿与改善软硬体交握效率等方面进行最佳化。
Render Slice内含4组第2代Xe核心(以下简称Xe2核心),其特性为运算资源在原生SIMD16引擎中重新分配,因而可提高效率。
Arc B580所使用的BMG-G21芯片由5组Render Slice,内含共计20组Xe2核心、20组光线追踪核心、160组XMX引擎、20组材质取样器、10组相素后端,加上18 MB的L2缓存,以及2组MFX(多格式解码器)媒体引擎,再搭配192-bit內存控制器所构成。
在以上构架特性的帮助之下,相较于前代,每个Xe2核心的性能可提升70%,每瓦性能也提升50%。数据也显示Arc B580的实际执行时间较Arc A750大幅缩短32.7%,这意味着整体性能成长48.6%。
每组Xe2核心内含8组512-bit的XVE向量引擎,以及8组2048-bit的XMX AI引擎,这个两种引擎的数量是前代;Xe-HPG内Xe核心的一半,但单一引擎内部的处理单元则是扩增至2倍,因此总量不变,但是单一引擎的数据处理效率会更好。L1缓存则从前代的192 KB提高为256 KB。
大幅度强化光线追踪单元!总频带宽达到672Gb/s
Xe2核心的光线追踪单元则是在处理光线追踪运算所需的Traversal pipelines和Box intersections(侦测光线是否与物体碰触)提升成1.5倍,Triangle intersections(多边型与光线边框相交)和BVH cache(包围体阶层缓存)提升成2倍,大幅提高整体光线追踪的性能。
这波最高阶的产品是Arc B580,使用完整的BGM-G21芯片,拥有5组Render Slice,每组Render Slice内含4组第2代Xe核心,共计20组。每组第2代Xe核心对应相同数量、更强大的光线追踪单元,以及8倍数的XMX AI引擎。显示內存搭配192-bit、19 Gbps的12GB GDDR6,B580搭载20个Xe2架构核心,12GB显存,等效频率28GHz,总频宽达672 GB/s。
次一阶的Arc B570也是使用同一块芯片的删减版,第2代Xe核心数量缩减成18组,运作时脉从2670 MHz小幅下降至2500 MHz。內存界面也缩减成160-bit,维持19 Gbps运作速率,总频宽为380 GB/s。
两款显卡的对外连接界面都是PCIe 4.0 x8,提供3组DisplayPort 2.1(UHBR 13.5)和1组HDMI 2.1视讯输出,电源仅使用1组PCIe 8 pin。
同进化的XeSS2 爆发式增强!支持主流150款游戏!
为了应对主流1440p分辨率游戏环境,整合更先进XeSS 2加速功能,进一步提升整体性能表现。而凭借着Xe2核心内算力更强的XMX AI引擎,XeSS 2现在可同时提供XeSS-SR超分辨率、XeSS-FG画格生成与XeSS-LL低延迟等3种面向的加速效果。
首先看到XeSS-SR超分辨率,这是先渲染较低分辨率的画面,借此提高渲染帧率,再运用AI演算出更高分辨率的最终画面,前代Xe核心就已支持这种做法。Intel表示,以1440p分辨率为基准,XeSS性能模式相较于原生分辨率平均可提高47%每秒帧数。
再来是XeSS-FG画格生成,就如同NVIDIA DLSS 3导入的Frame Generation,参考选染出来的前后画格、动作向量、深度等信息,混合光流重新投影和动作向量重新投影,便可在两个画格之间生成一张新画格,让整体画面更流畅。提高实时渲染性能,实现了性能和质量之间的平衡,生成了时间稳定、高质量、高分辨率的结果,相比传统的渲染方法,计算成本也会大大降低。
这一代更新则是集中在XeSS-SR的SDK(软件开发套件),完整支持DirectX 11、DirectX 12和Vulkan等3种当前主流API,便于进一步扩大支持XeSS-SR的游戏数量。目前XeSS-SR已支持超过150款游戏。
如同DLSS 3处理画格生成会提高延迟时间一样,当然,XeSS-SR超分辨率和XeSS-FG画格生成这两个功能可以互相叠加。以1440p分辨率的《F1 24》为例,超分辨率画质模式搭配画格生成,则FPS可提升至2.8倍;若改为超性能模式,FSP甚至可提升至3.9倍。此外,由于XeSS-LL低延迟就如同NVIDIA Reflex功能,透过改进渲染列队的方式,提前让画面显示于屏幕上,大幅缩短屏幕显示的延迟时间。Intel同样以1440p分辨率的《F1 24》为例,原生分辨率下套用XeSS-LL低延迟可缩短约45%延迟时间。而在XeSS 2同时开启超分辨率、画格生成和低延迟效果的情况下,延迟时间比原生分辨率下套用XeSS-LL低延迟再缩短一些,等同只开启超分辨率的情境。
目前完整支持XeSS 2的游戏有《F1 24》、《消逝的光芒2人与仁之战》(Dying Light 2 Stay Human)和《刺客教条:暗影者》(Assassin's Creed Shadows)在内的这10款,希望以后越来越多。
AIGC利器!大语言模型训练能力领先竞品超过50%!
在实测解禁前,从Intel释出的理论性能来看,Arc B580的光栅画性能可领先GeForce RTX 4060达32%,光线追踪性能也领先有25%。除了精确的显示与3D图形设定,新一代Intel图形软件还支持性能与超频设定,以简单易懂的友善图形界面,让用户快速调整超频绍设定。游戏实际表现,Arc B580平均较Arc A750成长24%,也领先GeForce RTX 4060约10%。
英特尔展示了他们在大语言模型应用方面的表现。通过集成了 ChatGLM2、LLaMA2 和 StarCoder 这三个大语言模型的 Demo,他们演示了这些模型在中文和英文应用上的表现。
Intel Arc Battlemage Xe2 Architecture
除了加速游戏表现,XMX AI引擎当然能应用在各式AI工作流程中。从建构、最佳化到执行,可支持的框架、工具、API等都相当丰富。根据Intel释出的数据,Arc B580的大型语言模型性能表现领先GeForce RTX 4060达40% ~ 50%。
根据Intel释出的数据,Arc B580在1440p分辨率、超高特效的游戏表现平均可领先NVIDIA GeForce RTX 4060达10%。一向主打性价比的Intel ARC没有让人失望,首发两款产品Intel ARC B580和Intel ARC B570全部直奔2000元人民币的档位去的。作为针对英伟达GeForce RTX 4060建立起来的光线追踪游戏门槛,此次Intel准备可以说是信心满满,无论从性能还是市场价格定位,都可以说是非常具备性价比。
Intel Arc B580限量版
目前已知Arc B580会推出Intel自家设计的限量版,采用近期流行的短PCB搭配长散热器设计,核心导热元件是热导管搭配全黑化处理的铝制鳍片,使用2组风扇吹拂,显卡后半有空出气流穿越鳍片的镂空区域,顶部再标上Intel Arc字样。
Acer宏棋、ASRock华擎、GUNNIR蓝戟、ONIXX、MAXSUN铭瑄、Sparkle撼与等品牌都会推出自制卡Arc B580,12月13日上市。Arc B570目前只规划自制卡,2025年1月16日上市。
喜欢这款设备?留言告诉我们!更多游戏推荐请关注👇