划重点
01处理器内核延迟是影响性能的一个重要因素,包括缓存未命中、指令依赖和总线传输等原因导致。
02降低内核延迟意味着处理器在运算过程中需要等待的时间更短,处理器的性能自然更高。
03AMD近期发布的新版固件AGESA 1.2.0.2b在部分游戏中性能有所提升,但幅度不大。
04除此之外,新版固件通常还包含其他方面的改进,降低内核延迟并不是唯一改进。
以上内容由腾讯混元大模型生成,仅供参考
一、前言
对于数码硬件爱好者朋友来说,可能都听过这样一种消息:不管是英特尔的处理器,还是AMD的处理器,在处理器发布上市之后,厂商都声称后期可以通过推送固件更新的方式提升性能,请参阅图一和图二。
有很多朋友不知道“推送固件更新提升性能”的原理是什么,甚至可能有部分朋友认为这就是一个营销噱头,其实不然,这样做是有严格科学根据的。本文将简要的科普一下这方面的知识,并分享、介绍AMD近期发布的新版固件的实际效果。
二、内核延迟的定义
要理解为什么推送固件更新可以提升处理器性能,首先要理解处理器“内核延迟”的概念。
其实处理器内核的概念并不复杂,简单来说,内核延迟是指处理器内核在执行指令时,从发出请求到实际开始处理这个请求之间的时间间隔。
三、内核延迟的产生原因
处理器内核延迟的定义比较抽象,可能不太好理解,下面小编列举三种会导致处理器内核产生延迟的原因,以便于大家理解参考。
1、缓存未命中
现代处理器通常搭载多层缓存(比如L1、L2和L3级缓存等),如果处理器内核目前所需要的数据不在速度最快的 L1缓存中,就需要从速度更慢的L2、L3级缓存甚至内存中读取(这就叫“缓存未命中”),这个过程中就会产生延迟。
2、指令依赖
在指令流水线中,有些指令的执行依赖于前面指令的结果,必须等待前面的相关指令执行完成并将结果传递过来之后,运算才能继续正常执行,在等待前一个指令返回结果的过程中就会产生延迟。
3、总线传输
当处理器内核需要从外部设备(如内存和硬盘等)获取数据或者指令时,需要通过系统总线进行传输,因此,总线带宽的限制和传输过程中的优先级等因素会导致数据传输出现延迟。
比如,当多个设备同时请求使用总线时,系统需要通过一定的算法和优先级来确定哪个设备先使用,这个决策过程会使处理器内核等待数据的时间变长,也会产生延迟。
四、内核延迟过高的负面影响
理解上述概念之后,对于处理器内核延迟的负面影响就非常好理解了,大家也应该非常熟悉了。
1、影响性能
如果处理器的内核延迟较高,肯定会影响、降低处理器的性能。比如,在依赖单线程性能的应用中,延迟会使指令执行速度变慢,导致程序响应时间变长。例如,对于实时性要求很高的游戏应用,内核延迟过高可能会导致游戏画面卡顿,因为处理器内核不能及时处理游戏场景中的数据更新请求。
在依赖多线程性能的应用中,延迟较高可能会导致线程切换的开销增加,因为线程切换需要保存和恢复处理器状态,并且等待新线程所需的数据和指令。
比如Ryzen 9 9950X初期的跨CCD延迟高达180ns(图六),远超正常主流水平,图七为Ryzen 9 7950X的延迟检测统计,大家可以仔细对比。
2、影响功耗
延迟可能会导致处理器处于等待状态的时间变长,在等待过程中,即使没有进行有效的运算工作,处理器可能仍然在消耗电能,从而会增加处理器的整体功耗,尤其是在延迟较高且频繁发生的应用场景下。
对笔记本电脑、平板电脑和智能手机等依赖于电池供电的设备来说,则会表现出发热严重和续航时间短等等,这些大家都应该很熟悉,请参阅本段落上下两张图片。
五、小编小结
综上所述,内核延迟是影响处理器性能的一个重要因素,由于多种原因,在处理器具体的运行过程中,完全不会产生内核延迟这种情况是不存在的,但是,可以通过多种方式进行优化,以尽可能地降低内核延迟。
降低内核延迟,意味着处理器在运算过程中需要等待的时间更短,处理器的性能自然更高,就相当于是提升了处理器的性能,这就是为什么英特尔和AMD可以通过发布固件更新的方式提升处理器性能的原因。
为了更直观,大家可以参考图六和图十,这是Ryzen 9 9950X采用AMD之前发布的新版固件与旧版固件的CCD延迟测试对比。其中,左上角和右下角代表同CCD内部的延迟统计,左下角和右上角代表跨CCD延迟统计,第二张的跨CCD延迟明显大幅降低,几乎降低了一半。
六、AGESA 1.2.0.2b更新的效果
介绍处理器内核延迟的概念并不是本文的主要内容,这只是为了让读者便于理解后文所做的知识铺垫,本文的主题是介绍AMD AGESA 1.2.0.2b版固件更新的效果。
近日,有第三方评测机构对AMD所发布的AGESA 1.2.0.2a版和AGESA 1.2.0.2b版固件的性能进行了对比,其结果非常具有参考价值。
测试配置如下:处理器为Ryzen 7 9800X3D,主板为ROG Strix B650E-F Gaming WiFi,内存为64GB DDR5 6200 MT/s CL30,硬盘为英睿达T700,显卡为GeForce RTX 4090。
测试结果如下:
在游戏《杀手3》中(上图),AGESA 1.2.0.2a平台的平均帧速为265 FPS,最低瞬时帧数为97 FPS,AGESA 1.2.0.2b平台的平均帧速为275 FPS,最低瞬时帧数为101 FPS,分别高3.77%和4.12%。
在游戏《潜行者2》中(上图),AGESA 1.2.0.2a平台的平均帧速为92 FPS,最低瞬时帧数为45 FPS,AGESA 1.2.0.2b平台的平均帧速为98 FPS,最低瞬时帧数为47 FPS,分别高6.52%和4.44%。
在游戏《星空》中(上图),AGESA 1.2.0.2a平台的平均帧速为145 FPS,最低瞬时帧数为58 FPS,AGESA 1.2.0.2b平台的平均帧速为147 FPS,最低瞬时帧数为61 FPS,分别高1.38%和5.17%。
综合来看,与AGESA 1.2.0.2a版固件相比,AGESA 1.2.0.2b版固件的游戏性能确实有所改进,尽管幅度不大,另外提升幅度还取决于具体的游戏,在部分游戏中提升并不明显。
七、小编总结
总体而言,处理器厂商在处理器发布之后通过推送固件更新的方式提升处理器的性能并不是噱头,是有科学根据、可行的,其性能提升幅度往往很明显,但并不大。
最后需要补充强调的是:内核延迟只是影响处理器性能的一个方面,处理器厂商可以通过推送固件更新的方式降低内核延迟提升性能,但这并不是唯一的方法,只是其中的一种而已,另外,新版固件通常还包含其他方面的改进,降低内核延迟并不是唯一改进。