游戏性能无可匹敌!AMD Zen5 9000系处理器

经过漫长的等待,采用新一代Zen 5架构的AMD锐龙9000系列处理器终于上市。对于消费者而言,最关心的问题莫过于它是否值得购买。根据AMD在产品上市前的介绍,凭借Zen 5新架构,锐龙9000系列处理器在多个处理器性能、应用性能以及游戏性能测试中均展现出超越竞争对手英特尔第14代酷睿处理器的实力。

不过,锐龙9000系列处理器仍沿用了Zen 4架构的核心数量规格和工作逻辑,这意味着Zen 5架构依然采用全大核设计。相比之下,英特尔第14代酷睿处理器采用了Performance-core(性能核)加Efficient-core(能效核)的设计,并借助硬件线程调度器进行任务调配。

在加入了数量众多的E-core之后,英特尔处理器的理论核心数得以领先锐龙9000系列主流处理器很多,比如第14代酷睿i7处理器就比锐龙7系列产品多了12颗能效核。那么在真实测试中,两种架构逻辑(纯大核和大核+众多小核)的实际表现谁更优秀?让我们继续往下看。

1.大力提升单核心性能 -----Zen 5处理器架构

要想用更少的核心数量战胜核心数量更多的处理器,关键在于提升每颗核心的性能。因此,AMD在介绍Zen 5微架构时明确表示,该架构旨在实现以下四大目标:一是每周期执行更多指令,二是整体宽度更宽,三是缓存数据带宽翻倍,四是AI加速。为此,AMD对Zen 5处理器架构进行了多项改进。由于《微型计算机》已在2024年8月刊中对Zen 5处理器架构进行了深度解析,这里我们仅作简要回顾和总结。

Zen 5架构改进的重点在于解码器改为2个4宽度的解码器

首先是前端方面的改进。Zen 5 的主要改进之一是将解码器从原来的单个 4 宽度解码器改为两个 4 宽度的解码器,从而在同一时间内实现了 8 宽度的解码。自 Zen 架构推出以来,AMD 一直使用单个 4 宽度解码器,这一设计贯穿了多代产品,包括 Zen 4 架构。在 Zen 5 中,这一设计终于得到了彻底改进,标志着 AMD 在前端架构上的重大突破。

在 Zen 5 中,解码器的设计变化不仅仅是简单的数量增加,更重要的是解码能力和效率的显著提升。通过采用两个 4 宽度解码器,Zen 5 能够在同一时间处理更多的指令,从而提高了指令处理的速度和吞吐量。这一改进使得 Zen 5 在处理复杂计算任务时更加高效,特别是在高性能计算和多线程应用中。

相应的分支预测能力也得到了大幅提升,包括更低的延迟、更高的准确性和更大的吞吐能力。分支预测一直是 CPU 性能的关键因素之一,其准确性直接影响了处理器的整体性能。Zen 5 在分支预测方面进行了多项优化,使得处理器能够更准确地预测程序的执行路径,从而减少了不必要的分支错误带来的延迟。这些改进使得 Zen 5 在执行分支密集型任务时表现更加出色。

Zen 5处理器拥有更宽、更大的分派和执行窗口

指令缓存方面,由于解码器的调整,现在也变得更加快速和宽广。改进后的指令缓存能够更快地存储和检索指令,从而提高了处理器的指令处理速度。这一改进不仅提升了缓存的命中率,还减少了因缓存缺失导致的延迟。这对于需要频繁访问指令的应用来说尤为重要,能够显著提升整体性能。

总的来说,Zen 5 拥有一个更大的前端,随之而来的是更多的优化和调整工作,特别是在分支预测等方面。这些改进不仅提升了前端的处理能力,还优化了整个处理器的性能。更大的前端使得 Zen 5 能够更好地处理复杂的工作负载,特别是在多线程和高性能计算场景中。

此外,Zen 5 的前端改进还包括了多个方面的优化,如指令调度器、译码单元和指令缓冲区等。这些改进共同作用,使得 Zen 5 在处理大规模指令集时更加高效和灵活。特别是在多任务处理和复杂计算任务中,Zen 5 能够更好地利用硬件资源,提升整体系统的响应速度和吞吐量。

前端的变化带来了更多指令的涌入,因此Zen 5的整数执行部分变得更加宽广。Zen 5的整数部分现在拥有8宽度的调度和退出系统,排序单元由之前的Zen 4架构中的4个小单元变为2个大规模单元。整数执行部分包含6个ALU BR单元和3个ALU Mul乘法器,而前代Zen 4则仅有2个ALU、2个ALU BR单元以及3个AGU。从规模上看,Zen 5显然更大,同时Zen 5还扩大了执行窗口。

Zen 5处理器拥有更宽、更大的分派和执行窗口

Zen 5架构通过采用48KB 12-way L1数据缓存,将每核心L1缓存总量提升至80KB,对比之下,Zen 4为32KB 8-way设计,总量64KB。此外,Zen 5的L1缓存带宽和浮点单元带宽均翻倍,并增强了数据预取性能。

Zen 5处理器拥有完整的AVX-512支持能力

在浮点执行单元方面,AMD引入了一个强大的、支持AVX-512的512位SIMD单元,队列深度为384,并配备了6个2周期延迟的FADD单元,整体浮点指令执行能力得到了显著提升。这一浮点能力的增强将显著提升AMD在AI、游戏计算以及部分科学计算方面的性能。相比之下,尽管Zen 4处理器也能执行AVX-512,但它是通过两个256位SIMD单元合并实现的,而Zen 5则具备完整的AVX-512支持能力。

Zen 5桌面处理器的计算核心采用台积电4nm工艺制造

生产工艺上,锐龙9000系列桌面处理器基于Zen 5架构,采用台积电4nm工艺制造,CCD代号“Eldora”,含83.15亿晶体管,面积70.6平方毫米,密度达1.18亿晶体管/平方毫米,比Zen 4密度提高26.8%。其IOD芯片保持与Zen 4相同的TSMC N6工艺,面积122平方毫米,含34亿晶体管,密度2790万晶体管/平方毫米。

功能方面依旧是提供24条PCIe 5.0通道,让用户可同时使用一块PCIe 5.0 x16显卡,两块PCIe 5.0 x4 SSD,并拥有支持DDR5 5600双通道内存,最高可支持DDR5 8000高速率内存的能力。

Zen 5桌面处理器仍采用了内置RDNA 2架构的显示核心

此外,首批上市的锐龙9000系列处理器均内置了基于RDNA 2架构的显示核心,这意味着即使没有独立显卡,每一款Zen 5处理器也能正常使用。当然,内置显示核心的规模不大,只有两个CU计算单元和128个流处理器,但支持AV1硬件解码,以及H.264和H.265的硬件解码与编码,并支持4K@60Hz显示。这足以满足一般的办公与视频应用需求。

相比普通Zen 4处理器,锐龙9000系列处理器增加了对USB4技术的支持,可提供最多两个带宽为40Gbps的USB4接口,当然这需要用户使用在主板上设计有USB4接口的600系主板或在预计今年9月上市的X870E、X870主板,才能享受到USB4技术。

开启锐龙9000系列桌面处理器的PBO(精准性能提升)功能可以带来最多15%的性能提升

在处理器超频方面,除了不锁倍频等优势外,AMD还优化了PBO(精准性能提升)技术。如果用户的散热配置非常出色,并且优先考虑性能,尤其是多线程性能,那么开启锐龙9000系列桌面处理器的PBO功能可以提升处理器的工作频率,带来最多15%的性能提升,这与英特尔处理器的睿频加速功能类似。AMD指出,如果处理器的默认TDP较低,开启PBO功能后能够获得的性能提升会更加明显。

Curve Shape允许用户对多个频率、温度状态下的处理器进行微调

除了传统的PBO更新外,AMD还带来了Curve Optimizer(曲线优化器) 的更新版本,并新加入了Curve Shaper(曲线塑造器)超频调整功能。Curve Shaper主要用于解决处理器在不同状态下的功耗、温度和频率等问题。

Curve Shaper允许用户基于处理器最低频率、低频率、中等频率、高频率和超高频率等5种频率、低中高3种不同状态的温度,设置15种频率与温度的组合工作模式,使得处理器在游戏或者日常轻载应用中尽可能多地降低频率、温度与功耗,也可以在高性能模式下通过更合理的电压达成尽可能高的频率。

由于Zen 5微架构的改进,整体IPC相对前一代产品的平均提升幅度达到了16%

基于以上改进,AMD表示Zen 5微架构的整体IPC(每周期指令数)相比前一代产品平均提升了16%,这为Zen 5处理器与英特尔第14代酷睿的竞争奠定了基础。与锐龙7000系列产品相同,基于AMD Zen 5架构的锐龙9000系列处理器首发同样包括6核心、8核心、12核心和16核心四款产品。

在规格上,旗舰产品锐龙9 9950X与锐龙9 7950X相比没有太大变化,依旧采用16核心、32线程设计,最高加速频率保持在5.7GHz。其二级和三级缓存总容量仍为80MB,即每核心1MB二级缓存,总计16MB二级缓存。

12核心、24线程的锐龙9 9900X在规格上则与锐龙9 7900X非常相似,包括最高加速频率同为5.6GHz,总计76MB的二三级缓存容量。唯一的不同是处理器TDP大幅降低了50W,仅为120W。

8核心、16线程的锐龙7 9700X处理器仍采用Socket AM5封装,配备IHS散热顶盖

8核心、16线程的锐龙7 9700X将最高加速频率从锐龙7 7700X的5.4GHz提升到了5.5GHz,更高的加速频率意味着在单线程性能上会有更好的表现,这对于依赖单线程性能的应用(如某些游戏或轻量级应用程序)来说是一个好消息。TDP热设计功耗则从锐龙7 7700X的105W降低到了65W。更高的频率和更低的功耗凸显了Zen 5处理器在能耗比方面的显著提升。两款处理器的二三级缓存总容量保持不变,仍为40MB。

6核心、12线程配置的锐龙5 9600X处理器

至于定位最低的锐龙5 9600X,其最高加速频率提升了100MHz,从锐龙5 7600X的5.3GHz增加到5.4GHz,TDP热设计功耗则从锐龙5 7600X的105W降低到了65W。两款处理器的二三级缓存保持一致,均为总计38MB。

总的来说Zen5的新架构使得处理器能够以低功耗的释放更强的性能,体现出新架构优异的能效比。

AMD还根据产品的规格配置为其匹配了相应的竞争对手:锐龙5 9600X将迎战酷睿i5-14600K,锐龙7 9700X将对阵酷睿i7-14700K,锐龙9 9900X将主要竞争酷睿i9-14900K,而锐龙9 9950X目前则没有直接对手。

2-----部分测试软件成绩

而在经典的CINEBENCH R23处理器渲染测试中,锐龙7 9700X的单核心渲染性能小幅领先酷睿i7-14700K约1.1%,锐龙5 9600X的单核心渲染性能相对酷睿i5-14600K则有比较大的优势,领先幅度达到5.5%。

3DMark处理器测试一半使用SSSE3指令集,另一半则使用更高级的AVX2指令集,因为游戏在实际运行时通常会使用多种指令集,不可能对所有任务都使用单一指令集。CINEBENCH R23则考察处理器的实际图像渲染能力。两款Zen 5处理器在这些测试中表现出色,说明它们在真实应用中确实拥有更好的单线程性能。

从这些数据可以看出,酷睿i7-14700K在多线程性能上明显优于其他处理器,而锐龙7 9700X和锐龙5 9600X的性能则相对较低。这表明在多线程任务中,酷睿i7-14700K具有更好的性能表现。

Zen 5处理器获得完全胜利 游戏性能测试

而在由《孤岛惊魂6》、DOTA2、《赛博朋克2077:往日之影》等由网络游戏、热门3A大作组成的游戏测试中,两款Zen 5锐龙9000系处理器则取得了完胜,均战胜了各自对位的酷睿处理器。

其实对于这个结果我们并不意外,因为游戏非常依赖处理器的单线程性能,绝大部分游戏都不会调用处理器的所有计算线程,同时使用8个计算线程的游戏都不多,自然单线程性能更强的锐龙9000系列处理器就能拥有更好的表现。

特别是在《孤岛惊魂6》这款游戏中,几乎所有Zen 4处理器都会落败,但锐龙5 9600X和锐龙7 9700X完全改变了这一形势。它们的游戏平均运行帧率分别小幅领先于酷睿i7-14700K和酷睿i5-14600K,根本原因在于它们拥有更好的单线程性能。

即使在《赛博朋克2077:往日之影》中启用光追超速这样的最高画质设定,处理器的不同也能展现出明显的差距。两款酷睿处理器的平均帧数只能维持在98fps左右,而锐龙5 9600X和锐龙7 9700X的平均帧数都能突破102fps。

3-----拥有先进技术架构与工艺 更适合游戏玩家、普通用户

基于Zen 5架构的锐龙7 9700X和锐龙5 9600X是拥有先进技术架构与生产工艺、规格适中的产品。

它们在新一代处理器中表现出类拔萃的单核心和单线程性能,在网络游戏、3A大作以及大部分日常应用中都拥有更快的运行速度。对于以游戏应用为主、不需要进行多线程密集型计算的玩家而言,它们是最值得选购的处理器之一。此外,凭借对AVX-512指令集的完整支持,基于Zen 5架构的锐龙9000系列处理器在相关计算和应用中的表现更能碾压那些不支持该指令集的处理器。

如果没有高性能独立显卡但想体验AI应用,这两款处理器凭借对AVX-512指令集的支持,也能在Mistral 7B这类大型语言模型中提供较快的执行速度。其执行能力完全可以与那些核心数更多但不支持AVX-512的处理器媲美,使预算有限的用户也能体验到最新的AI技术。

更多游戏资讯请关注:电玩帮游戏资讯专区

电玩帮图文攻略 www.vgover.com