遊戲性能無可匹敵!AMD Zen5 9000系處理器

經過漫長的等待,採用新一代Zen 5架構的AMD銳龍9000系列處理器終於上市。對於消費者而言,最關心的問題莫過於它是否值得購買。根據AMD在產品上市前的介紹,憑藉Zen 5新架構,銳龍9000系列處理器在多個處理器性能、應用性能以及遊戲性能測試中均展現出超越競爭對手英特爾第14代酷睿處理器的實力。

不過,銳龍9000系列處理器仍沿用了Zen 4架構的核心數量規格和工作邏輯,這意味着Zen 5架構依然採用全大核設計。相比之下,英特爾第14代酷睿處理器採用了Performance-core(性能核)加Efficient-core(能效核)的設計,並藉助硬件線程調度器進行任務調配。

在加入了數量衆多的E-core之後,英特爾處理器的理論核心數得以領先銳龍9000系列主流處理器很多,比如第14代酷睿i7處理器就比銳龍7系列產品多了12顆能效核。那麼在真實測試中,兩種架構邏輯(純大核和大核+衆多小核)的實際表現誰更優秀?讓我們繼續往下看。

1.大力提升單核心性能 -----Zen 5處理器架構

要想用更少的核心數量戰勝核心數量更多的處理器,關鍵在於提升每顆核心的性能。因此,AMD在介紹Zen 5微架構時明確表示,該架構旨在實現以下四大目標:一是每週期執行更多指令,二是整體寬度更寬,三是緩存數據帶寬翻倍,四是AI加速。爲此,AMD對Zen 5處理器架構進行了多項改進。由於《微型計算機》已在2024年8月刊中對Zen 5處理器架構進行了深度解析,這裏我們僅作簡要回顧和總結。

Zen 5架構改進的重點在於解碼器改爲2個4寬度的解碼器

首先是前端方面的改進。Zen 5 的主要改進之一是將解碼器從原來的單個 4 寬度解碼器改爲兩個 4 寬度的解碼器,從而在同一時間內實現了 8 寬度的解碼。自 Zen 架構推出以來,AMD 一直使用單個 4 寬度解碼器,這一設計貫穿了多代產品,包括 Zen 4 架構。在 Zen 5 中,這一設計終於得到了徹底改進,標誌着 AMD 在前端架構上的重大突破。

在 Zen 5 中,解碼器的設計變化不僅僅是簡單的數量增加,更重要的是解碼能力和效率的顯著提升。通過採用兩個 4 寬度解碼器,Zen 5 能夠在同一時間處理更多的指令,從而提高了指令處理的速度和吞吐量。這一改進使得 Zen 5 在處理複雜計算任務時更加高效,特別是在高性能計算和多線程應用中。

相應的分支預測能力也得到了大幅提升,包括更低的延遲、更高的準確性和更大的吞吐能力。分支預測一直是 CPU 性能的關鍵因素之一,其準確性直接影響了處理器的整體性能。Zen 5 在分支預測方面進行了多項優化,使得處理器能夠更準確地預測程序的執行路徑,從而減少了不必要的分支錯誤帶來的延遲。這些改進使得 Zen 5 在執行分支密集型任務時表現更加出色。

Zen 5處理器擁有更寬、更大的分派和執行窗口

指令緩存方面,由於解碼器的調整,現在也變得更加快速和寬廣。改進後的指令緩存能夠更快地存儲和檢索指令,從而提高了處理器的指令處理速度。這一改進不僅提升了緩存的命中率,還減少了因緩存缺失導致的延遲。這對於需要頻繁訪問指令的應用來說尤爲重要,能夠顯著提升整體性能。

總的來說,Zen 5 擁有一個更大的前端,隨之而來的是更多的優化和調整工作,特別是在分支預測等方面。這些改進不僅提升了前端的處理能力,還優化了整個處理器的性能。更大的前端使得 Zen 5 能夠更好地處理複雜的工作負載,特別是在多線程和高性能計算場景中。

此外,Zen 5 的前端改進還包括了多個方面的優化,如指令調度器、譯碼單元和指令緩衝區等。這些改進共同作用,使得 Zen 5 在處理大規模指令集時更加高效和靈活。特別是在多任務處理和複雜計算任務中,Zen 5 能夠更好地利用硬件資源,提升整體系統的響應速度和吞吐量。

前端的變化帶來了更多指令的湧入,因此Zen 5的整數執行部分變得更加寬廣。Zen 5的整數部分現在擁有8寬度的調度和退出系統,排序單元由之前的Zen 4架構中的4個小單元變爲2個大規模單元。整數執行部分包含6個ALU BR單元和3個ALU Mul乘法器,而前代Zen 4則僅有2個ALU、2個ALU BR單元以及3個AGU。從規模上看,Zen 5顯然更大,同時Zen 5還擴大了執行窗口。

Zen 5處理器擁有更寬、更大的分派和執行窗口

Zen 5架構通過採用48KB 12-way L1數據緩存,將每核心L1緩存總量提升至80KB,對比之下,Zen 4爲32KB 8-way設計,總量64KB。此外,Zen 5的L1緩存帶寬和浮點單元帶寬均翻倍,並增強了數據預取性能。

Zen 5處理器擁有完整的AVX-512支持能力

在浮點執行單元方面,AMD引入了一個強大的、支持AVX-512的512位SIMD單元,隊列深度爲384,並配備了6個2週期延遲的FADD單元,整體浮點指令執行能力得到了顯著提升。這一浮點能力的增強將顯著提升AMD在AI、遊戲計算以及部分科學計算方面的性能。相比之下,儘管Zen 4處理器也能執行AVX-512,但它是通過兩個256位SIMD單元合併實現的,而Zen 5則具備完整的AVX-512支持能力。

Zen 5桌面處理器的計算核心採用臺積電4nm工藝製造

生產工藝上,銳龍9000系列桌面處理器基於Zen 5架構,採用臺積電4nm工藝製造,CCD代號“Eldora”,含83.15億晶體管,面積70.6平方毫米,密度達1.18億晶體管/平方毫米,比Zen 4密度提高26.8%。其IOD芯片保持與Zen 4相同的TSMC N6工藝,面積122平方毫米,含34億晶體管,密度2790萬晶體管/平方毫米。

功能方面依舊是提供24條PCIe 5.0通道,讓用戶可同時使用一塊PCIe 5.0 x16顯卡,兩塊PCIe 5.0 x4 SSD,並擁有支持DDR5 5600雙通道內存,最高可支持DDR5 8000高速率內存的能力。

Zen 5桌面處理器仍採用了內置RDNA 2架構的顯示核心

此外,首批上市的銳龍9000系列處理器均內置了基於RDNA 2架構的顯示核心,這意味着即使沒有獨立顯卡,每一款Zen 5處理器也能正常使用。當然,內置顯示核心的規模不大,只有兩個CU計算單元和128個流處理器,但支持AV1硬件解碼,以及H.264和H.265的硬件解碼與編碼,並支持4K@60Hz顯示。這足以滿足一般的辦公與視頻應用需求。

相比普通Zen 4處理器,銳龍9000系列處理器增加了對USB4技術的支持,可提供最多兩個帶寬爲40Gbps的USB4接口,當然這需要用戶使用在主板上設計有USB4接口的600系主板或在預計今年9月上市的X870E、X870主板,才能享受到USB4技術。

開啓銳龍9000系列桌面處理器的PBO(精準性能提升)功能可以帶來最多15%的性能提升

在處理器超頻方面,除了不鎖倍頻等優勢外,AMD還優化了PBO(精準性能提升)技術。如果用戶的散熱配置非常出色,並且優先考慮性能,尤其是多線程性能,那麼開啓銳龍9000系列桌面處理器的PBO功能可以提升處理器的工作頻率,帶來最多15%的性能提升,這與英特爾處理器的睿頻加速功能類似。AMD指出,如果處理器的默認TDP較低,開啓PBO功能後能夠獲得的性能提升會更加明顯。

Curve Shape允許用戶對多個頻率、溫度狀態下的處理器進行微調

除了傳統的PBO更新外,AMD還帶來了Curve Optimizer(曲線優化器) 的更新版本,並新加入了Curve Shaper(曲線塑造器)超頻調整功能。Curve Shaper主要用於解決處理器在不同狀態下的功耗、溫度和頻率等問題。

Curve Shaper允許用戶基於處理器最低頻率、低頻率、中等頻率、高頻率和超高頻率等5種頻率、低中高3種不同狀態的溫度,設置15種頻率與溫度的組合工作模式,使得處理器在遊戲或者日常輕載應用中儘可能多地降低頻率、溫度與功耗,也可以在高性能模式下通過更合理的電壓達成儘可能高的頻率。

由於Zen 5微架構的改進,整體IPC相對前一代產品的平均提升幅度達到了16%

基於以上改進,AMD表示Zen 5微架構的整體IPC(每週期指令數)相比前一代產品平均提升了16%,這爲Zen 5處理器與英特爾第14代酷睿的競爭奠定了基礎。與銳龍7000系列產品相同,基於AMD Zen 5架構的銳龍9000系列處理器首發同樣包括6核心、8核心、12核心和16核心四款產品。

在規格上,旗艦產品銳龍9 9950X與銳龍9 7950X相比沒有太大變化,依舊採用16核心、32線程設計,最高加速頻率保持在5.7GHz。其二級和三級緩存總容量仍爲80MB,即每核心1MB二級緩存,總計16MB二級緩存。

12核心、24線程的銳龍9 9900X在規格上則與銳龍9 7900X非常相似,包括最高加速頻率同爲5.6GHz,總計76MB的二三級緩存容量。唯一的不同是處理器TDP大幅降低了50W,僅爲120W。

8核心、16線程的銳龍7 9700X處理器仍採用Socket AM5封裝,配備IHS散熱頂蓋

8核心、16線程的銳龍7 9700X將最高加速頻率從銳龍7 7700X的5.4GHz提升到了5.5GHz,更高的加速頻率意味着在單線程性能上會有更好的表現,這對於依賴單線程性能的應用(如某些遊戲或輕量級應用程序)來說是一個好消息。TDP熱設計功耗則從銳龍7 7700X的105W降低到了65W。更高的頻率和更低的功耗凸顯了Zen 5處理器在能耗比方面的顯著提升。兩款處理器的二三級緩存總容量保持不變,仍爲40MB。

6核心、12線程配置的銳龍5 9600X處理器

至於定位最低的銳龍5 9600X,其最高加速頻率提升了100MHz,從銳龍5 7600X的5.3GHz增加到5.4GHz,TDP熱設計功耗則從銳龍5 7600X的105W降低到了65W。兩款處理器的二三級緩存保持一致,均爲總計38MB。

總的來說Zen5的新架構使得處理器能夠以低功耗的釋放更強的性能,體現出新架構優異的能效比。

AMD還根據產品的規格配置爲其匹配了相應的競爭對手:銳龍5 9600X將迎戰酷睿i5-14600K,銳龍7 9700X將對陣酷睿i7-14700K,銳龍9 9900X將主要競爭酷睿i9-14900K,而銳龍9 9950X目前則沒有直接對手。

2-----部分測試軟件成績

而在經典的CINEBENCH R23處理器渲染測試中,銳龍7 9700X的單核心渲染性能小幅領先酷睿i7-14700K約1.1%,銳龍5 9600X的單核心渲染性能相對酷睿i5-14600K則有比較大的優勢,領先幅度達到5.5%。

3DMark處理器測試一半使用SSSE3指令集,另一半則使用更高級的AVX2指令集,因爲遊戲在實際運行時通常會使用多種指令集,不可能對所有任務都使用單一指令集。CINEBENCH R23則考察處理器的實際圖像渲染能力。兩款Zen 5處理器在這些測試中表現出色,說明它們在真實應用中確實擁有更好的單線程性能。

從這些數據可以看出,酷睿i7-14700K在多線程性能上明顯優於其他處理器,而銳龍7 9700X和銳龍5 9600X的性能則相對較低。這表明在多線程任務中,酷睿i7-14700K具有更好的性能表現。

Zen 5處理器獲得完全勝利 遊戲性能測試

而在由《孤島驚魂6》、DOTA2、《賽博朋克2077:往日之影》等由網絡遊戲、熱門3A大作組成的遊戲測試中,兩款Zen 5銳龍9000系處理器則取得了完勝,均戰勝了各自對位的酷睿處理器。

其實對於這個結果我們並不意外,因爲遊戲非常依賴處理器的單線程性能,絕大部分遊戲都不會調用處理器的所有計算線程,同時使用8個計算線程的遊戲都不多,自然單線程性能更強的銳龍9000系列處理器就能擁有更好的表現。

特別是在《孤島驚魂6》這款遊戲中,幾乎所有Zen 4處理器都會落敗,但銳龍5 9600X和銳龍7 9700X完全改變了這一形勢。它們的遊戲平均運行幀率分別小幅領先於酷睿i7-14700K和酷睿i5-14600K,根本原因在於它們擁有更好的單線程性能。

即使在《賽博朋克2077:往日之影》中啓用光追超速這樣的最高畫質設定,處理器的不同也能展現出明顯的差距。兩款酷睿處理器的平均幀數只能維持在98fps左右,而銳龍5 9600X和銳龍7 9700X的平均幀數都能突破102fps。

3-----擁有先進技術架構與工藝 更適合遊戲玩家、普通用戶

基於Zen 5架構的銳龍7 9700X和銳龍5 9600X是擁有先進技術架構與生產工藝、規格適中的產品。

它們在新一代處理器中表現出類拔萃的單核心和單線程性能,在網絡遊戲、3A大作以及大部分日常應用中都擁有更快的運行速度。對於以遊戲應用爲主、不需要進行多線程密集型計算的玩家而言,它們是最值得選購的處理器之一。此外,憑藉對AVX-512指令集的完整支持,基於Zen 5架構的銳龍9000系列處理器在相關計算和應用中的表現更能碾壓那些不支持該指令集的處理器。

如果沒有高性能獨立顯卡但想體驗AI應用,這兩款處理器憑藉對AVX-512指令集的支持,也能在Mistral 7B這類大型語言模型中提供較快的執行速度。其執行能力完全可以與那些核心數更多但不支持AVX-512的處理器媲美,使預算有限的用戶也能體驗到最新的AI技術。

更多遊戲資訊請關註:電玩幫遊戲資訊專區

電玩幫圖文攻略 www.vgover.com