​【技術解讀】Zen5架構升級了什麼?AMD技術大佬手把手給你講明白

7月9日~7月10日,AMD在美國洛杉磯舉辦了AMD 2024 Tech Day技術溝通會,進一步公佈了Ryzen AI 300系列移動處理器、銳龍9000臺式機處理器以及Zen5架構、第三代Ryzen AI引擎、RDNA3.5架構的技術細節。而大家最關心的Zen5架構部分,更是由AMD首席技術官及執行副總裁Mark Papermaster以及AMD“架構之父”首席架構師Michael Clark進行了詳細的講解,我們受邀參加了這次會議,也爲大家帶回來了豐富的一手技術資料。

全面升級的Zen5架構帶來IPC的起飛

整體來說,Zen5架構的升級包括了四大方面。第一,每個週期可以處理更多的指令;第二,分發和執行帶寬得到了提升;第三,將緩存數據帶寬翻倍;第四,提供AI加速。

前端部分,在指令取/解碼的升級方面,Zen5架構帶來了雙管道獲取以及高級分支預測。分支預測擁有了更低的延遲、更高的準確度與吞吐量;指令緩存響應速度與帶寬都得到了提升;提供雙解碼管道。

執行部分,整數執行的升級主要包括了更寬的分發與執行,提供了8個單位寬度的獲取/退出,擁有6個ALU,包含3個乘法器,具備更多的統一架構ALU調度器和更大的執行窗口。

浮點/矢量計算單元的執行部分,Zen5架構提供了512位的AI數據通路,支持滿血512bit數據通路的AVX-512加速,擁有6流水線/雙週期延遲的浮點加法器,可以發送更大數量的浮點運算指令。

載入和存儲部分,Zen5架構提升了數據帶寬。它擁有48KB的12路一級數據緩存,提供4週期載入;一級緩存與浮點單元的最大帶寬得到了翻倍;提升了數據預取效率。

總而言之,就算普通玩家看不明白那麼多專業術語,光是從圖上也能看到Zen5對於處理器架構的各個部分都進行了升級,所有這些升級都是以提升IPC和執行效率爲目標,這也意味着就算頻率不變,Zen5的性能也會高出上代不少。

架構升級帶來IPC大幅提升

那麼經過四大方面的升級之後,Zen5架構相對Zen4有多大的IPC提升呢?AMD官方給出了對比的數據。從圖中可以看到,13項測試中,Zen5最低領先了10%,最高領先幅度達到35%,平均下來大約在16%左右。這13項測試包含了遊戲、視頻轉碼、網頁應用、3D渲染輸出和基準測試,覆蓋面也比較廣,比較有代表性。

而在數學計算加速單元方面,Zen5的提升更是巨大。和Zen4相比,Zen5單核機器學習性能暴增32%,單核AES-XTS計算也劇增35%之多。

當然,除了銳龍9000之外,採用Zen5架構的AMD處理器還有Ryzen AI 300系列移動處理器和第五代AMD EPYC服務器處理器(將在2024下半年上市),其中Ryzen AI 300系列移動處理器不但採用了Zen5架構,還內置了第三代Ryzen AI引擎的NPU,爲用戶提供了進入AI PC時代的全能解決方案。第五代AMD EYPC服務器處理器則最多可提供192核384線程,採用領先業界的4nm與3nm製程工藝打造。

RDNA 3.5架構再次拉高內置GPU性能天花板

除了Zen5架構,AMD這次也把GPU架構更新到了RDNA 3.5。

大家對於Zen4架構的銳龍7040/8040/8000G處理器內置的RDNA 3集顯肯定印象深刻,畢竟它在桌面平臺上的性能表現已經超越了GTX 1650獨顯。

而RDNA 3.5這次又在RDNA 3基礎上進行了三大提升。

第一,優化了每瓦性能,提高了執行很多常見圖形着色操作的能效比;

第二,優化了每位寬性能,減少了訪問顯存的操作,提升了能效比;

第三,針對更長的續航進行了設計,升級了GPU內置的高級電源管理,節約了激活狀態下的功耗。

很明顯,作爲移動處理器內置的GPU,RDNA 3.5將升級能效擺在了第一步是最合理的,如此一來不但可以大幅提升筆記本的續航能力,也能在有限散熱條件下發揮出更強大的性能。

具體到性能指標方面,RDNA 3.5相對上代提供了雙倍的材質採樣率,在最常見的材質採樣操作部分,現在可以在常見遊戲中提供雙倍的採樣速率。

同時,RDAN 3.5相對上代還提供了雙倍的插值率和比較率,因此在大多數插值率和比較率的富向量標準中,現在可以實現雙倍着色操作率。

此外,RDNA 3.5也優化了顯存管理,減少了顯存訪問量,採用了更好的壓縮技術,減少了工作負載,優化了LPDDR5內存訪問。

從量化的數據來看,在同爲15W TDP設定的情況下,代號Strix Point的Ryzen AI 300系列的3DMark TimeSpy得分高達3462,相對上代Hawk Point提升了32%之多,Night Raid得分也提升了19%。

由此可見未來搭載Ryzen AI 300處理器的輕薄本不管是遊戲性能還是續航都會得到極大的提升。

考慮到目前Windows掌機的處理器TDP最高可解鎖到33W,其TimeSpy得分也沒有達到3400分,而Ryzen AI 300處理器則可以15W TDP實現如此高的分數,這就意味着未來採用Ryzen AI 300處理器的掌機在續航和遊戲性能方面也都會有長足的進步。

最後簡單總結一下,首先,Zen5架構帶來了巨大的性能提升,而這個架構會全面應用到桌面、移動平臺和服務器上,從而開啓性能大升級的Zen5時代;

其次,代號Granite Ridge的銳龍9000會成爲桌面平臺的性能標杆,而代號Strix Point的Ryzen AI 300系列移動處理器則是高能效計算的標杆;

最後,RDNA 3.5着重優化了能效比,以至於在Ryzen AI 300中可以放下更多的CU單元,這也讓16個CU的Radeon 890M成爲集顯的新一代標杆,千元獨顯已經難望其項背。

寫在最後

細心的玩家可以發現,AMD Zen5這一代的架構升級是CPU+GPU+NPU全面升級,得益於架構和製造工藝的升級,採用Zen5架構的銳龍9000系列、Ryzen AI 300系列甚至是下半年上市的第五代EPYC都可以得到極大的性能提升。而對於今年最重頭的AI PC之星Ryzen AI 300系列來講,Zen5/Zen5C+RDNA 3.5+XDNA2架構的配置可以說是全面升級的代表了,集中如此多的先進架構爲Ryzen AI 300帶來了標杆級的性能與能效比,更是爲三位一體的全能AI加速提供了強大的引擎。那麼,這次AMD手裏有了那麼多王牌,今年下半年的核心硬件平臺必然會更加精彩。

更多遊戲資訊請關註:電玩幫遊戲資訊專區

電玩幫圖文攻略 www.vgover.com