酷睿Ultra的高效能祕籍,英特爾Meteor Lake SOC模塊架構淺析

在英特爾Meteor Lake架構淺析中,我們已經大致瞭解了CPU的整體佈局,其中變化最大部分是UnCore中的SOC模塊構成了Meteor Lake四個重要模塊中的變化最大的部分。在Intel Tech Day 2023中,Meteor Lake SOC部分也被獨立出來做單獨解析。如果你只是對Meteor Lake希望有大致的瞭解,不妨移步筆者同時發佈的《英特爾Meteor Lake架構淺析:一場分離式模塊與3D封裝的勝利》分析文章進行了解,如果想要在此基礎上深挖一步,這篇文章興許可以幫到你。

再見,Ring

在佈局Meteor Lake SOC模塊時,英特爾基於性能和功耗提出了四個主要設計原則,分別是:

1、對密集型計算IP進行重新劃分,在不影響性能的前提下提升能效比;

2、對I/O進行擴展,爲所有IP提供對應系統內存所需要的足夠帶寬;

3、爲SOC引入一個低功耗LP E-Core;

4、重組電源管理算法。

在Meteor Lake之前,英特爾所有芯片設計、媒體編碼器位置都跟圖形IP捆綁,圖形IP則跟CPU計算核心捆綁,進而形成Core complex的構建模式。這意味着所有IP都必須經過Ring總線實現對稱佈局,才能實現效率最大化。

但Ring總線承包所有IP數據傳輸,就意味着無論調用哪個IP,都需要激活所有IP,包括Ring總線,Core complex、圖形和邏輯單元,從能耗的角度而言是非常大的浪費。

因此Meteor Lake首次將媒體部分和圖形拆分,從Ring結構中移除,放進單獨的SOC Tile中,不僅便於生產,有更好的經濟性,在實際使用的過程中也更爲省電。這時候如果執行不同的任務,只需要調用對應的模塊就可以了,其他部分可以不參與工作。

舉個最實際的例子,如果只用來播放視頻,那麼實際上只有顯示模塊和媒體編解碼模塊工作,其他IP處在關閉的狀態,進而實現類似於MacBook用視頻做續航宣傳的效果。

SOC模塊的重新佈局,同時也可以帶來帶寬的高效分配。以往的Ring總線方式在高載荷下會出現帶寬瓶頸,進而造成數據阻塞。這時候就要給IP設定優先級,指定不同的策略應對各種可能出現的應用場景。

但Meteor Lake使用了全新的SOC帶寬擴展方式,使得所有IP的帶寬分配是實時匹配的,消除了IP與IP之間,IP與Ring總線之間,IP與I/O之間的溝通瓶頸。不僅如此,英特爾還添加了一個I/O的緩存模塊來管理I/O量和地址轉換,確保執行次序可以被更好的進行。

但需要注意的是,IP的操作仍然需要計算單元的控制和協調,如果爲了流媒體播放而啓動Core部分的P-Core和E-Core,那就有本末倒置了。爲此,英特爾特意在SOC Tile中引入了一個超低能耗的效能核,稱爲LP E-Core。

LP E-Core能耗非常低,雖然工作頻率低於E-Core,但應對流媒體播放已經完全夠用。

不僅如此,英特爾還對Meteor Lake的UnCore部分的電源管理進行了重新設計,不同的Tile會有各自的電源管理單元,並由一個主電源管理單元控制,進而實現實時可擴展的電源管理架構,爲將來芯片設計電源管理奠定良好的基礎。

合理運用每一個核心

Meteor Lake的第一個改變,就是利用Foveros封裝技術縮短這4個Tile的距離,使其獲得更高的內部帶寬。同時SOC內部的IP由NOC總線進行連接。NOC總線特性是高帶寬、快響應,並允許掛靠在上面的所有IP快速、低功耗的訪問整個內存,包括Foveros封裝連接的計算Tile和圖形 Tile,也包括內部的E-Core、內存控制器、多媒體IP、NPU、IPU等等。

可以看到SOC Tile內部還擁有一個IO fabric總線用於連接I/O Tile,以及SOC內部的音頻、有線與無線連接網絡等IP,其中還包括2個安全模塊,分別是新增加的芯片級SSE,另外一個是用於提升可靠性的CSME。

可以看到,SOC Tile在收納各種IP的同時,實際上也承擔了一定程度基板的功能,實現了與計算Tile,圖形 Tile,IO Tile三個模塊的高速連接,由於彼此並非完全的堆疊關係,所以英特爾將其成爲2.5D和3D封裝的融合設計。

SOC Tile如何提升效能?

在技術分享會中,英特爾多次強調了Meteor Lake以及SOC Tile高效能、低功耗的特性,那麼他們是如何做到的呢?重點便在於每個Tile上都有專屬的電源管理模塊,並且相互之間都互相協同電源管理工作,包括上層炒作系統、軟件協同,從而實現系統級別的完整電源管理。

與此同時,Meteor Lake引入低功耗島(Low Power Island)的設計,它的特點是適用於輕型工作負載,調配計算Tile按需開啓,並集成低功耗人工智能引擎,以及IP的調配和擴展。如果工作負載需求不高,低功耗島就可以解決日常的工作問題,包括PC的睡眠、超低功耗模式等等,只有在負載提升之後,低功耗島纔會進一步調用其他IP和Tile,全速運行。

爲了實現這個設計,英特爾在硬件和軟件上都做了相關的能耗優化,包括DLVRs,電壓控制,內部總線動態調節,針對不同工作負載釋放性能等等。

三階混合架構計算

由於SOC Tile中包含了額外的LP E-Core,在實際計算中,包含了三階混合計算模式,即計算Tile中的P-Core和E-Core,以及SOC Tile中的LP E-Core,他們在能耗和性能上都會有不同的分配方式。

比如在運行較輕負載的時候,實際上可以讓LP E-Core執行,在確保系統性能和響應速度的同時,維持低功耗,只有工作負載超出LP E-Core的範圍,纔會將其分配給計算Tile中的E-Core和P-Core。

重點在於不同任務負載是如何在不同核心之間進行切換的,這裏就需要引入英特爾硬件線程調度器(Intel Thread Director,ITD)了。這裏的ITD介於CPU硬件和Windows系統的中間層,用來反饋P-Core、E-Core和LP E-Core的實時運算能力,爲系統調配提供一個推薦。

在這個過程中,以英特爾會對P-Core、E-Core和LP E-Core的每個時鐘可以執行多少指令能力進行分類,即我們常說的IPC。在下圖中可以看到英特爾將指令執行分成Class 3,Class 0,Class 1,Class 2上。

在每個時鐘內:

Class 0表示P-Core與E-Core執行指令數量基本一致;

Class 1表示P-Core執行指令大於E-Core;

Class 2表示P-Core執行指令遠大於E-Core;

Class 3表示E-Core執行指令大於P-Core。

根據圖片右側的反饋表格展示,每一縱列的EE代表能效表現分數,Perf代表性能表現分數,當分數最高,就代表英特爾硬件線程調度器IDT對系統進行的推薦,系統則可以通過EE分數和Perf分數在效能和效率之間進行抉擇。

重點在於,這個推薦是實時更新的,因此係統也擁有自己的主動選擇權,從而挖掘效能和場景應用中的更多可能性。

Meteor Lake上的ITD的改變就是額外考慮了LP E-Core的可能性。例如系統同時分配了4個線程工作,在P-Core負責完2個高載荷線程之後,另外2個低載荷線程會進而分配給E-Core,如果2個低載荷線程會長時間持續運行,則會被ITD建議進一步分配到LP E-Core中。

同樣,這樣的運行方式是可逆的。即使LP E-Core中如果正在運行2個低載荷程序,但很快獲得了高性能進程需求,那麼原本LP E-Core中的線程也會交還給E-Core乃至P-Core運行,Meteor Lake ITD在不同場景下展現出了核心調配的靈活性。

不僅如此,隨着NPU引入Meteor Lake,AI性能得到進一步加強,但不意味着Meteor Lake中只有NPU處理AI應用。事實上,圖形、CPU也會承當對應的AI性能加速,因此英特爾硬件線程調度器ITD在其中也要考慮到AI引擎特性和分配方式,從而幫助AI獲得更高效的運行表現。

基本上而言,英特爾硬件線程調度器遵循了高能效,與Windows高度匹配,軟硬件適配等諸多特點。也是Meteor Lake高效率執行的核心砝碼。

圖形與媒體模塊

最後來聊一下圖形GPU與媒體模塊。在Meteor Lake中,包括圖形GPU Tile的Xe LPG Graphics,而前面提到的多媒體引擎Xe Media Engine、Xe Display Engine分配在SOC Tile中,Display PHY顯示信號輸出分配在IO Tile中。

現在Meteor Lake最高能夠支持8K 60FPS 10bit HDR解碼和8K 30FPS 10bit HDR編碼,編碼格式包括VP9、AVC、HEVC和其他傳統格式,也包括最新的AV1編解碼。

SOC Tile中Xe Display Engine則進一步對顯示功耗做了優化,並對顯示全路徑壓縮,以提供最好的輸出方案和功耗控制。就制式而言,Meteor Lake現在能夠支持HDMI 2.1和DisplayPort 2.1以及完成的eDisplayPort 1.4輸出,分辨率最高支持到8K 60FPS HDR,或者外接4個4K 60FPS HDR,再或者更高刷新率的1080p、1440p視頻輸出。

圖形Tile的Xe LPG Graphics在幾個性能關鍵點上都有2倍的性能提升,包括提升了圖形Tile的主頻,使用更低電壓,互聯緩存進行優化。Meteor Lake上的圖形Tile現在擁有8個GPU核心,有128個Vector Engines,可以提供相較之翻倍的幾何圖形渲染管線,以及更高的Pixel和Samplers能力,並增加了8個硬件光線追蹤單元。

從特性上來看,Meteor Lake的Xe LPG Graphics具備了英特爾獨立GPU的一些特性,包括對DirectX 12 Ultimate的優化,光線追蹤性能加強,雙倍率HiZ,異步拷貝等獨立顯卡特性,並增加了亂序採樣功能,進一步增加準確率。

新的核顯光線追蹤能在遊戲、生產力、科學研究擁有不錯的表現,以Blender爲例,可以獲得相對CPU兩倍以上的性能提升。

另一個較大變化則是Meteor Lake帶來了全新的Wi-Fi 7支持,帶來了更高的數據吞吐率和多路併發性能,並且支持藍牙5.4規範,並支持最新的藍牙LE Audio傳輸。英特爾表示已經和微軟展開合作,引入新的音頻編碼規範,並結合到BTLE中,可進一步降低功耗、延遲,並提升音頻品質,並對已經市售的BTLE Audio產品提供很好的支持。

英特爾連接管理軟件ICPS則在Meteor Lake上已經升級到了3.0版本,將進一步在無線設備和有線網絡連接上做進一步提升,英特爾Unison多設備互聯軟件還將支持跨生態系統和跨設備種類,包括Windows、macOS、iOS、iPad OS等多個平臺。

Wi-Fi Sensing則是針對筆記本Wi-Fi和硬件新增的感知技術,用於判斷人員是否靠近,從而做出對應的系統判斷,比如喚醒、降低功耗等等。按照英特爾的說法,Meteor Lake會持續落地超過30項新技術,從傳感器、攝像頭到音頻都會不斷深化體驗。

寫在最後:筆記本升級蓄勢待發

從SOC Tile微架構設計可以明顯感覺到,Meteor Lake對省電和高效能是認真的,負責計算的Core部分如今只佔據整個Die面積不到1/3的面積,Meteor Lake從設計之初就是奔着加強移動PC體驗、延長續航、提升效能比的目標去的,不免讓人對即將到來的筆記本電腦在續航、效能、AI以及圖形上的體驗充滿期待。

相比起增強計算核心,Meteor Lake更注重主流趨勢功能的順暢體驗,也正因爲Meteor Lake與臺式機CPU設計需求不再完全重合,從而催生了14代酷睿與酷睿Ultra產品線並行的局面。無論如何,更好的iGPU圖形性能、以及對日常AI場景的優化,都足以讓酷睿Ultra成爲新一輪筆記本升級的賣點。

更多遊戲資訊請關註:電玩幫遊戲資訊專區

電玩幫圖文攻略 www.vgover.com